WWW 2020 内存压缩两个量级!中国科大与微软联合推出轻量高效推荐系统

随着深度学习的发展,推荐模型的计算和存储开销越来越大。在实际推荐场景中,物品数量巨大,复杂的推荐模型难以实现即时推荐。为此,实际推荐系统一般分为两个阶段:一个是搜索效率高的召回阶段,一个是推荐精度高的精排阶段。召回阶段利用近似搜索算法快速找出候选物品,精排阶段利用复杂模型对候选物品进行精准排序。

然而,近似搜索算法一般基于欧式距离,不同于复杂推荐算法常用的排序函数,比如內积、余弦相似度等,可能会导致推荐准确度受较大影响。此外,对推荐算法的分析发现,用户和物品的表示向量占据模型参数的很大部分,从而,对表示向量的压缩也能实现推荐模型的大幅压缩。

围绕这两个方面的问题,下面来介绍针对內积函数设计神经网络来实现轻量级的推荐系统。

0
分享到:
没有账号? 忘记密码?