开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >Facebook深度个性化推荐系统经验总结(阿里内部分享PPT))

Facebook深度个性化推荐系统经验总结(阿里内部分享PPT))

作者头像

Houye

发布于 2020-04-07 15:47:31

6560

发布于 2020-04-07 15:47:31

举报

文章被收录于专栏：图与推荐

深度推荐系统已经在很多互联网大厂得到了实际广泛的应用,在他们的实践过程中也有很多工程算法经验积累下来.Facebook的各位研究员将其深度个性化推荐系统的经验总结成了下面这篇文章<Deep Learning Recommendation Model for Personalization and Recommendation Systems>.

这篇文章对于一些刚刚开始接触推荐尤其是工业界推荐系统的人有非常好的启蒙作用.作者接触推荐几个月踩了很多坑,后来看了这篇文章才发现:前人已经将很多坑和经验进行了很好的总结.

Houye：工业界推荐系统必读论文：基于深度学习的推荐模型—DLRMzhuanlan.zhihu.com

我在仔细研读这篇文章之后也在阿里搜索推荐事业部的实习小组进行了分享,整个分享PPT如下.

最后是一个初学者的一些看法:

为什么DLRM不做大做深（NN部分结构只用2~3层）？
- 防止过拟合？本文没有用任何正则。但是从实验结果看，DLRM在Kaggle上是有轻微过拟合的。
- 在线预测时候有速度要求。Embedding部分可以提前训练好，预测部分要实时预测。所以交互预测部分不要做的太复杂。
对超大数据集的学习能力是否足够？
- 输入通常是高维稀疏的，看上去很复杂，实际携带的信息有限。所以小网络足够。
- 个人猜测。虽然前面的Embedding矩阵非常大，但是不同的行的EmbeddingVector可能大幅相似。例如，n个user的Embedding矩阵（n可能上亿），但是user的人群特性/偏好可能只有100种。所以，NN部分只要区分100种UserEmbedding并进行预测，不需要太强的能力。
关注问题还是模型？
- DLRM主要是利用特征信息。但是，在实际业务场景下，还有很多辅助信息（结构信息，时序信息，位置信息）。能充分利用辅助信息并针对业务场景优化的推荐模型也许会大幅超越DLRM。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2020-01-20，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自图神经网络与推荐系统微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.