首页
学习
活动
专区
工具
TVP
发布
您找到你想要的搜索结果了吗?
是的
没有找到

Instagram的Explore智能推荐系统

在这篇博客文章中,我们将分享 Explore 中的关键元素的详细概述,以及我们如何在 Instagram 上为人们提供个性化的内容。...个性化的帐户嵌入个性化排名内容 人们在 Instagram 上公开分享数十亿条高质量的媒体内容,这些内容对 Explore 都是合格的内容。...如何构建 Explore 在创建了便于实验、有效识别人们的兴趣并产生有效且相关的预测所需的关键构件之后,我们必须在生产中将这些系统结合在一起。...例如,如果我们认为一个人在 Explore 上保存一个帖子的重要性高于他喜欢的帖子,那么保存动作的权重应该更高。 我们还希望 Explore 成为一个人们可以发现新利益和现有利益之间的丰富平衡的地方。...我们的自定义工具和系统为我们提供了一个强大的基础,不断学习和迭代,这对于构建和扩展 Instagram Explore 是必不可少的。

2.5K31

推荐系统EE(exploit-explore)问题概述

推荐阅读时间:6min~8min 主题:推荐系统 EE问题简介 前期回归: 矩阵分解如何解决隐式反馈(预测用户行为) 矩阵分解之SVD和SVD++ 推荐系统中有一个经典的问题就是 EE (exploit-explore...推荐系统中的 EE 问题 将场景回到推荐系统上,推荐系统中也存在很多类似于 MAB 的问题,这些问题在推荐系统中叫做 EE(exploit-explore)问题,exploit 直译就是开采,利用已知的比较确定的用户的兴趣...,然后推荐与之相关的内容,explore 直译就是探索,除了推荐已知的用户感兴趣的内容,还需要不断探索用户其他兴趣,否则推荐出的结果来来回回都差不多。...Bandit 算法时,如果物品的质量良莠不齐,并且物品的数量较多,在曝光位置非常有限的情况下,优质资源想要尽快展示出来的可能性不高,因为这时候系统还无法对大多数物品还是不确定的态度,还需要做更多的探索(explore

6.2K40

Atari 游戏得分提升两个数量级:Uber AI 的新强化学习算法 Go-Explore

Go-Explore 甚至可以达到159级! 在 Pitfall 中,Go-Explore的平均得分超过 21,000,远超人类的平均表现,并且首次在已有算法上实现零得分的突破。...Go-Explore 可以从人工领域知识中受益,无需人工通关游戏作为演示。领域知识很小,很容易从像素中获得,这突出了 Go-Explore 利用最小先验知识的深刻能力。...然而,即使没有任何领域知识,Go-Explore 在蒙特祖玛中的得分也超过了 3.5 万分,远超现有技术三倍之多。 Go-Explore 与其他深度强化学习算法完全不同。...GO-explore ? Go-Explore算法的高度概括 而 Uber AI 提出的新算法 Go-Explore 将学习分为两个步骤:探索和强化。 阶段1:探索到解决为止。...Go-Explore 支持利用单元格表示中的领域知识。

47320
领券