破解YouTube、Facebook推荐系统背后的那些算法

我之前翻译过一篇文章《破解 YouTube 的视频推荐算法》,得到了很多人的好评,在各个算法、大数据公号上纷纷转载。最初看到这篇文章是@fengyoung 在Facebook上分享的,觉得题目很有意思就看了一遍,看完后感觉很有启发,遂决定翻译一下让更多人看到。

这篇文章内所指的算法包含多个YouTube增长类算法(为你推荐(Recommended),建议观看(Suggest),相关视频(Related),搜索(Search),原始评分(MetaScore),等等)。这些不同的算法产品,各有侧重,但有一个共同点,那就是它们的优化目标相同,都是观看时长(Watch Time)。

这篇文章给我的启发有三方面:

1. 从YouTube平台的算法设计人员角度,设计繁多的推荐算法,是为了提高频道的观看时长,而提高频道的观看时长又是为了让用户能够经常访问平台。这是一种双赢的思维,说白了:谁能帮平台留住用户,平台就重点扶持他。

2. 文章得出结论,要做垂直内容才能在YouTube上活下去。平台上内容越多样,平台越健康,这是毋庸置疑的,尽管我赞同这个结论,但是我没有在本文中看到作者是如何得到这个结论的。这一点就是YouTube和国内视频平台最大的差别,国内的视频平台严重趋同,花高价购买独家版权似乎是国内视频平台的唯一出路,也是一个妖魔化的出路。反观YouTube,他们利用算法驱使了各个频道专耕某一个垂直内容,然后把最适合的用户给你匹配上,这才是更宏大的一盘内容棋。

3. 本文作者给我们了一个启示,算法并不是黑盒子,是可以hack的,尽管这个也只能hack到冰山一角,但是也比我们盲目地运营要明亮很多了。作者的研究方式,首先是明确了一个平台的算法目标是什么,YouTube是watch time,那么就去观察这个目标和哪些指标有关,进一步看到每个指标又能怎么提高。

感兴趣的朋友可以搜索着看,我这里就不过多重复了。

关于Facebook的算法,我在《推荐系统36式》专栏里都有提到,你也可以看下图,总结了推荐系统背后的那些算法,都是需要你花时间去学习和实践的。

为什么会有《推荐系统36式》这个专栏?

最近十年尤其最近五年,借助推荐系统的技术和名头,异军突起的互联网产品越来越多,Youtube、淘宝、京东、Netflix、今日头条、Amazon等等这些产品都已经从个性化推荐中尝到了商业的甜头。甚至有人说在未来,推荐系统会成为所有数据型产品的标配。

然而推荐系统前方技术蓬勃发展,后方却落地困难。

审视推荐系统的技术应用现状,大厂们一骑绝尘,但太多中小厂的工程师们还不知道一个推荐系统如何从 0 到 1 诞生,需要去了解哪些知识。比如有人问我这些问题:

1. 我们产品这个阶段需要上线推荐系统吗?推荐系统前期投入大吗?

2. 推荐系统这事容易整吗?里面那些算法到底是怎么回事?

3. 搭建一个推荐系统,这里面有哪些坑?

4. 推荐架构、搜索引擎和广告系统之间应该如何协同?

5. 推荐系统相关的开源软件都有哪些?如何选型?

所以我就顺势写了一个推荐系统相关的专栏,希望能帮助推荐系统学习者架构起整体的知识脉络,并在此基础上补充实践案例与经验,力图解决你系统起步阶段 80% 的问题。

原文发布于微信公众号 - nginx(nginx-study)

原文发表时间:2018-09-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏理论坞

用户体验 · 知识体系汇总

作为一门新兴学科,在具体的设计操作过程中,用户体验设计吸取了多个学科的知识。除了第一章所讲述的面向人的学科和面向技术的学科之外,还包括面向设计的学科。

10520
来自专栏大数据文摘

关于数据分析,管理者的4个常规错误

15230
来自专栏AI科技评论

MSRA副院长周明博士:四大研究领域揭示自然语言技术的奥秘

AI 科技评论按:比尔·盖茨曾说过,「语言理解是人工智能皇冠上的明珠」,沈向洋博士也说过「懂语言者得天下」。自然语言理解处在认知智能最核心的地位。它的进步会引导...

33080
来自专栏腾讯技术工程官方号的专栏

腾讯俞栋:定义下一代智能人机交互,从目标、挑战到实现路径

语音识别及深度学习领域专家、腾讯AI Lab副主任及西雅图实验室负责人俞栋博士,在2018年腾讯全球合作伙伴大会上展示了腾讯AI正在推进的跨领域前沿研究:下一代...

18420
来自专栏CDA数据分析师

机器学习的商业应用

机器学习的商业应用就是把真实的场景,真实的商业应用的经验凝练成对每个数据分析师都有价值的功能,逐渐放到产品中。 本期精编版嘉宾演讲为IBM中国开发中心技术总监...

24150
来自专栏数据猿

利用大数据精准营销,给消费者一个选You的理由!

【数据猿导读】大数据是社会科学重要的进展,但企业要精准抓住未来,经理人要拥有更好的决断力,还是要基于对不同人、不同性的理解,而不仅是科技工具的使用而已。

10510
来自专栏机器之心

专访 | 入选福布斯榜单之后,俞舟和我们聊了聊「多模态对话系统」

机器之心原创 作者:彭君韬(Tony) 在网络视频对话里,一个有些腼腆的男生正面对着摄像头做一场网络工作面试的培训,摄像头的另一端则是一个模拟系统。这个系统观察...

39560
来自专栏智能算法

Google为何能在机器学习领域始终居霸主地位?

这不是武侠世界——她已经做到了。26岁的Holgate得到了第二条跆拳道黑带。这次是算法的黑带。Holgate花费数个星期沉浸于一个程序中,这次比肉搏更...

37890
来自专栏AI科技评论

详解Google第二代TPU,既能推理又能训练,性能霸道 | Google I/O 2017

AI科技评论消息,5月18日凌晨,Google CEO Sundar Pichai在I/O大会上正式公布了第二代TPU,又称Cloud TPU或TPU 2.0,...

36550
来自专栏AI科技评论

微软人工智能首席科学家邓力:口语对话系统的分类及三代演变

编者按:邓力博士原为加拿大滑铁卢大学教授,1999 年加入微软,2016 年起担任微软首席人工智能科学家,负责微软深度学习技术中心应用趋向的深度学习研究。 在上...

38270

扫码关注云+社区

领取腾讯云代金券