前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >独家 | Netflix因果推理应用调研

独家 | Netflix因果推理应用调研

作者头像
数据派THU
发布2022-06-24 18:16:52
4610
发布2022-06-24 18:16:52
举报
文章被收录于专栏:数据派THU数据派THU
代码语言:javascript
复制
作者:Netflix Technology Blog
翻译:陈之炎校对:zrx
本文约2500字,建议阅读5分钟在这篇博文中探究社区Netflix因果推理的广度。

标签:Netflix

Netflix旨在通过创造引人入胜的内容,帮助会员发现他们所热爱的游戏娱乐世界。其中的关键在于,需要充分理解产品升级与会员快乐指标相关联的因果效应。

此前,Netflix往往通过AB测试来衡量二者之间的因果效应。而当 AB测试产生局限性时,则可以通过准实验(quasi-experimentation)来解决这一问题。Netflix公司的许多科学家都对因果效应的分析方式做出了贡献。

近期,Netflix的科学家们聚在一起,举办了一次内部的因果推理和实验峰会,以此增进彼此间的相互交流与学习,并借机庆祝一下。为期一周的会议邀请了来自内容、产品和会员团队的演讲者,共同学习交流因果推理的开发和应用。与会者进行了广泛的议题交流,内容涵盖差分估计、双机器学习、贝叶斯AB测试以及推荐系统中的因果推理。

在这篇博文中,我选择了其中几个议题,与读者分享这次峰会的情况,探究社区Netflix因果推理的广度。希望通过进一步的深入交流或其它博文与读者建立联系!

本地化的影响得以加大

Yinghong Lan, Vinod Bakthavachalam, Lavanya Sharan, Marie Douriez, Bahar Azarnoush, Mason Kroll

Netflix公司热衷于为会员提供来自全球的动人故事,这为世界各地的人们所喜爱。目前对30多种语言和190个国家的媒体内容实现了本地化,通过字幕来定位会员最喜欢的内容。理解会员查看到的本地化异构增量值是工作的关键所在!

为了估计本地化的增量值,Netflix公司使用了历史数据的因果推理方法。运行大规模训练或随机实验在技术层面和操作上都富有挑战性,特别是当那些无需对内容进行本地化的会员来说,当访问他们喜欢的内容时,应对内容的本地化有所保留。

使用双机器学习来控制混杂因素,通过相似标题比对来估计本地化增量的影响。

分析了不同语言的数据,应用双机学习方法来适当地控制测量的混杂因素。不仅研究了本地化对查看标题的影响,而且还研究了本地化如何为会员的不同旅程增值。在稳健性检查方面,探索了通过多种模拟来评估增量估计的一致性和方差。这些见解在决定扩大本地化规模,取悦世界各地的会员中发挥了关键作用。

新冠肺炎蔓延影响下,许多与配音相关的制作工作室都关闭了,于是,因果推理方法在本地化方面的应用便出现了。为了理解配音延迟对观看的影响,采用了合成控制的方法模拟在没有延迟的情况下的观看、在游戏发行时(无配音时)和游戏发布后(重新添加配音时)的观看,并对其进行了比较。

为了控制混杂因素,使用了一个安慰剂试验,对不受配音延迟影响的标题进行了重复分析。通过这种方式,估计出延迟配音的可用性会对会员查看标题产生增量影响。如果配音制作室再次关闭,这些分析结果使得团队够更有信心做出明智的决定。

制作创新的支撑实验

Travis Brooks, Cassiano Coria, Greg Nettles, Molly Jackman, Claire Lackner

Netflix做了很多反向AB测试,向用户展示了无专业特征情况下的体验。通过测量新特征的长期影响或重新检查旧的假设,这大大改善了会员的用户体验。然而,当提出反向测试的话题时,在实验设计和/或工程成本方面往往非常复杂。

通过分享关于反向测试设计和执行的最佳实践,使得Netflix的反向测试更加明晰,以下方式在制作创新团队中广为使用:

1.用过去的示例来定义反向测试的类型及用例;

2.建议使得反向测试增值的机会;

3.列举反向测试所带来的挑战;

4.确定能够降低产品成本、工程团队部署成本和维护反向测试成本的未来投资。

反向测试在许多产品领域都有明确的价值,可以确认学习知识、了解长期影响、重新测试新会员的假设,并衡量累积价值。它们还可以作为一种简化后的产品测试方法,通过删除未使用的特征,创建一个更无缝的用户体验。在Netflix的许多领域,它们已经普遍用于多种应用。

概述反向测试如何工作,保留部分会员的长期经验,以获得产品改进的有价见解。

通过统一最佳实践和提供更简单的工具,可以加速学习过程,并为会员创造最佳的产品体验,来访问他们钟爱的内容。

因果排名:推荐模型的因果自适应框架

Jeong-Yoon Lee, Sudeep Das

大多数用于个性化搜索的机器学习算法,包括深度学习算法,都是纯粹的联想算法,它们从特征和结果之间的相关性中学习如何最好地预测一个目标。

在许多场景下,超越纯粹的联想性质,通过理解采取某种行动和由此产生的增量结果之间的因果机制,来做为决策的关键。因果推理提供了一种学习这种关系的方式,在与机器学习相结合时,成为了一种可大规模利用的强大工具。

与机器学习相比,因果推理允许建立一个健壮的框架来控制混杂因素,估计出会员的真实增量影响。

当前,Netflix的许多应用都是由推荐模型所驱动,比如在主页上看到的个性化内容,均受益于额外添加的算法,这些算法尽量使得每条推荐对会员尽可能有用,而不仅仅是识别出某人最有可能参与的标题或特征。在现有的系统之上添加新模型之后,可以帮助改进当前系统的建议,帮助会员找到现在想要流媒体的确切标题。

为此,Netflix创建了一个框架,在基础推荐系统之上应用了一个轻的、因果的自适应层,称为因果排名框架。该框架由几个组成部分组成:播放属性印象、真正的负面标签收集、因果估计、离线评估和模型服务。

使用可重用的组件以一种通用的方式构建这个框架,这样Netflix中任何感兴趣的团队都可以将这个框架用于他们的用例,从而在整个产品中改进提供的建议。

Bellmania:Netflix及其应用程序的增量账户生命周期估值

Reza Badri, Allen Tran

了解获取或保留订阅者的数值对于Netflix这样的订阅业务来说至关重要,虽然通常用客户使用寿命值(LTV)对会员进行评估,但对LTV的简单测量可能会夸大获取或保留会员的真实数值,因为潜在会员有可能在没有任何干预的情况下加入进来。

为此,Netflix建立了一种方法和必要的假设,利用基于增量LTV的因果解释来估计获取或保留订阅者的币值。这要求对Netflix在线LTV和线下Netflix LTV二者均进行评估。

为了克服Netflix公司会员数据缺乏问题,他们采用了一种基于马尔可夫链的方法,该方法从非用户的数据中再现线下Netflix公司的LTV。

通过马尔可夫链,可以估计出会员和非会员的增量值,从而捕获未来潜在连接的数值。

此外,演示了如何利用该方法(1)预测总用户数量,考虑可寻址市场约束和账户级动态,(2)估计价格变化对收入和订阅增长的影响,(3)提供最优政策,如价格折扣,将会员生命周期内的预期收入最大化。

因果关系的度量是Netflix数据科学文化的很大一部分内容,很自豪有这么多同事利用实验和准实验来驱动会员的印象。这次峰会是一个庆祝彼此工作的好方式,强调了利用因果方法创造出更多的商业价值。

期待在即将发布的帖子中与社区分享更多关于我们的工作。要了解最新工作情况,请关注Netflix科技博客,如果有兴趣的话,可以加入到Netflix,我们目前正在寻找新的优秀同事来协助娱乐世界!

原文标题:

A Survey of Causal Inference Applications at Netflix

原文链接:

https://netflixtechblog.medium.com/a-survey-of-causal-inference-applications-at-netflix-b62d25175e6f?source=user_profile

编辑:于腾凯

校对:林亦霖

译者简介

陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。业余时间喜爱翻译创作,翻译作品主要有:IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等,其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组,希望能和大家一起交流分享,共同进步

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

点击“阅读原文”拥抱组织

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-06-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 本地化的影响得以加大
  • 制作创新的支撑实验
  • 因果排名:推荐模型的因果自适应框架
  • Bellmania:Netflix及其应用程序的增量账户生命周期估值
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档