【 SPA 大赛 】从点击率预估的视角看腾讯社交广告算法大赛

作者:汤斌

大赛简介

腾讯社交广告算法大赛以广告领域常见的转化率预估问题作为出题思路,从用户历史一个月的行为数据中采样竞赛数据,数据规模达几十GB。比赛题目足够诚意的同时,资金投入也显得诚意满满。比赛单奖金及奖品投入就近百万元人民币,一等奖奖金高达30万,指导老师的奖励也颇为丰厚。

笔者在腾讯主要从事广告与上下文画像,点击率预估相关的工作。在大多数人眼中,点击率预估与转化率预估除了优化目标上的不同,其他差异并不明显。两者的解题套路以及使用的工具也颇为相似。但事实真的是这样吗?我将从点击率预估的视角来谈谈我对此次竞赛题目——转化率预估的看法。

转化率预估与点击率预估的异同

点击率预估和转化率预估都是广告领域的典型问题,它们之间有很多的相似之处,例如都是典型的二分类,点击率预估的工具和方法也常常应用于转化率预估问题上,但是它们又有着各自的特点。

相同点

无论是点击率预估还是转化率预估,都是一个典型的二分类问题,可以描述成下面统一的形式:

除掉建模对象需要考虑的信息不尽相同外,两者解决的问题极为相似。因此,用于点击率预估的常用方法、手段和工具,也常常应用于转化率预估问题上。

不同点

虽然两者从问题的定义上看是一致的,也确实共用了不少算法、工具和方法论,但是两者面对的问题和挑战存在差异,从某些方面来说,转化率预估要做好比点击率预估更难。

转化率预估效果采集更困难

点击率预估预测的是用户的点击行为,用户的点击行为可以通过在广告位上埋点进行上报,由于用户点击数据影响流量主的收益,因此通常流量主会尽可能保证点击效果回流的质量和数量。而转化率预估的是用户跳转到广告主推广页面的转化行为,数据采集依赖于广告主的配合。即使在广告主配合的情况下,也存在转化数据链路的工程稳定性问题。

转化率预估在效果数据采集上的困难是广告系统采用CPA[1]计费的一个主要难点。转化数据采集的能力,是腾讯社交效果广告的一大优势,在APP类广告中这种优势体现得尤为突出。

此次比赛数据中,转化效果数据是否存在漏报、误报的情况,也需要选手们自己去探索。

转化预估效果回流时间更长

广告曝光后,用户的点击行为往往随之触发,除掉部分特殊广告位外,点击效果回流时间多在分钟级。而用户的转化行为则发生在广告点击之后,部分转化动作发生周期比较长,例如,电商的下单转化、APP的激活转化。从点击到发生转化,这个时间可能达到小时级,甚至天级,当然,对于不同商品类型的广告,转化回流时间差异也很大。

不同类型商品的转化效果差异大

点击率预估在不同广告位上的点击率差异往往比较大,而转化率预估在不同商品类型上的转化效果差异更加明显。拿电商和APP的转化数据来说,两者的转化指标差异能达数倍之多。因此,如何考虑不同商品类型广告间天然的转化bias差异也是转化率预估的一个难点。分商品类型来优化是一个常见思路。

不过此次赛题只涉及一种商品类型广告的转化率预估,使问题难度降低了不少,也可以让选手更专注于其中一种类型商品的转化分析。

转化预估的效果定义更加丰富

点击率预估的效果就是用户的点击行为,而转化率预估的用户转化行为的定义则多种多样。常见的包括,用户的下单行为、APP的激活转化、微信上微信公众号的关注行为,也有在社交广告上新兴的赞点评转化。

现在还比较少涉及多目标优化,此次赛题也只以用户的APP激活转化作为转化率预估的目标。

转化预估的数据更加稀疏

点击率预估的训练数据是用户的曝光、点击日志,数据规模极大,多数情况下不需要考虑样本充分度的问题。而转化率预估预测的是用户点击行为后的转化,训练数据的规模与点击日志的规模相当,数据量减少了几个数量级。因此,不少在点击率预估问题上行之有效的方法和特征,在转化率预估问题上可能需要重新审视,比如模型复杂的时候训练样本是否充分,是否需要调大正则化系数等等。

[1] CPA计费:按广告的实际转化效果扣费

总结

笔者从点击率预估的视角对腾讯社交广告大数据竞赛的赛题做了点评,主要对比了广告点击率预估与转化率预估的异同点,突出比较了两者的差异性。选手在采用常见的点击率预估方案来解决此次的转化率预估问题的过程中,也可以参考上面提到的两个问题间的差异,求同存异,设计更合适的解决方案。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能快报

美计算机社区联盟发布人工智能白皮书

美国计算机社区联盟(CCC)发布《人工智能的进步需要所有计算机科学的共同进步》白皮书,指出人工智能与更广泛的计算机科学之间相互影响的六大潜力领域的研发机遇,以支...

3255
来自专栏镁客网

避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

1430
来自专栏PPV课数据科学社区

【译文】如何开始你的商业分析生涯

每一次参与商业分析论坛或者和学生互动的时候,他们经常问这样两个典型而且被多次解释的问题: 我是一个本科生(或者别的学历),而我很希望能从事分析行业,而我应该怎么...

3458
来自专栏陈树义

5、商业需求文档(BRD)写作方法与技巧

 1、BRD文档的目的 -发现 发现产品改进的可能、一个创新产品 -需要 要权重、要项目、要资源 2、关于汇报对象 BRD也是一个产品,BRD的产品就是你和你的...

3516
来自专栏高端访谈

对话视觉中国创意社区总裁王钧:AI+云 释放创意潜力

“四年前,视觉中国创意社区开始意识到云计算的重要性。因为很多新入创意行业的人都可以自己独立完成全流程创作,也让个人供稿人(摄影师、插画师、字体设计师等专业的内容...

1424
来自专栏AI科技评论

干货 | 想成为真正的数据科学家,除了资历你还需要这4个技能

科技评论按:「数据科学家」可谓是从「大数据」和「机器学习」双双开始普及之后催生的热门职位之一了,许多接触或者学习了机器学习的学生和程序员都期待自己能够成为数据科...

3308
来自专栏点滴科技资讯

CB Insights:全球人工智能领域最具发展潜力100家创业企业(AI 100)

? CB Insights揭晓了全球人工智能领域100家(AI100)最具发展潜力的未上市企业,这100家企业将人工智能应用于各个行业,从健康医疗到无人驾驶...

39012
来自专栏大数据挖掘DT机器学习

面对数据工程师,你有7个问题可以问

运用数据进行管理不是什么新鲜事,但是大数据还是个新概念, 有相关的风险、挑战和机会。高级管理者需要具备一定的认识,以备他们的数据专家提出新观点时,自己有所准备...

3425
来自专栏腾讯大讲堂的专栏

腾讯优图,互联网趋势和场景驱动下的AI创新

引言:6.14日“腾讯创新日:科技年技术盛宴”代表腾讯各个事业群技术实力的四级专家、腾讯微创新2016年度创意获奖团队欢聚一堂,一起畅谈AI、系统安全、架构设计...

2763
来自专栏钱塘大数据

为什么说大数据是商业“利器”?

数据能根据我们已有的客户行为数据,判断客户的未来。告诉我们,每一个客户的消费倾向,他们想要什么,喜欢什么,每个人的需求有哪些区别,哪些又可以被集合到一起来进行分...

2656

扫码关注云+社区