从亿万人中找到你!Lookalike算法教你用深度学习挖掘高相似度人群


新智元报道

编辑:克雷格

【新智元导读】调研发现,营销人员预计今年将有26%的营销预算浪费在错误的渠道或策略上,中国的人口结构的变化、传播渠道的变化让国内广告主捕捉消费者的难度大大增加,Lookalike等技术成为解决问题的新手段。

近三成的广告营销预算会被浪费。

最近,乐天营销(Rakuten Marketing)发布的一份全球广告营销报告显示,营销人员预计他们将有26%的营销预算浪费在错误的渠道或策略上,75%的营销人员会把广告支出从一个平台转移到另一个平台,以便取得更好的投放效果。

就中国市场而言,人口结构的变化带来消费升级,促进了消费者个性化和对品质的追求,传播媒介去中心化信息传递,在分散用户的注意力的同时也增加了广告主捕捉消费者的难度。

上述种种因素对AI时代的广告营销提出挑战。

26%的营销预算或被浪费,广告主精准捕捉80后消费主力人群难度增大

乐天营销的这份报告显示,到2021年,全球广告支出增长预计将达到7574.4亿美元。不过,2018年的营销支出浪费依然突出。

这份报告详细介绍了来自美国、英国、法国、德国和亚太地区的1000多位营销人员的意见,根据调查,营销人员估计他们将26%的营销预算浪费在错误的渠道或策略上。

尽管认为存在巨大浪费,但为了达到更好的营销效果,仍有75%的营销人员会把广告支出从一个平台转移到另一个平台,并且只有36%选择了更好的效果跟踪。

营销预算浪费的情况在亚太地区也普遍存在,而中国特殊的情况也让广告营销变得更加困难。

首先是人口结构的变化带来的消费变化。老龄化加速与10后消费崛起同时到来,让80后-90后成为前两者的主要买单群体,而这部分消费主力同时又追求个性化表达和品质消费,对广告的针对性及创意提出要求。

其次是传播媒介的变化。在移动互联网时代,媒体的传播形式已经从中心化的单向信息传递过渡到社交媒体的双向信息传递,现在在社群影响下,进入去中心化的社交媒体2.0时代。传播介质的变化要求广告营销更加注重社交化。

在营销预算浪费和消费结构变化的大背景下,广告主精确捕捉消费者的难度大大增加。

Lookalike技术:让客户量级的倍增的利器

Lookalike技术基于种子用户画像和社交关系链寻找相似的受众,即在大量用户群中选择一组特定的种子(即有转化行为的)受众,包括但不局限于点击、下载、安装、激活,然后根据实际需求,筛选、识别、拓展更多相似受众,进一步引发更大客户量级的倍增。

Lookalike技术具有3大优势:

  • 相比显式用户定向标签(如人口学,兴趣,行为等)需要大量广告主人工参与试错,隐式 Lookalike 几乎不需要广告主参与。部分平台只需要广告主上传具有特定目标(如曾经有过购买行为的)的种子用户的ID或设备ID。
  • 虽然目前广告系统都提供了丰富定向接口:人口学、LBS/地域、兴趣,行为,再营销等等,但是依然很难满足很多广告主的个性化需求。如果要为每个广告主定制化标签,不仅周期长、成本高,而且很难通用。Lookalike会对种子人群各个维度的特征(人口基础属性、社交属性、行为属性等)进行全方位分析。
  • 高潜力用户难寻、精准与规模之间难取平衡点是广告主所面临的两个主要难题,核心仍在于对大规模潜在用户的有效触及。效果和规模之间达成“帕累托最优”(最理想状态)显得相对棘手——随着流量数量的增大,人群的聚焦性也必然逐步降低,寻找目标人群的难度加大,致使非目标人群的比例也随着流量的增加而增加。而Lookalike技术通过大数据分析和复杂模型学习归纳高质量人群的人口特征,然后在更大的流量范围内找具有类似人口特征的人。

Lookalike技术成今年腾讯广告算法大赛主题,探索更多新算法和应用

腾讯社交广告早在 2013 年开始调研探索 Lookalike 技术,设计基于种子用户画像和关系链寻找相似人群,即根据种子人群的共有属性进行自动化扩展,以扩大潜在用户覆盖面,取得了不错的广告效果。

新智元统计发现,从2017年Q1开始,社交及其他广告收入同比增长率均保持在60%以上,而2018年Q1的增长率创下5个季度的最高水平(收入环比下降主要是因为第一季的淡季影响),这背后与Lookalike技术的应用密不可分。

虽然lookalike在广告行业中应用普遍,扩展效果总体上很好,但不同机器学习模型或不同的输入数据所带来的扩展结果依然有显著的差异。因此在商业应用的时就需要一个逐步探索扩展的过程,而不是一次性扩展大量人群。在广告投放上这种需求更加迫切,如果扩展人群数过多必然导致精准性差,反之则会影响广告的曝光展示量。如果能够结合扩展的效果动态的调整扩展人群数,则提供了一个很好的扩展节奏。

这也是腾讯广告算法大赛将Lookalike技术作为今年的主题的原因。

腾讯广告算法大赛主办方将提供相似人群拓展产品中的模拟真实商业环境的数据包作为比赛数据,遴选优秀的Lookalike算法和技术英才。为了收集更多、更好的创意算法,本届广告算法大赛扩大了参与范围,面向全社会开放报名,非腾讯及赛题相关的高等院校、科研单位、互联网企业等算法精英均可报名参赛。

同时,本届腾讯广告算法大赛还设置了价值丰厚的大奖,最高奖励30万奖金,复赛前20名可获得腾讯社交广告校园招聘免笔试绿色通道,开启腾讯职业之旅。

为了打造一个更轻松、专业的比赛环境,本次广告算法大赛增设独有的技术指导与交流环节,邀请首届获奖团队与本届参赛选手近距离交流,为选手们传授比赛心得和算法干货。

参考资料:

https://go.rakutenmarketing.com/hubfs/Demand/What%20Marketers%20Want%202018%20US.pdf?submissionGuid=bbc98aa9-ab9f-4ca4-be53-976f9243c19b

https://arxiv.org/pdf/1704.05194.pdf

https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652019246&idx=1&sn=0bf82a2ebeea3c4b7a70302b36fef7f9&chksm=f121eedfc65667c95dd3cf66a29d6189ee33cc0834874bf94de01cbcd61ca7ab899ea4e47204#rd

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-06-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据挖掘DT机器学习

梦想与前行——一名数据人的自白

前段时间看微博话题讨论有些迷茫,有些已经被同行确认无疑的观点竟被反复强调,比如”数据挖掘/分析要懂业务”、”产品是数据价值变现的一条有效渠道”,...

2655
来自专栏企鹅号快讯

人工智能拥有意识,仅是一个时间问题而已

从能干家务还能当秘书的“保姆机器人”到AlphaGo打败围棋世界冠军,人工智能机器人一次又一次的刷新着人类的三观,它们正在快速地发展,并且具备越来越高的智能。目...

2056
来自专栏CDA数据分析师

AI、机器学习和深度学习的未来

虽然尚处在开发和使用的早期阶段,AI、机器学习和深度学习已经影响了我们的生活,工作和娱乐。你是否已经准备好接受和利用这些颠覆性创新了呢? 美国的 Hanson ...

20210
来自专栏新智元

王海峰 Quora 十答:中国人工智能现状、NLP 技术发展预测

【新智元导读】百度副总裁王海峰博士受美国问答网站Quora邀请回答网友提问,回答了颇具代表性的十个问题,覆盖从中国人工智能的发展阶段到百度工程师的日常工作状态,...

3115
来自专栏大数据

采购中的高级分析方法

原文地址:https://dzone.com/articles/advanced-analytics-in-procurement

2529
来自专栏云计算D1net

云计算和成本:爱恨交织的关系

在企业高级管理人员的眼中,云计算通常被认为是一个给定数字化策略的基础。它通常与IT模式已知的前瞻性属性相关联,例如更大的灵活性和敏捷性,更快的上市时间,并成为业...

35211
来自专栏大数据挖掘DT机器学习

【电商】如何用商业思维分析用户行为数据

数据这么多,各类数据的表达不一样,具体应该如何处理?有人说:“产品初期,活动为辅,处理数据在于稳定。”有人说:“产品中期,活动为主,处理数据在于调控。...

2944
来自专栏大数据文摘

如何用商业思维分析用户行为数据

28113
来自专栏PPV课数据科学社区

数据分析师的经验分享

前段时间看微博话题讨论有些迷茫,有些已经被同行确认无疑的观点竟被反复强调,比如”数据挖掘/分析要懂业务”、”产品是数据价值变现的一条有效渠道”,观点没错,但听多...

3466
来自专栏数据猿

GrowingIO创始人张溪梦:企业不再增长,就在死亡

数据猿导读 GrowingIO创始人张溪梦在GrowingIO数据驱动大会上表示,“数据分析不是最重要的,帮助用户实现增长才是最重要的事情。做数据分析的公司有很...

3085

扫码关注云+社区