你忙着追热点了解世界,有人却在用阅读大数据了解你 |DT Labo Online

前不久,DT君请来了今日头条算数中心汽车数据的负责人朱凌(朱大哥),带小伙伴们探索了汽车和手机行业阅读大数据背后的商业应用场景。当我们每天用手机浏览、转发、收藏各类资讯时,会产生的海量阅读大数据,今日头条算数中心对这些数据背后的商业价值进行了挖掘。

资讯推荐引擎如何完成读者“标签化”和内容匹配?面对“自动驾驶”、“汽车召回”等热点话题,如何利用阅读大数据服务垂直行业?消费者购买行为与热度关键词的关联又如何?一起来看看朱大哥的分享。

你对吴亦凡的爱,都被我们贴上了“标签”

今日头条曾在2015年底为吴亦凡打造了一份数据报告,对他背后的商业价值进行了分析。除了挖掘出凡凡的粉丝画像,阅读大数据还能更具体地看出这部分粉丝青睐的奢侈品牌(如下图)。

最近因为freestyle,吴亦凡又大火了一把,为此我特意去头条指数查了查他的粉丝群的画像,发现其中18-23岁的女生最爱吴亦凡,而且喜欢他的人还会格外关注娱乐视频和游戏视频。

(图片来源:今日头条“算数·吴亦凡”系列报告)

这些基于当红偶像的数据分析,只是阅读数据在商业场景上较为基础的应用。今天我就来结合汽车和手机行业,和大家分享今日头条在阅读数据商业探索上的初步成果。

首先给大家介绍一下今日头条基于机器学习的个性化资讯推荐引擎,这也是它为什么能匹配文章特征、环境特征和用户特征,为用户推荐感兴趣的资讯。

(图片来源:今日头条算数中心)

当一篇文章进入头条之后,机器会为它打上各种各样的标签,比如科技、娱乐、社会、相应的关键词等。 每一个头条用户也会有很多标签,除了最基本的性别、年龄、地域,还有无数的兴趣关键词,机器将文章特征、用户特征、环境特征进行匹配,这样你就能在头条上看到自己感兴趣的资讯了。

用户使用时间越长,与机器的互动越频繁,推荐的内容就会更精准。潜在用户的兴趣标签也是通过这样的方式一步步被细化的。 一个长期看汽车资讯的用户,会具备一个很高的汽车标签权重值,但当过了一段时间,他看汽车资讯的频率小于看娱乐资讯的频率时,汽车标签权重值就会下降,同时娱乐资讯标签权重则会增多。

之后通过文章的分发和用户的反馈,就产生了我们用来做商业分析的两种数据类型:文章数据和用户数据。文章数据包括阅读量、分享量、评论量、收藏量、文章量、阅读时长、热门文章、热度趋势等。而用户数据则是指年龄分布、性别分布、地域分布、手机分布、兴趣类别、兴趣关键词等。

(图片来源:今日头条算数中心)

上图是阅读数据服务垂直行业的循环模式:资讯分发和用户互动会产生海量大数据,这些大数据用来训练模型,完善算法,使推荐的文章更精准。在此之外,我们用数据来进行分析,来服务垂直行业。今天要分享的垂直行业主要是汽车和手机。

自动驾驶这块“蛋糕”能做多大,消费者说了算

今年4月公布的《汽车产业中长期发展规划》 提出,到2025年,高度和完全自动驾驶汽车将开始进入市场。而根据麦肯锡预测,自动驾驶汽车到2025年可以产生2000至19000亿美元的产值。 但“蛋糕”能做多大,还是得看消费者买不买账,所以我们通过对阅读数据的挖掘和问卷调查,研究了自动驾驶的潜在消费者。

前段时间,李彦宏坐着自家的自动驾驶汽车上了五环,后来交警进行调查将话题又炒热了一下。在此之前,我们就发布过《自动驾驶潜在消费者报告》,这张图讲的是关于自动驾驶评论热度的迁移地图。

(图片来源:今日头条算数中心)

从图里看到,从评论的渗透率来看,中部地区对自动驾驶的讨论热度是不输于沿海城市的,尤其是在2016年,重庆成为了很大的亮点。可见自动驾驶已经成为了全民热议的话题。

(图片来源:今日头条算数中心)

这张图是我们结合大数据和传统问卷调查,对自动驾驶关注热度与潜在购买倾向进行的研究。有趣的一点是,自动驾驶企业关注热度与消费者购买决策不是完全相符的。新型车企和科技公司关注度更高,更吸睛,例如特斯拉、谷歌、百度;而当涉及到真正购买自动驾驶汽车时,消费者会更信任传统汽车制造商,因为他们具有更加成熟的技术。

(图片来源:今日头条算数中心)

分析完自动驾驶,我们来看看90后消费群体对汽车的消费关注度。上面这张图来自今日头条和咨询公司罗兰贝格联合发布的《2017中国汽车消费关注度报告》。通过关键词的关注指数分析,我们发现,90后消费者在买车时对技术细节(例如动力,排量)的关注度低于其他年龄层消费者,但是在外观方面,90后更关注时尚感和个性化,同时要求内饰更加高科技。因此,为了迎合90后这群更注重“颜值”的消费者,我们会建议车企在新一代车型上更注重外观和内饰的设计,更强调动感,个性与感性。

注意力都碎片化了,不搞点内容营销怎么吸睛?

聊完消费者研究,我们再来看看另一个火爆的话题—内容营销。现在越来越多消费者更加依赖手机获取信息,大家的注意力也变得碎片化,这个时候如果没有优质的内容是很难吸引到读者的。内容营销既不容易引起消费者的排斥,又能在具体情境中加深品牌形象,那么什么样的内容在移动端更受欢迎呢?我们也针对这个问题对汽车资讯进行了一系列研究。

(图片来源:今日头条算数中心)

上图来自我们最近刚发布的《汽车内容趋势研究报告》。可以看出视频类资讯阅读量增长十分亮眼,2017年较去年同期,视频资讯阅读占比增长接近10倍,阅读量增长了约25倍,这也是由于视频类资讯具有消费门槛低、沉浸度高、互动性强等特点。

(图片来源:今日头条算数中心)

除了资讯类型,我们也对资讯本身内容类别进行了研究。我们从传播度(每篇文章被分享的比率)和文章占比(这类文章在阅读量最高的8000篇资讯中的占比)这两个角度来进行了分析。结果显示,汽车配件、驾驶技巧类的“用车类”的资讯是占比最高,且传播度最高的。同时我们也根据原创度、文章质量和传播度等对汽车自媒体进行排名,广告商可以通过排名来制定广告投放策略。

(图片来源:今日头条算数中心)

除了对资讯类型的研究,我们也对新型消费群体“95后”进行了独有兴趣关键词研究,发现他们对游戏类、动漫类资讯格外关注。那么想要迎合这群消费群体,二次元营销或许是可以尝试的方向。

从金立换机到OPPO的你,是看了“微微一笑很倾城”吗

接下来是关于用户换机的场景分析,用户换机可能是受到了某种外界资讯的刺激,为此我们将阅读大数据关联到用户换机这种消费行为,进行了一些研究。(这里判定换机的标准为: a.手机使用时间超过一个月;b.上一部手机至少使用3个月; c.两部手机重叠使用时间不超过3个月。)

(图片来源:今日头条算数中心)

从时间段来看,消费者在换机需求较高的暑期档,对于今日头条手机资讯类的文章收藏量有显著增高,当用户有换机需求,看到相关资讯就会收藏,作为购买指导。

(图片来源:今日头条算数中心)

我们还对换机用户的画像进行了研究,从图片可以看出,金立的忠诚用户(留存用户)比较关注的关键词是偏时政类的,比如蔡英文,反导系统等等。而从金立换机到oppo的用户年龄偏低,且女性消费者占比较高,关注更高的关键词则是“郑爽”、“微微一笑很倾城”、杨洋等。由此可以推断出该换机行为是与“微微一笑很倾城”赞助相关的代言营销型换机。

(图片来源:今日头条算数中心)

另一类换机行为是取决于功能需求。上图中小米手机流向vivo和OPPO的换机,就是受拍照功能影响而产生的。

高质高价的豪车,也因为“召回”又火了一把

开头提到吴亦凡粉丝研究,是基于头条指数动态反映品牌的热度,深度评估热点事件的影响。针对“汽车召回”这一热点事件,也可以分析出不同汽车品牌的影响力。

(图片来源:今日头条算数中心)

今年第一季度,大众共发布5次召回公告,召回车辆6.2万辆,加上不断发酵的“排放门”事件,使大众成为最受媒体和公众关注的召回品牌。在召回事件后,其他品牌的关注排名也发生了较大变化,媒体对日系品牌的关注较公众高,公众对欧系品牌的关注比媒体高,且公众更关注豪华品牌。

于公众而言,豪华车是“高质高价”的代名词,很少与“召回”联系在一起。然而,今年3月,豪华品牌(奥迪、奔驰、宝马等)因发动机、安全气囊等原因共召回汽车1741500辆,占到3月召回总量的6成以上,这种反差拉高了公众对豪华车召回的关注度。

编辑 | 赵楠

原文发布于微信公众号 - DT数据侠(DTdatahero)

原文发表时间:2017-07-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT技术大会

2018全球机器学习技术大会40位大神即将开讲!

​​​"Can Machine Think?" 1936年阿兰· 图灵提出「图灵机」以及机器具备「思维」的可能性。历经82年,以机器学习为代表的人工智能经过近几...

1686
来自专栏机器之心

观点 | MSRA副院长周明:未来5到10年是NLP的成熟期

机器之心原创 作者:虞喵喵 「接下来,NLP 将迎来 60 多年来发展最迅速的时期。」 6 月 1 日,在微软亚洲研究院(MSRA)的自然语言处理(NLP)主题...

38811
来自专栏大数据挖掘DT机器学习

面对数据工程师,你有7个问题可以问

运用数据进行管理不是什么新鲜事,但是大数据还是个新概念, 有相关的风险、挑战和机会。高级管理者需要具备一定的认识,以备他们的数据专家提出新观点时,自己有所准备...

3505
来自专栏AI科技评论

干货 | AI 时代不得不提的「恐怖谷」

随着AI时代的到来,越来越多的智能设备进入了我们的生活。它们在给我们带来更多功能和便利的同时,也被赋予了更多“人性化”的特征。面对这么多越来越“像人”、越来越“...

952
来自专栏数据猿

大数据让人疯狂,这家媒体为什么要用32万条数据做新闻?

<数据猿导读> 大数据已经渗透在各行各业,对于媒体来说,新闻不再只是采访、报道,最近就有一篇关于“铁路运行图大调整”的数据新闻火了,在自媒体平台上获得轰动。为什...

2776
来自专栏机器学习算法与Python学习

Andrew Y. Ng解读DL给我带来什么

近日,吴恩达接受了Strategy+Business的采访,由于Strategy+Business主要是一家关注公司的管理和经营策略的杂志,因此采访也主要偏向于...

3407
来自专栏AI科技评论

专访百度吴恩达:深度学习能给一个公司带来什么价值

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人峰会”(简称CCF-GAIR)。大会现场,谷歌,DeepMind,Uber,微软等巨头...

3286
来自专栏量子位

NYU心理学教授:深度学习狂热正把人工智能引入歧途

李杉 编译自 TechCrunch 量子位 报道 | 公众号 QbitAI 如今,只要访问科技网站,几乎不可能看不到跟深度学习有关的文章,似乎人工智能即将解决我...

2554
来自专栏AI科技评论

业界 | 英特尔中国研究院院长宋继强:融合 AI 与 SI 推进智能机器人产业

AI科技评论按:本文作者宋继强,英特尔中国研究院院长。 ? 宋继强 今天,我们正在拥抱一个万物智能互联的新世界。越来越多的物和设备通过网络实现互联互通,让数据呈...

3244
来自专栏钱塘大数据

【大数据误区】大数据是万能的?大数据=数据统计?

什么是大数据? 尽管“大数据”这个词直到最近才受到人们的高度关注,但早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就热情地将“大数据”称颂为 “第...

2906

扫码关注云+社区