前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据变现十日谈之六:用户画像

大数据变现十日谈之六:用户画像

作者头像
刀刀老高
发布2018-04-11 10:28:10
9150
发布2018-04-11 10:28:10
举报
文章被收录于专栏:奇点大数据奇点大数据

“用户画像”这个说法现在是在数据分析和数据挖掘领域是很流行的。

这个说法比较形象,它是指我们在数据库或数据仓库里使用用户信息的记录,对这些信息逐渐丰富以后完成对用户的描述。整个描述的过程就像给用户画像一样,因为我们平时在绘画中说的画肖像画一样,一笔一笔照着模特画,最后完成对模特样子的描述。

我们希望对用户做“画像”的目的也是比较明确的,就是我们希望通过某些手段对用户做甄别,把他们分成彼此相同或不同的人群或个体,进而区别化提供服务和进行观察分析——这通常是做用户画像的核心目的所在。

在数据库或者数据仓库里怎么对用户进行画像呢?我们最常用的办法是用标签来对用户进行画像——描述。

这些标签是从哪里来的?其实是从很多收集到的和用户相关的线索中来的。什么是线索?就是用户以它的身份标识所留下的各种行为的记录,这些记录基本是从各种各样的日志中来。

打标签这件事情在我们发明“用户画像”这个词之前就已经有了。

在我们的身边周围,有很多人其实性格鲜明,当大家提到他的名字时,大家脑海里很容易联想起一些形象,或者一些词汇。比如一说起医生,有的人脑海里就会浮现出“白衣天使”、“救死扶伤”这样的词汇;但是有的人脑海里就会浮现出“勒索钱财”、“态度恶劣”这样的词汇。同样的一个或一类对象在两个不同人看来可能是完全不同的标签内容,原因可能就是他们两个人平时关注的新闻热点不一样或者经历不一样。我们听到会计这个职业,就会想到“精细”、“准确”,听到拳击运动员就会联想到“强壮”、“矫健”。这个就是最初的“打标签”动作,和IT技术无关,就是根据自己的认知所留的印象而已。

关于利用用户画像,我们分三个小话题来讨论。

1、割裂型用户画像

我们前面谈论了用户画像怎么来做。在前面的场景里其实我们是割裂地进行用户画像——设想自己在一种“公平”,“无偏向”,“无目的”的环境中对用户进行描述,希望对用户的描述尽量做到根据客观观察到的情况做客观性的描述。这种画像就是割裂的用户画像。

这种画像的好处是计算相对比较简单,而且因为画像内容和未来的应用目的无关,所以画像的应用场景也会更加丰富。例如电信公司根据用户手机和电脑做的画像的例子来说,这样的画像是要比同一个用户在某个垂直电商网站里的画像应用场景更广的(所谓垂直电商就是指只经营某一方面产品的窄范围电商,比如只经营母婴产品,只经营各种书籍,或者只经营数码产品等。而垂直电商的对面就是京东、淘宝这种综合性的电商了)。

2、紧密型用户画像

在一个购物网站通过购物记录的分析来给用户打标签画像是紧密的用户画像——这个“紧密”是相对前面“割裂”而言的。画像直接来自于营业中的行为,画像的结果也直接应用于营业内容。尤其是对于刚刚的提到的这种垂直型电商,它的画像紧密程度会更高。

3、到底“像不像”

“我的画像到底像不像?”这个问题是所有初试用户画像的技术人员都在心底想问的一个问题,而且是怎么想怎么觉得很心塞。我们可能都曾经历这样的纠结,就是做了画像之后,怀疑自己画得不够“像”。如果你还在纠结,那我就说说我的看法:

第一、“像不像”跟谁比

我们说像和不像是有个比较对象的。

真实在纸上画一个人的肖像,拿去和照片比,肉眼直观是能看出像不像的。在用户信息库里的用户画像我们也要有个对比的对象,问题是,这个对象我们能捕捉到吗?未必能。

我们能够收集到的用户相关信息实际是非常片面和有限的,即便我们可以购买到其他第三方的用户画像库和我们进行对比也不一定能比对出结果。因为收集的标签维度未必一致,维度一致内容不一致我也同样不能断言是我自己的库错误还是对比库错误。所以这种对比本身就可能是个没标准的比较。

这个结论可能让我们多少有点沮丧,不过没关系,这个事情可能没那么重要,我们往下看。

第二、信息反馈

信息反馈对于紧密型用户画像通常比较有效,因为反馈会很直接而且及时,针对性强。也就是说,我“画得不准”没关系,再观察再画就是了。

这种情况一般出现在系统“冷启动”的时候,用户画像库里没有任何可以参考的凭据——空空如也,标签打出来也是片面的。

在这种紧密型的用户画像系统中,通常我们会非常依赖信息反馈,因为我们画像本身也就是为了提高产能转化率。在电商网站上,用户画像就是为了最终的用户购物引导更为有效,而引导是不是有效验证周期是极短的,甚至一两天就能验证完毕——画得不准大不了过两天我再重新试着画一次。这种迭代的思想方式比那种憋很久只为画一个完美的用户画像还是好落地得多。

还记得原来我在做公开课的时候,曾经做过一个比喻。

德国二战时期下水的最大的战列舰是俾斯麦号战列舰,满载排水量5万吨左右,主炮口径381毫米,最大射程36.5千米。战舰安装了“FuMo 23”火控雷达,有效探测距离25千米,远不及其火炮的最大射程。人的肉眼在晴好的海面上最远也不过能看到30千米左右的地方有目标而已。如果想准确知道25~36.6千米这个距离上的目标有没有被炮火击中?那就只能出动其搭载的Ar196侦察机了。一轮齐射以后,侦察机报告射击偏差,重新调整射击角度。如此反复。这种战术在很多陆军战斗中的炮兵+侦察兵的配合中也屡试不爽。

这种方式就和我们刚才说的画一下试试看,画得不准大不了我再重新试着画一次试试看,因为我们的感知精度就是这么有限。

第三、0.1%已经很多了

有很多比较成功的用户画像系统,能够把转化率提高0.3%左右,或者低的话也能到0.1%——大概就是这种感觉:原来没有用用户画像系统配合的时候,广告推荐系统转化率大概是1%,使用了用户画像系统后,转化率变成了1.1%。听起来这个数字好像挺让人失望的——废了这么大力气才提高这么一点点。

不过别忘了市场整个的容积是很大的,2014年度,淘宝的全年成交额为1.172万亿元人民币,如果能够提高仅仅0.1%的销售额是多少呢,大约11.72亿人民币。

iiMedia Research(艾媒咨询)在2015年8月发布了《2014-2015年中国DSP行业发展研究报告》。报告显示,2015年中国网络广告市场规模将达到2123.4亿元。2123.4亿元人民币,提高0.1%也有2.1234亿元人民币,这也不是个小数字!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-05-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 奇点 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档