互联网产品如何建立用户画像?

文/黄成甲

过年时,闲来无聊,便想起年前和啊喔科技的的朋友聊到过“不写就出局”用户活跃度的话题,大家共同讲起了需要建立产品的用户画像。去年十月,雨花客厅程冲老师在产品课程上也讲过用户调研和分析方法。这两天想梳理出来所学所思:用户画像到底是什么?该如何创建用户画像?用户画像到底有什么作用?

用户画像介绍

用户画像是根据用户社会属性、生活习惯和消费行为等信息/数据而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”——用数据来描述人的行为和特征,而标签是通过对用户信息分析而来的高度简练的特征标识。用户画像可以用于辅助产品设计,评价需求是否有价值,避免产品偏离核心用户的需求。因为,产品经理为具体的人物做产品设计要远远优于为脑中虚构的东西做设计。

用户画像的关键技术点

1.IDMapping

ID-Mapping是大数据分析中非常基本但又关键的环节,ID-Mapping通俗的说就是把几份不同来源的数据,通过各种技术手段识别为同一个对象或主题,例如同一台设备(直接),同一个用户(间接),同一家企业(间接)等等,可以形象地理解为用户画像的“拼图”过程。一个用户的行为信息、属性数据是分散在很多不同的数据来源的,因此从单个数据来看,都相当于“盲人摸象”,看到的只是这个用户一个片面的画像,而ID-Mapping能把碎片化的数据全部串联起来,消除数据孤岛,提供一个用户的完整信息视图,同时让某一个领域的数据在另一个领域绽放出巨大的价值。ID-Mapping有非常多的用处,比如跨屏跟踪和跨设备跟踪,将一个用户的手机、PC、平板等设备的上的行为信息串联到一起。

2.打标签

用户标签是表达人的基本属性、行为倾向、兴趣偏好等某一个维度的数据标识,它是一种相关性很强的关键字,可以简洁的描述和分类人群。比如好人和坏人、90后80后,星座、白领等。具体流程一般是从纷乱复杂、琐碎的用户行为流(日志)中挖掘用户在一段时间内比较稳定的特征,即给用户打上标签。

举例来说,如果你经常购买一些纸尿裤,那么电商网站即可根据母婴购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有 1-4岁的孩子”这样更为具体的标签,而这些所有给你贴的标签组,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。

2.1标签建模

2.1.1属性标签

比如自然属性标签里的性别、年龄、星座等,社会属性里的职业、社交、出生地、电话号码等。

属性标签

这里不一定是基于事件行为的事实统计,需要一定的挖掘算法做预测,咱们以性别为例:

性别属于个人隐私,不是每个用户都愿意填写,而且出于保护自己或者其它目的,填了也不一定是真实的,此时你想给用户打上性别标签,就需要用到机器学习相关的算法了,而且需要对准确性和覆盖率负责。

属性分析

2.1.2事实标签

比如购买行为、位置包括常驻地出差地等、使用设备、社交属性等,这类一般都可以直接从日志中直接提取,加以简单的聚类算法辅助即可。

2.1.3营销标签

这里偏业务属性,往往带有明确的业务目标建模而成的,比如LTV用户价值、活跃度、忠诚度、兴趣爱好、白领、高奢、有房一族、购买偏好等。

2.1.4预测标签

比如前面提到的性别,其实在大部分场景下也属于一个预测标签,一般而言,需要一定的数据挖掘算法,集合用户日志提取APP特征、事件特征、浏览内容特征,对非结构化数据来说,通常要经历“分词”、“过滤”和“特征提取”三个步骤。另外一块是数据建模,选用合适的算法训练数据,比如到底是分类还是聚类,朴素贝叶斯,逻辑回归,SVM,神经网络哪一个合适?在模型的优化过程中,调参优化是非常重要的一步,在调参优化过程中我们通常会遇到过拟合,样本不均等情况,从整个业界来看,整体模型也差不太多,能拉开差距的基本还是对数据的理解和数据处理上,再举个例子:咱们要打个大学生标签,那么有哪些思路?基于 LBS 数据?APP 关联数据比如特殊APP/四六级、考研、超级课程表?

2.1.5技术方案

技术这块涉及到存储和计算,一般根据公司的业务体系来设计,存储有HDFS,HBASE,ES等等,计算有 HIVE、Storm、Kylin、Spark 等,标签的更新频率分场景:每日更新,每周、每月更新。

标签数据的验证也是个比较耗资源的事情:

查准率:一种是有事实标准的,譬如生理性别;无事实标准的,譬如用户的忠诚度,只能验证过程,具体效果需要通过线上业务A/B Test 进行验证

查全率:到底有多少用户覆盖到了,但这两个方面一般没有办法同时满足的。现实业务中无法追求100% 完备的标签体系。

2.2标签体系

不同的标签是对用户不同侧面的量化描述,而一系列的标签集合则构成了标签体系——用户画像。用户画像精准到人。用户画像用标签集合来表示。

例如:候某,男,39岁,浙江人,南京工作,IT业,产品经理,年收入50万,已婚,两套房,有孩子,喜欢社交,爱运动,喝啤酒,消费力强等。

画像里面的基础信息是通过注册信息获得,但像是否有孩子、喜欢社交、喝啤酒、消费能力等级等,用户不会告诉我们,需要建立数据模型才能计算出来。当然,用户标签的体系是需要根据业务领域去设计的,比如银行和电商用户标签体系就会不同。

标签体系的构建策略可以按扁平结构或层级结构来分比如下图两者都有体现:

标签体系

标签体系也叫群体画像,群体画像与个体画像两者都是对人的描述,但群体画像归纳的是人群所呈现出的共性,而非多样性特征。比如想得到跑步用户群体的画像,就需要用一定的方法寻找他们的共性,除了统计手段可实现外,更简单的办法是把这些个体的年龄\性别\职业\兴趣等标签作为数据挖掘聚类算法的输入,聚成较少的几类比如2类或3类,如果某个类别的用户所占比例较高,那么这个类别的群体特征就代表了整个群体的画像,画像标签可能是:男性\年龄25-35岁\IT白领\跑步、健身。在标签的构建手段上,不仅是数据挖掘,根据业务经验的判断往往更行之有效简单易行:业务经验结合大数据分析为主勾画的人群,此类画像由于跟业务紧密相关,更多的是通过业务人员提供的经验来描述用户偏好。

该如何建立用户画像 ?

为了将焦点关注在目标用户的动机和行为上,就需要建立用户画像,真实用户的虚拟代表。可以采用定性研究的方式通过五步建立用户画像。

Step 1:研究准备与数据收集

首先要确定被访用户类型、设计研究方案和调研提纲。首要问题是:我们要找谁进行调研。由于调研的目的是创建用户画像,所以,我们应该尽可能的调研最大范围的不同用户。通过与公司不同部门的同事进行脑暴找出可能的各种用户类型,我们可能会得到一个条件列表,或者一个如下的用户矩阵,然后就可以根据这些条件去邀约用户,每种类型调研3个。不过用户的选择应该灵活一点,如果我们在调研过程中发现遗漏了某种类型的用户,那么增加这种类型。

采用何种研究方式,需要你具备同理心,了解用户使用产品的模式、用户的目标与行为,体会用户的使用场景,以用户使用产品的目标和动机、过去/现在/未来的行为,而不是性别、年龄、地区等人口统计学特征作为区分用户类型的关键点。

Step 2:亲和图

亲和图(Affinity Diagram),把大量收集到的事实、意见或构思等定性资料,按其相近性进行归纳整理的一种方法。

  收集到的大量数据,如何在数据分析的过程中让多人参与,同时又不会遗漏掉数据,亲和图就非常合适,亲和图的优势在于让大量定性信息的分析过程可视化,便于大家协同工作和统一认识,同时,产出的亲和图可以方便地作为下阶段讨论的数据依据。

  首先用研工程师将收集到的关键信息做成卡片,然后邀请公司同事一起来参与亲和图的制作和讨论。参与亲和图制作的人最好参与了之前的数据收集过程,同时人数控制在3人以内。一张卡片上只写一条信息,内容包括人+目标/行为/遇到的问题。比如下面这个例子,C06 U01是对被访企业和用户的编号,方便我们查阅原始记录。为了方便记忆,也可以将企业名字直接写在卡片上。

  用例

在开始进行卡片整理之前,可以先凭借印象,假设几种用户类型和他们的特点,然后,在墙上将类似或相关的卡片贴在一起,然后对每组卡片进行描述,描述写在不同颜色的便利贴上。接下来继续进行更高层次的汇总,同时移动或重新组织,直到形成最终的亲和图。这里有一个经验可以分享,企业或个人的基本信息不用做成卡片,可以打印出来人手一份,在讨论和分组的时候作为参考即可。最后形成的亲和图如下:

亲和图

Step 3:用户画像框架

通过亲和图,可以确定了几种企业类型,以及企业中的个人用户类型。接下来可以将这些企业和个人的重要特征描述出来,形成用户画像的框架。在这个步骤,不需要加入描述性的细节,只需要将重点内容罗列出来;基本信息可以用范围来描述,比如员工数可以写成“20人以下”,具体人数可以在下一步用户画像中进行定义。

这个步骤的目的主要是在最终用户画像输出之前,可以迅速地和团队其他人进行讨论,并收集反馈。

用户画像框架

Step 4:优先级排列

接下来要做的,就是和产品、市场、以及各组leader一起来完成用户画像的优先级排序工作。确定用户画像优先级时,我们可以主要从以下几个方面来考虑:

(1) 使用频率

(2)市场大小

(3)收益的潜力

(4)竞争优势/策略等

Step 5:用户画像

最后一步,完善用户画像。我们需要做的事情主要是:

(1)结合真实的数据,选择典型特征加入到用户画像中

(2)加入描述性的元素和场景描述,让用户画像更加丰满和真实

(3)将用户画像框架中的范围和抽象的描述具体化,比如,将员工数“20人以下”改成“15人”

(4)让用户画像容易记忆,比如用名字、标志性语言、几条简单的关键特征描述,都可以减轻读者的记忆负担

用户画像到底有什么用,可以应用在哪些场景?

罗振宇在《时间的朋友》跨年演讲上举了这样一个例子:当一个坏商家掌握了你的购买数据,他就可以根据你平常购买商品的偏好来决定是给你发正品还是假货以提高利润。且不说是否存在这情况,但这也说明了利用用户画像可以做到“精准营销”。当然这是非常错误的用法。根据用户画像承载的业务目标,可以分为:

一是如何准确的了解现有用户。对现有用户进行精准营销。用于数据挖掘,构建智能推荐系统,利用管理规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布。用于效果评估,完善产品运营,提升服务质量等。 当然,应用最广泛当属个性化推荐,电商网站为准妈妈推荐婴儿用品,为摄影爱好者推荐镜头。个性化推荐中,计算出用户标签是其中一环。对于工具类产品可以做个性化Push,例如:不跑就出局向不同动机和行为的跑友推送不同的成就卡,根据跑友制定的三周跑步计划,推送包括每日跑步目标等一个系列的成就卡。

二是如何在茫茫人海中通过广告营销获取类似画像特征的新用户。比如在了解用户的基础上明确产品定位,“投其所好”;获取一个新用户/新订单;售前的精准营销、售中的个性化推荐匹配,以及售后的增值服务等。

结语

互联网进入下半场,用户运营时代取代了之前的流量时代,用于精准营销的前提:就是做好产品的用户画像,通过用户画像来辅佐产品设计及用户运营,通过定性、定量及大数据的技术方案建立好用户标签及分群的标签化体系,最终形成相应营销策略的触达,是我们维护老用户、拉新用户的重中之重。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

干货:数据可视化6步法

在当前互联网,各种数据可视化图表层出不穷,本文尝试对数据可视化的方法进行归纳,整理成6步法。 一般的数据图表都可以拆分成最基本的两类元素: 所描述的事物及这个事...

416120
来自专栏CSDN技术头条

数据可视化之美:经典案例与实践解析

本文来自作者在GitChat(ID:GitChat_Club)上的精彩分享,CSDN独家合作发布。 随着DT时代的到来,传统的统计图表很难对复杂数据进行直观地展...

40760
来自专栏专知

【干货】最全知识图谱综述#2: 构建技术与典型应用

【导读】知识图谱技术是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。我们专知的技术基石之一正是知识图谱-构建AI知识体系-...

95640
来自专栏PPV课数据科学社区

8个案例让数据不再撒谎

最近关于数据造假的评论很多,数据说谎的情况有两种,一种是出于某种目的,人为的将公示的数据注入一些水分;另一种“假”则是因为对业务不了解或经验的不足而在数据解读上...

31250
来自专栏AI科技评论

盘点 | 聊天机器人的发展状况与分类

AI科技评论按:本文作者王海良,呤呤英语开发总监,北京JavaScript/Node.js开发者社区的运营者,曾就职IBM创新中心。本文为系列文章第一篇,由AI...

63980
来自专栏新智元

深度学习驱动智能搜索引擎,RankBrain革了SEO的命

【新智元导读】想在谷歌或百度等搜索结果中排名靠前,除了广告(给钱),你还可以选择SEO(搜索引擎优化):让网站符合算法的规则,提升在搜索引擎内的自然排名。但去年...

41090
来自专栏大数据文摘

独家 | 机器学习先驱Michael Jordan清华演讲汉化视频+PPT:计算思维,推断思维与数据科学

27070
来自专栏钱塘大数据

【干货】手把手教你做出一份让人眼前一亮的数据分析图表

导读:所谓一图胜千言。设计严谨,制作精美的图表能使枯燥的数据变得直观形象、重点突出,更能迅速传达信息,具有说服力。因此,数据分析的结果往往要通过图表来传达。信息...

35140
来自专栏AI科技评论

详解谷歌AI五大安全机制论文,AI的开发到底有多少坑?

关心AI圈的人一定都知道,谷歌是一家在AI领域投入和应用非常广泛和庞大的科技公司,对于AI的研究也一直处于世界水平的前列。作为领域的领军公司之一,谷歌自然要扛起...

373150
来自专栏AI研习社

「唯物」“刷脸”没能进入消费领域,但“刷眼”也许可以

前一段时间,有司机冒充赵薇老公到公证处通过人脸识别技术办理了委托公证证明,以委托人的身份卖掉了赵薇家一处价值千万的豪宅。这条新闻不禁让人们对于人脸识别的准确性和...

36960

扫码关注云+社区

领取腾讯云代金券