前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据画像

数据画像

作者头像
机器思维研究院
发布2020-04-22 14:20:43
4.8K0
发布2020-04-22 14:20:43
举报
文章被收录于专栏:AI机器思维AI机器思维

作者Nature

出品AI机器思维

当前借助大数据技术,针对当前新冠肺炎疫情防控需要生成的健康码成为随身数字“通行证”,方便广大市民及进(返)各城市查询自身防疫相关健康状态的识别码,即便捷了防疫检查,也真正实现了大数据技术的价值应用,便捷服务市民。健康码的应用也让大数据更形象的普及推广,更深刻的理解了大数据的价值。

时代变迁,当前人类进入万物互联的智能时代,地球村的时代,交流频繁。数据价值应用凸显,实现数据的智慧化应用成为各行各业的利器。企业、产品、业务、人等都可以借助数据画像从而更深刻的理解企业经营情况、产品使用情况、业务经营情况、人的健康状况等,依靠数据决策,依靠数据提供的参考,更科学更智慧。

随身数字“通行证”健康码的数据收集是最关键的,打通各系统之间数据壁垒,实现数据互联互通,全面的数据才能更全面的反应人的健康情况。对于防范病毒而言,在没有疫苗的情况下,采取古老的隔离方式,人们不在流动,饿死病毒,阻断病毒传播链条成为当前科学防疫的策略。

随着疫情的基本阻断,根据健康码数据情况,对地区采取风险分级的应用成为复工复产,指导人们尽快走向正常的生活,既便捷了防疫又避免了防疫的复杂手续化,最大可能降低企业和人的经济损失成为当前大数据利用的价值发挥。

01

什么是健康码画像?

如果没有疫情,健康码这个标签名称不会这么火,健康码目前是方便人流通的随身数字“通行证”,利用收集到的移动数据、高铁数据、飞机数据、位置数据等对人防疫进行画像,根据医学观察条件,生成不同的健康码,如红色的健康码表示需要隔离观察,绿色的健康码可以自由通行等。

从另一个角度而言,人从出生就可以对其健康数据进行收集分析,生成人的身体健康指标码,从而提前预防疾病,避免未老先衰。一切皆可预防。

健康码画像让普通大众理解了数据,其实在实际的应用中还有很多针对特定场景的画像,如用户画像、产品画像、业务经营画像等,下面以用户画像为例讲解。

02

什么是用户画像?

用户画像可以理解成利用数据生成用户特征的标签,如根据用户的基本属性、消费购物、行为和交际圈等给予用户画像,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予其标签名称,给予用户打标签,同时基于一些人口统计学要素、场景等描述,形成一个用户画像原型。如下图的用户画像。

简单的来说用户画像等于自我介绍,比如:刘小名,33岁,巨蟹座,从事中医工作,购物达人,类型多偏技术和管理,喜欢甜食,但对海鲜过敏,目前还是单身狗一只等等。

通过这个用户画像,从而对这个人有了一个整体的认识,一个完整的人物画像已经呈现在了你的脑海里。当标签被描述得越多,用户画像就越清晰。

03

用户画像的意义

1)从企业层面而言,识别目标客户特征、测试客户潜在需求。用户画像可以帮助企业进行精准营销、市场洞察、预测市场需求,从而帮助企业高层决策,辅助制定阶段性目标,提升ROI;同时更有助于避免同质化,进行个性化精准营销。

2)从产品本身角度而言,用户画像可以帮助提升客户体验。围绕产品进行客群细分,确定产品的核心客群,从而有助于确定产品定位,优化产品的功能点。

3)从数据角度而言,用户画像有助于建立数据资产,挖掘数据的价值。使数据分析更为精确,甚至可以进行数据交易,促进数据互联互通的流通。

用户画像的基本要素包括:基本属性、动态属性、消费属性、行为属性和心理属性等。

基本属性是勾勒用户画像的基础:性别、年龄、学历、角色、收入、地域、婚姻等。

动态属性是指用户在移动互联网上的网络行为、消费偏好、娱乐偏好、社交习惯、出行方式以及获取知识的方式,这些都直接反应了用户对产品的内容是否感兴趣。

消费属性是指用户的消费倾向、消费区间、消费心理等,这反映的是用户对花钱有什么看法。到底是喜欢质量好的还是追求品质高的,是倾向于产品功能价值还是情感需求的价值。

心理属性是从用户潜在的心里需求分析,从生活、工作、情感、社交等方面所拥有的价值观。

04

构建用户画像的具体步骤

1.数据收集:对各系统数据进行梳理、采集,实现基础数据的互联互通,从而为用户画像做数据准备。数据的来源可能来自多个系统,各系统开始是隔离的,需要加工处理整合。如客户管理系CRM,或者有智能采集系统日志的工具,收集方式包括API、SDK和传感器采集等,根据数据分析与数据挖掘什么标签来反推需要的数据源。

2.数据清洗:数据清洗是对原始数据源存在“脏数据”如数据空缺和噪声、不一致、重复、错误等问题进行特殊化处理加工的过程,为了保证后期数据分析与数据挖掘的准确性,避免对决策造成影响,须对原始数据进行数据清洗预处理。

3.数据标准化:用户画像需要整合多源甚至跨系统的数据,如客户可能使用多个设备,拥有移动网络的多个账号,需要把同一个身份ID组合,建立统一的标准,才能完整标识实体的用户画像。

4.用户·建模:借助算法模型来定义客群的用户画像,如分类模型、聚类模型,常用的算法如朴素贝叶斯、决策树、SVM,神经网络,k-means等。

5.标签挖掘:利用云计算、大数据和人工智能技术,通过系统平台来进行标签的加工和计算,借助平台进行训练和学习,大规模的并行计算,挖掘用户标签。

6.标签验证:通过真实案例验证标签挖掘结果的正确性,保证标签对应的处理结果跟预期大体相符。即可以先用小样本数据验证模型的可靠性,再依照结果进行调整,再进行挖掘。

7.大数据可视化:借助大数据可视化技术,通过大屏实现视觉效果,呈现群体或个人的用户画像。

如下图对一个美食店的经营情况的用户画像,从而掌握了此店的经营情况,为未来发展提供决策依据。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI机器思维 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档