HCR(慧辰资讯)大数据产品部总监黄鸣:基于运营商“行业洞察”标签的传统企业掘金之路

<数据猿导读>

HCR大数据产品部总监黄鸣在2016年中国信息通信大数据上发表了以“基于运营商“行业洞察”标签的传统企业掘金之路”为主题的演讲。黄鸣提到,在5年前运营商大数据处于1.0阶段,现在进入运营商大数据的2.0阶段,从2.0到3.0进化过程中,可以通过满足传统企业大数据变现的需求

数据猿报道,2016年4月20-21日,2016中国信息大数据通信大数据大会在京召开。大会以“开放共享、转型创新”为主题,聚焦通信业大数据产业生态,邀请工信部、院士专家、三大运营商集团及省市大数据相关业务部门领导以及领先的大数据产业领军企业及应用单位代表出席,共同探讨通信业大数据发展带来的产业机遇和挑战。

本次大会主要针对前沿ICT技术与解决方案对运营商大数据能力建设的提升以及业务运营、架构的转型影响,通信业大数据的开放应用以及开放、共享、创新的产业生态等热点话题展开讨论,全景展现运营商大数据能力建设规划与开放应用策略。

本文由“135编辑器”提供技术支持

以下是数据猿现场独家直播“HCR(慧辰资讯)总监黄鸣”的发言实录:

黄鸣:简单介绍一下HCR公司,我们主要做三件事情:第一就是数据融合,我们把企业内部的各个系统打通,帮助企业在内外数据的一个融合。第二个就是我们融合完以后,帮助传统企业做数据分析和分析洞察,告诉他这些数据给他带来什么样的结果。

除了分析以后,我们还会做一些直接帮他做很多落地的应用。比如通过CM数据,找到很多规律性的东西,直接帮他去营销,我们会告诉你的CM计划、品牌计划、广告计划怎么做,针对不同用户怎么投放广告,在什么地方投放广告,怎么花预算。我们的大数据能力,我们有不同的子公司,比如负责舆情、文本挖掘的,负责内外部挖掘,负责CM的。

回到主题,大数据的变现,运营商是我们非常大的客户。中国移动90%的省份都是HCR的客户,我本人也是在运营商外、运营商内服务了十多年,我理解的,运营商大数据有几个阶段,第一个阶段是运营商大数据1.0阶段,在五年之前,大家还没有大数据概念的时候,运营商在做很多内部BI级的一些分析,做很多内部的精确营销,然后有一些零星的大数据的探索,这个阶段是内部的变现的探索,是一个大数据的萌芽阶段。

到现在应该是到了运营商大数据的2.0阶段,这个阶段就是三大运营商各个省都在建平台,都在做不同的业务,都在做内部的CM、BI、数据的整合,要去拿这个东西变现,因为传统业务已经开始有很大的萎缩,大数据是未来一个业务的突破点。这个阶段我认为是变现起飞的阶段。

考虑到未来发展,我们的观点是说,未来到3.0阶段,是深入行业化的一个大数据。现在运营商的大数据基本是揉到一块,来什么客户,给你提供什么东西。未来运营商的大数据应该有很多行业的伙伴和行业的一些应用,我们内外部融合以后,针对每个细分行业提供很多垂直到这个行业真正的一些很深入的大数据的服务。到那个阶段我认为是生态合作变现,真正扩张的一个阶段。

大家可以看到,这是2.0,现在大家在各种大会或者各种材料,各种运营商的推荐上可以看到主流大数据的应用,还有很多没有包括进来。几年前提出基于人流量的实时监测,人口疏解。北京十三五规划,各个区县都在疏解人口,把非首都的人口都往外迁,这是运营商很大的商机。还有就是上海踩踏事件,激发了政府和运营商一起做人流量安全预警,以及还有交通优化、商铺选址,都是人流量相关的大数据比较多。还有比较火的就是金融、征信、信息验证等等,营销也是比较多的。另外就是舆情大数据,还有洞察,洞察的分析报告这几块,这是运营商积极参与在里面的。

我们可以看到2.0已经是这样了,再往3.0做会有哪些变化呢?有这么几个方面的变化,第一就是数据融合。现在不管是哪家运营商,都没有所有的数据,谁也不会说我有全部的数据。BAT也好,移动也好,电信、联通也好,他们是大数据的土豪,但是他们都没有全部的数据。

从运营商来讲,电信、联通应该做的相对好的,全国各个省公司的数据整合,因为他数据量比较大一点,各省都是分省在建他的一些大数据平台。但是融合起来,数据量以及带宽都是很大的问题,未来无论是运营商还是传统企业还是互联网企业,现在都在做数据融合,一旦融合到一定阶段以后,就有上面的比如基于一个人,在各个领域都有足够的数据,你的标签就足够丰富和足够完整。再往上,比如我们会有新的算法,以及我们在更进一步的,更优化的计算能力,这些都会促使我们运营商的大数据有一个质的飞跃。

除了技术的保障以外,协作机制也是非常重要的。包括今天大会的主题谈的也是开放协作的问题,如何跟各个领域专业的公司合作伙伴一起去融合,这也是一个影响到大数据变现一个非常重要的因素。

最后一个,也是最重要的因素,所有前面说的这些东西,如果没有一个垂直行业应用的导向,那它的变现价值就会非常弱。一定是说你提供的标签算法以及推出的产品都是垂直到某一个领域里面,某一个行业里面,解决某一个客户某一个针对性的问题,这样大数据的产品就是非常有销量的。

接下来我重点说两块,一个是我们有一些经验可以分享的,比如标签的一些应用。第二个就是谈一下对这个论坛相关的一些,比如今天讲到的开放,如何开放?运营商的数据,我们从外部的合作伙伴来讲,如何希望运营商做一些开放和协作。

首先看一下,我们大部分的企业都是传统企业,传统企业指的是什么呢?就是非互联网企业。HCR主要的客户都是世界五百强的公司,世界五百强的公司他们大量的数据都是在自己的手上,没有在互联网上,不像互联网企业基本上都在网上,大家可以去爬取。他们有很多大数据的需求,他们需要做很多内部数据的融合。

比如我们给奥迪做,他内部有很多系统,区分在不同的部门,他要做一个大数据,他就必须要做一些融合,才有基础去做深一步的分析。第一个他就要做内部各个系统的打通,每个系统都是烟囱,怎么把它串起来,我们很多五百强企业都在干这个事情。极个别企业已经把这个事情做完了,他要获取外部数据,我要拿百度、腾讯、阿里的标签,把内部的用户标签打通,帮助获客拉新,谁是我的客户,他们在哪,怎么成为我的客户,如果有一款应用能够帮传统企业解决这个问题,基本上肯定会有很多人会买单。

运营商大数据从2.0到3.0进化过程中,如何满足传统企业大数据变现的需求呢?最重要的,你要去打造针对传统企业,符合他行业特征垂直的一些标签,真正能打动他的一些标签,才有上面的应用能够产生。

我讲一下标签的进化,传统的用户画像,很多公司都在做。比如开始要去做很多数据融合,做数据交换,有了数据融合以后,我们找一些真实的数据做数据建模,滚动的一些迭代,不同的算法,然后去优化这个模型,去做很多的交叉销售、广告各方面的应用,这是一个方面。

我们接触很多无论是互联网公司还是大数据公司,大家在做的最常用的,就是他买了什么东西,我就给他打上这个东西的标签,或者他做了什么行为,就打上这个行为的标签,这个都是他针对他行为或者针对他物的一个标签,没有看到我为什么要做个东西,他为什么会买这个东西,而不是买另外一个东西。我们通常的标签方式看不到这个,在我们看来,人的任何一个行为,其实都是他内在一个动机的反馈。如果一个土豪级的老板,他买的东西,他吃的,他用的,他去的地方和一个三四线的屌丝他所有的行为都会有本质性的差异,但有可能他们在某一个行为的节点上产生的一些标签是共同的。你就看不到,如果你只是用共同的标签简单去打物的标签,看不到这个人本身内在的动机不同,你就无法真正掌握到他这个人的动机以及他在消费时的一些偏好,到底为什么会产生这种消费。

在我们看来,比如绿色是很多在做的标签分类,比如看过宋仲基的片子,打一个宋仲基的标签,看过3C,打一个3C产品,还没有到物的层面,都是绿色层面的标签。再往后进化,他应该是一个物的标签,比如我买了一个3C的产品,他是一个笔记本,是一个游戏笔记本,它的价格可能是两万,我们去看这个物的标签是什么,我们传统的可能就看不到。但是你真正去看到这个物的标签可能就是一个很昂贵的游戏本,再去看这个人的标签,什么人会去买一个很昂贵的游戏笔记本?而且又是一个神州的牌子。

我曾经给京东做一个案子,我也很少打游戏,那个神州笔记本价格居然是两万,非常贵。但是他是一个神州的牌子,什么的人会买这样的牌子,我们要去分析,他带来的人的标签是什么,他是一个游戏的发烧友,极其看重游戏,不看重牌子,这个人消费3C产品的时候有什么偏好,我们就知道了,因为他买过这么贵的一个很小牌子的价格很高的游戏本,我们知道他买3C产品的时候偏好是什么,我可以打上3C消费的偏好,可以抓到他行为背后的动机。

我们在打标签的时候,就会把标签分成两个层面去做。首先我们会把这个物去打标签,不仅仅是你发生了什么行为,你买了什么东西,你买这个东西是什么,我要拿出来。这个东西具备什么样的特征,我要去看到,这个特征有什么标签,我都打上去。通过物和人,就可以把人的标签丰富起来。我们怎么做的呢?比如我们把3C笔记本,这是一个品类标签,很容易打上这个标签。

接下来我们看SKU的标签,SKU是仓储的一个指标,我们看到这个商品它的配置是什么,如果你一个人买了很多类似的产品,它的配置很接近,说明你对这些配置比较关注。我们就可以通过他这些配置去衍生出物的标签。

比如这个笔记本是16年2月份上市的,传统来讲,我们打一个标签,它是2月份上市的。2月份上市说明什么呢?说明它是一个新产品,有的人会买这个新产品,而且我们看到这个人买了这个笔记本,他还买了其他的,比如他买相机,买了一个U盘,都是最新上市的。我就知道这个人爱购买新潮的东西,这几个物的标签,SKU的标签可以转成物的标签,物的标签可以转成人的标签,可以看到3C这个垂直领域里面用户他的偏好是什么,给他细分出来。你再去做推荐的时候就很精准了,我就知道有一批用户他就喜欢新产品,京东下次要推新东西的时候,他就可以精准的去找到这些用户,而不是只是看前面品类的标签,就会有更多的丰富。我们从原来的SKU看到他背后为什么喜欢这样的东西,他的动机是什么。

HCR在这个方法论基础上,做了很多工作,我们通过移动互联网APP的行为,通过和运营商合作,通过和互联网公司合作,我们对这些数据做了大量的分析和整合。我们对主流的每一款APP都进行了一些标签的分析,这个APP代表什么?这个APP的SKU是什么级别?能带来什么样的物的标签,什么样的人的标签,什么样的行业的标签,我们都可以给用户去打上。

我们怎么做的呢?比如举个例子,有一个用户他去超市的时候会买一个价格特别贵的,比如四十块钱的鲜榨果汁,我们看这个人的消费记录,他买的比较贵,而且比较有牌子,有质量,有这个积累以后,我们就知道他这个人就是讲究品质,不关心价格,这个标签通过他购买物的标签,我们转化到人,就可以打上人更多的一些深度的东西。在标签的时候,他有一个权重问题,根据他购买的行为,他如果老买价格很高的东西,物的产品的累积,也会增加他在这个标签的权重。我们对物怎么理解呢?我们对移动互联网的APP都进行大量的梳理,比如应用宝上有20万的比较主流的APP,这些APP所有行为,运营商都可以看到。因为运营商要做很多大数据分析的时候,对DPI都要提取出来,看这个DPI是什么样的APP,然后打上相应的标签,这些工作我们都做好了,我们做了大量的APP的分析。基本上除了工具类和游戏类,我们其他的APP覆盖量达到99%。

我们怎么做的呢?比如我们分为浅层标签和深层标签,浅层标签,比如积分论坛,八成是IT男在看的,比如全国违章查询,这个就明显,是车主的特征,通过特征的发现,去打上标签。这个很多人已经在做了,还有一个深层标签,我们在做什么?比如口袋记账,这个记账号,我们去判断他用这个APP后面的性格特征和价值观特征。比如记账的APP是什么样的特性,在场的各位嘉宾谁装有记账的APP?只有一个,咱俩是同类人,我也装这个。

大部分人不记账,为什么会有人记账?因为他有理财的习惯,他对花钱有一个非常谨慎的习惯,他会把它记录下来。如果咱们花钱比较不关心,应该不会去记账,记账是为了把自己的消费记录下来,你要去分析我每个月各方面花了多少钱,有没有超支,未来我要去调整这个东西。用这个记账类的APP的人通常比较谨慎,比较理性消费。这位女士不知道是不是理性消费的主体,我花钱是比较谨慎的。食物相克手册,如果你用这类的APP,你很关注食品安全的问题,通过这样一个分析的方式,我们把大量的APP做很多理解,各位嘉宾觉得这个不一定全对,我们会给每个APP打上一个权重,如果你用了很多类似的APP,频率很高,权重很大,你在这方面的权重就高。

通过这样的方式,对APP进行理解,每个APP打上很多标签,通过行为权重、时间、频度,打到人的标签上,最后形成基础标签,行为偏好、性格、价值观,我们有很全的价值观的一个量表。只要你有APP的一些行为数据,我们快速计算出你是什么样价值观的人,你是什么性格的人。最后就是基于前面这几个标签,去生成垂直行业不同领域的一些特定化的标签。真正最后能卖钱,有价值的,能满足客户核心需求的是垂直行业的深度的一些标签。

讲这么多,如果是解决传统品类的标签,从物到物的,你只能知道他以前有什么行为,我就去给他预测类似的行为。但你不知道他产生这个行为内在原因是什么,但是我们的方法是说根据你物的标签,去看你的人真正长什么样,你的动机是什么,性格、价值观是什么,行为偏好是什么,有这样一个刻画以后,再去推荐或者再去做很多分析,做一些物的关联。

其实我们针对这样一个体系,我们已经有现有的产品,我们把这个能力开放,给国内一些客户做标签能力的输出。我们的标签跟DSP最大的不同,关注人本身的动机,性格、价值观,这个他们都没有提供。应用领域,比如营销、产品设计、用户洞察等等,有了标签以后,很多东西做的比较游刃有余了。

这是我们标签进化,接下来谈一谈对协作机制的看法,在运营商大数据这块,运营商这两年大数据已经是非常火的一个东西了,在运营商体系内,所有人要抓住这个东西。我们可以看到从外面来看运营商大数据,术业有专攻。

运营商传统来讲,他不是数据供应商,是一个通信信息服务的供应商,要把基础的通信数据做一些变现的转化。人流大数据,这个运营商已经做的比较成熟了,但是你往深做。曾经运营商准备负责人流大数据的平台建设,给旅游部门非常需要做景区景点人流量的监测,我们可以看到人流量的分布、走向等等,但是他更需要什么?需要你告诉他,这些人流量带来的价值是什么?怎么调整旅游未来的规划和策略?这个可以让熟悉旅游规划的专业人士来做,外面的公司做这个,从这个角度来讲,每个领域,比如金融、舆情等等,每个都有细分的行业,有一批的合作伙伴在做专业的事情。在这方面运营商可以做一定的开放,纳入整个生态里面,运营商有足够的能力主导这个生态,做很多的运营商大数据和垂直行业的知识、技术的结合。

还有客户资源,运营商把握的是一些大的客户或者跟他对口的信息服务,大量的长尾客户都在一些垂直的合作伙伴手上,客户资源也有很好的合作基础。比如很多五百强是我们的客户,我们可以帮助运营商去营销他的数据,打造一些产品,共同去做一些营销。

未来3.0的合作,希望是这样一个方式,首先大家是开放共赢的,在开放共赢基础上,我们要有一个很轻量化的合作成本。比如我们跟很多运营商接触的时候,我要买他一些数据,他没有现成的平台,没有现成的省份的数据,都要根据我的项目去定制化集成,一上来就几百万上千万,作为一个独立项目,很难覆盖这么大的成本。如果未来运营商把这些东西都能够融合打通,提供接口给到对外的一些合作伙伴,能够很快调用,就可以把这个成本做很好的节省,有专业化的公司帮助运营商把这个大数据推广到更多领域之中,未来这个市场可能就是几何级的,而不是运营商自己在做,未来是几何级的市场爆发。

我的分享大概就是这样,谢谢大家!

来源:数据猿(www.datayuan.cn)

原文发布于微信公众号 - 数据猿(datayuancn)

原文发表时间:2016-04-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

美国数据科学家:重视非结构化数据分析 走出两大“经典”误区

非结构化数据分析既不等同于舆情分析,也不等同于情感分析,它是一个数据驱动的将语义分析、人机互动、舆情分析三者结合的不断循环改进的良性过程。 虽然基本上国内...

46750
来自专栏灯塔大数据

大数据:大数据和数据可视化的重要性

什么是大数据?数据可视化如何帮助企业更好地利用数据资源?一些人知道大数据的真正含义,然而其他人声称自己懂大数据,只是为了让他们看起来并不低人一等。尽管大数据是...

380110
来自专栏企鹅号快讯

高通副总裁直击AI利弊,前景堪忧?

近日,高通Qualcomm执行副总裁Matt Grob在Gigaom 的独家播客专访中,针对人工智能的现状与未来发展趋势表达了自己的看法。 Matt Grob通...

23970
来自专栏PPV课数据科学社区

【观点】智能的过去和未来,谢耘演讲实录

在日前的中关村创业讲坛上,神州数码首席科学家谢耘对人工智能进行了主题演讲;在演讲时,谢耘分享了人工智能研究的几个阶段,并表示,随着让计算机运算的速度越算越快,I...

28060
来自专栏罗超频道

智能搜索时代:且看知识的力量

前几天,谷歌发布了一个全新的书籍搜索产品:“Talk to Books”,用户可以通过对话的方式得到一本书籍的推荐,比如输入:“What is thebest ...

13430
来自专栏ThoughtWorks

IoT时代的设计

设计为时代服务,两百年里我们所做的都是在为基于主宰地位的计算平台进行设计,它们分别是:早期的机械交互、命令行交互、近50年的PC端图形交互界面(GUI)、基于互...

49260
来自专栏新智元

【AI芯片争夺战】谷歌TPU率队,颠覆3350亿美元的半导体行业

【新智元导读】人工智能系统的加速正在从根本上重塑着每年创造了3350亿美元的半导体行业。计算机开始认识一切,从花草到人脸,从文本到声音,以及学会开车。统治了计算...

35890
来自专栏大数据文摘

2015年科技预测:深度学习和机器智能将席卷世界

16760
来自专栏PPV课数据科学社区

做数据分析时,你的方法论是什么?

这是一篇方法论。是的,很枯燥。 在知乎、woshipm、pmcaff、产品100等搜索了大量的数据分析相关的文章,发现没有多少适合自己的,因为内容太过碎片化,就...

29360
来自专栏大数据文摘

【强!】Ultrasonics:让你能触摸到虚拟世界里的东西

16840

扫码关注云+社区

领取腾讯云代金券