观点 | 运营商要变现必须从建模中发现数据的价值!

3月29日晚,傅一平博士在大数据百人会就《运营商大数据变现实践》分享了数据利用的心得与经验。

运营商拥有庞大且具有绝对话语权的数据资源、数据储备,关于对数据利用的心得与经验,傅一平先生围绕浙江移动的平台能力、数据管理、数据能力、标签能力、产品服务这5大内容深入浅出地做出描述。

此次沙龙录音内容以第一人称整理。

1、运营商的平台能力

数据变现我不能直接去谈商务模式,因为商务模式依赖于平台、数据和标签能力。运营商的平台能力分为五横一纵,从数据采集、数据处理、数据分析、数据访问到数据应用,还有管理平台,这是一个标准架构。互联网公司的可以与其作一定的映射。

大数据平台架构需要一定的技术组件,底层可以应用华为的BDI,中间的处理层可以应用hadoop,有商用的,也有开源的版本,大家可以看到里面有3个应用集群,中间使用的是MPP,MPP用来做一些日常报表,主要是融合、复杂以及交叉的分析,还可以采用ASTER的数据挖掘库,以提供一些现成挖掘的API,计算速度比较快,流处理的话可以使用的是IBM STREAM,海量数据处理方面很不错。

运营商如果想对外变现,它必须具备像阿里云一样方便驻户进驻的能力,它的平台能力应该是所见即可得的,来实现合作伙伴的入驻并实现全方位的开放。很多公司如果没有多驻户的开通能力,变现是不大可行的。

2、运营商的数据管理

数据管理每个公司都需要,这里提炼了对数据管理非常核心的几点,也是在实际中碰到的:

①二级互动,你的数据必须与源系统打通,源系统变动时,大数据平台所有相关的数据字典都应该变动,这能解决两张皮的问题。

②因为大数据平台组件很多,你的数据管理平台必须让所有的技术组件对你开放,就比如采用的华为BDI的产品,我就必须让他开放所有BDI的元数据接口,这样整个公司的数据管理体系才是一体的,否则你就断了条胳膊,你做的数据分析都无法贯通,这是大家在引入技术组件特别要注意的。

③数据建模,强调数据标准化和可视化,你所有的建模都应该是基于规范的,你所有表的命名都应该有自己的规则,这样整个公司所有大家看到的数据是一致的,所有的合作伙伴都能共享标准化的数据。

当然数据管理也是一种追求,你一个小公司搞一个元数据产品其实没有必要,假如公司做大了,你做数据管理成本会非常高,因此必须要通过系统化、透明化的方式来管理,不做的代价是数据知识没有积累和传承。

数据管理虽然做了很多规范,但所有的规范都应该纳入系统中,这样才能保证你所有的系统数据管理规范都能在系统中落地,不然靠人去推动,基本上你的数据管理系统是会失败的。

数据管理用后向模式去做不是性价比高的方式,你必须做成前向,在开发的过程中就应该把数据管理工作嵌入进去,数据管理跟每个开发、需求、测试人员息息相关,这是我多年数据管理中深刻的体会。

数据管理平台很难通用化,无论是通讯行业、金融行业,由于本身的垂直行业特点,你的数据管理平台必须符合你垂直行业特点,想单靠一套数据管理平台来做成每个行业是很难成功的,这是我观点。

而且数据管理平台非常强调运营,它需要这个平台不停地迭代,相对而言它对定制化的要求很高。

3、运营商的数据能力

运营商做数据变现,它的核心差异化的竞争优势就是数据的差异化能力,离开了差异化的能力,你说运营商去做变现和互联网公司竞争也不大现实,因为如果在人才、薪酬、机制、流程各个方面处于全面的落后,就需要利用我们差异化的能力去在市场上进行探索和竞争,这也是迫不得已。

运营商最核心的数据有八个方面通信、支出、社交、上网、身份、位置、时序、终端,当然还有外部数据,以前运营商是不太重视的,比如大众点评网数据、天猫品牌、京东商城、淘宝数据等,在对外变现的时候,你会发现爬取这类数据实际上对运营商非常重要。

现有技术可以通过通话数据把所有的社交关系认出来,父母、亲人、朋友所有的社交人脉路径都能找出来而且非常准;

另外运营商的通讯机制保障了你每次通话、上网所有的终端行为都会上传运营商网络,数据质量也很好,终端市场报告由运营商来出示非常有说服力,因为所有的数据都是活的也是及时的;

还有黄页数据,任何用户比如打一个电话是黄页数据的话,你就可以知道这个用户的需求,对于精准营销非常重要;

运营商的数据有四个特点:完整性、连续性、多维性、整合性。

完整性是指比如京东的数据、淘宝的数据实际上运营商都有,也许没有那么详细,但可以拥有任何一家的互联网公司的数据;

连续性是指我们每天生活在时空中,要么在线下要么在线上,运营商所有的数据都有,比如线下你所有的位置数据运营商有,线上你所有上网数据也有,基于线上线上再加用户属性,运营商可以完整连续的刻画;

多维性是指运营商拥有时间、空间和用户多种属性数据,相对可以实施降维打击,通过时空交叉验证可以把模型做的非常准;

整合性的意思是运营商拥有号码、IMEI、IDFA、COOKIE几乎所有的用户ID,所有ID信息整合在一起可以实现全数据的关联,这也是运营商的巨大优势。

至于大家非常关心的HTTPS,我不太在意,HTTPS现在呈扩大的趋势跟流量劫持有一定关系,主要还是因为互联网为了保证它自身利益,从数据的角度来讲,即使HTTP最后仅有20%可开采,对运营商也足够了来构建自己的用户画像了,况且现在很多数据还没有开采,应对HTTPS的重要程度远远低于运营商对自身数据采集解析的要求,没必要杞人忧天;

另外APP协议成千上万,HTTP整个流量占比也不超过30%吧,再者运营商有巨大的资源,完全可以利用资源去换取内容知情权,比如腾讯大小王卡,给你免费定向流量,用资源换取内容知情权,再通过全内容为你提供增值服务,这个套路很多公司都在做,而运营商则要做在当下。

如果搞过搜索、爬虫、自然语言看来这个天眼用户偏好检索系统就知道它想干什么,实际上百度做的就是通过输入关键词它能找到所有的信息,运营商能做的是我输入一个关键词它能找到所有相关的用户,因为百度是没有用户的,而运营商拥有所有的用户,比如我输入足球关键词,我可以把五千万用户对足球的偏好进行排序,大家可以想象未来运营商变现的空间有多大。

运营商虽然拥有数据,但我不能说就等于抱着金矿或原油,运营商的数据开采的代价非常大,运营商现在的数据以通讯数据为主,必须要“去电信化”才能在生态中生存,否则你数据直接去卖也卖不了几个钱,还有运营商卖原始数据实际上等同“杀鸡取卵”,安全上不可取也不可持续,运营商要变现必须从建模中发现数据的价值,这也是当下变现的软肋,因为现有的基础建模能力还很弱。

4、运营商的标签

运营商正在从传统通信画像向真正的客户画像转变,在事件标签中,我们可以把家人、亲戚、工作伙伴及行业通话信息串起来,我们有所有的线下事件、线上事件、专题事件。

用户社会画像看起来与运营商的数据没多大关系,但恰恰是基于运营商的数据可以做出来,包括职业、人生阶段甚至家庭等等,都能判断出来。而位置标签无论是常驻位置、工作位置、事件出行、移动轨迹,不管是连续还是静态的都是可以抓取以作用户分析。

当然有人会提这涉及到用户的隐私,我们所有的信息处理时是去隐私化的,主要是用来做特征分析,大家不用担心信息安全的问题,互联网公司其实一样,他拿着用户所有的交易信息来做特征分析,但绝不会把清单型数据透露给外面,这是运营商们秉承的原则。上网行为中,无论是APP的使用、网页访问、使用时间序列很有价值,以此可以判断用户的偏好,为用户更好的服务,这个互联网公司做的比较多,运营商正处在起步阶段。

5、运营商的产品体系

现有运营商的产品体系很丰富,有客流、选址、引客、APP、反欺诈和验真,同时提供大量标准化的产品,这类产品要创造效益,还有很长的路要走。

个人观点

大数据变现对运营商的挑战巨大,首先是速度。大家都知道做大数据十有八九是会失败的,你做了这么多产品、采集了这么多数据,有多少能用,有多少能真正成功,有多少客户愿意来买单很难说。

十个里面能成功一两个已经很好了,这个时候你的速度是很重要的,如果你开发一个应用要两个月甚至半年,那基本上没法跟上节奏。

另一个是渠道,运营商如果只有数据没有渠道也很难成功,不能脱离业务去做大数据。比如说我们现在有大数据交易平台,但是现在在大数据交易平台在个人隐私没有定论的前提下是很难做的。我们在做大数据变现的时候传统渠道不能用,必须要创造新的渠道,这样才能让大数据承载在上面,大数据才能成为渠道的放大器。

第三点是数据为王,运营商做任何产品是离不开数据的,如果做的产品与差异化的数据没有结合起来,十之八九就会失败。相对于互联网公司,你没有任何竞争力,唯一的核心竞争力就是数据。

最后是运营,运营只有持续的迭代才有可能成功,KPI也是一种信仰,运营商原来的机制、流程比较冗长,它的迭代速度还是比较慢的。

另外,运营商对外也是反辅主业的需要,因为运营商进入流量经营时代后,内容运营越加迫切,传统的标签体系根本无法支撑,在对外变现中,发现外部客户对于标签的要求是非常高的,这驱动了我们去完善自己的内容标签体系,同时,运营商通过大数据,也可以培养和挽留住一批人才,你必须给一些人一些出口,可能运营商对外短期内无法规模变现,但它也承担着更多的使命,你不去实践,永远不懂大数据到底是什么。

大家都在找大数据的商业模式,我觉得现在商业模式已经很多了,实际上真正赚钱的大数据变现模式只有两种,一种是金融风控,一种是广告。再找到第三种已经很难了。经过了一些尝试,发现无论是做报告还是洞察,实际上最大规模的变现就是金融和广告。

运营商更需要的是工匠精神,需要精益求精,在某一点上进行单点突破,而不要求泛,每一方面都做一点但每一点都没办法做透。因为无论你的数据模型能力,还是运营能力、产品能力,都存在非常大的欠缺,你不可能有精力做那么多,这就希望能创造一个生态,与各界合作共创大数据的未来,服务好客户,这也是我的期望。

分享嘉宾:浙江移动大数据中心——傅一平博士

转自:东湖大数据交易中心

原文发布于微信公众号 - 灯塔大数据(DTbigdata)

原文发表时间:2017-04-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏织云平台团队的专栏

【活动】腾讯运维总监带你探索 AIOps

51280
来自专栏云计算D1net

升级SaaS应用管理 积极拥抱“互联网+”

随着云计算、移动互联网和应用软件的成熟,SaaS作为一种即买即用的云服务模式已经逐步得到中小企业的认可。目前市场上已经有很多SaaS应用,如办公类应用、销售类应...

30840
来自专栏Java学习网

程序员应该做开源项目的 6 个原因

程序员应该做开源项目的 6 个原因 开源开发人员都是义务劳动者”的观点已经成为编程世界中的陈词滥调,即使是那些伟大的开源举措也无法驳倒这种风靡一时的心态。 但是...

259100
来自专栏人称T客

Salesforce 告诉你 SaaS 模式最大的十个误区

编者注:本文编译自salesforce.com 。在本文中,你可以学习到,蓬勃发展的 SaaS 市场中,顶级 SaaS 服务供应商 Salesforce 的成功...

28330
来自专栏芋道源码1024

闲话如何成为一个架构师

停了很久,继续上路。计划写一个系列,先预告:《如何成为架构师》,《如何做一名好开发》,《如何做系分》,《如何转型技术管理》。

17620
来自专栏人工智能的秘密

知识图谱技术已发展得相对成熟,未来的探索方向在哪

前段时间被沙特阿拉伯授予公民身份的人形机器人“索菲亚”,再一次颠覆了人们对人工智能技术的认知。“索菲亚”多次与人类交锋并公开发表言论的过程中,我们感受到了基本的...

61360
来自专栏about云

小白与大神存在哪些差距

看到很多about云会员,铁粉及QQ群成员,当然也包括一些转行成员,而且整个IT行业很多人可能都面临这个问题,感到困惑。比如没有大数据工作经验,没有人工智能工作...

9220
来自专栏人称T客

传统会计软件将死 云会计星火燎原成必然

在数年之前,云端会计软件的数量相当稀少,甚至很多人怀疑这些软件的出现只是昙花一现不会长久,但是事实证明,他们错了。今天,云端的会计和其他应用程序一样是百花齐放,...

55960
来自专栏Spark学习技巧

从架构理解价值-我的软件世界观

在浩大的软件世界里,作为一名普通程序员,显得十分渺小,甚至会感到迷茫。我们内心崇拜技术,却也对日新月异的技术抱有深深的恐惧。技术市场就像这喜怒不定的老天爷,今天...

7620
来自专栏架构师之路

架构师到底该不该写代码

周末InfoQ-StuQ直播,主持和听众提问的简版实录,快消时代,精简到1分钟可以读完(原文有10000字)。 提问:沈老师是从什么时候开始写文章的? 我从大学...

37880

扫码关注云+社区

领取腾讯云代金券