何鸿凌:电信运营商数据资产及变现探讨

点击标题下「大数据文摘」可快捷关注

作者:何鸿凌,中国移动高级工程师

感谢何鸿凌的精彩分享,大数据文摘专注数据,旨在搭建专业的案例、资讯分享交流平台,期待更多的投稿、合作,欢迎给文摘后台留言,谢绝软文。

电信运营商在长期的内部精细化管理和精确营销服务的过程中积累了大量的数据资产,这些数据资产在大数据背景下具备外部变现的潜质。本文分析了这些数据资产的状况,并探讨了几种数据变现模式。

一、电信运营商数据资产情况及分析

资产是指由企业过去交易或事项形成的,由企业拥有或控制的,预期会给企业带来经济利益的资源。电信运营商的数据资产就是指那些在服务客户和进行内部管理的时候,由IT系统产生的数据,这些数据会或可能会给企业未来带来经济利益。

细数电信运营商的数据资产,大概可以分为如下几种:

第一部分是来自业务支撑系统的数据。它们最早被定义和识别出来,被应用得非常广泛。

这部分数据由CRM、计费、客服、渠道等IT系统在服务客户的过程中产生。例如用户资料、使用记录(话单)、费用记录(账单)、付费关系、客户咨询和投诉的语音和文字记录、电子渠道的交互信息(交易信息、JS插码、SDK数据等)。

产生这些数据原本的意图是提供更加好的客户服务、更加准确和灵活的计费等,但是大家都知道大数据最迷人的一点就是数据外部化的应用。在系统设计、数据设计的时候很难预期到后续数据到底会应用在什么方向。所以竭尽可能地收集数据吧。现在数据采集和存储的成本已经很低,而且还会越来越低了。比如翻页的数据,这个数据能说明用户是否仔细阅读了说明,以展示信息的吸引程度。

第二部分是网络系统产生的数据。即那些来自“管道”的数据。

它们是来自电路域(CS)和分组交换域(PS)中信令分析的结果。比如位置信令(包括15分钟左右的周期位置更新和呼叫过程中的位置切换信令)、开关机信令(在其中有开关机的地点,使用的终端等信息)、漫游信令。

值得重要提及的是来自PS域中的DPI信令。通过深度包分析,可以从网络层、传输层和应用层中的包提取相关信息。原本这个技术用于设计来分析数据包的状态,以提供更好的带宽和缩短时延,但现在更多用于其他的用途,这也是数据外部性的一个实例。现在电信运营商有很多数据变现都是围绕它产生的。

网络系统除了固化、宽带、2G\3G\4G以外,其实还有一个很重要的组成部分,那就是WIFI。我之前看到一个统计数据,固网宽带运营商的流量中,有70%是WIFI产生的。环顾四周,这也是很正常的情况,移动设备无处不在,通过电脑上网已经不是主流了。因此从WIFI中获取足够有价值的数据,这是一个很重要的补充。WIFI是相对传统电信网络来说比较简单或者说比较简陋的网络设备,因此从中获取信息反而比较容易。依靠WIFI的位置信息、终端信息和上网内容信息,我们已经可以看到一波围绕免费WIFI数据变现的公司正在蓬勃发展。

第三部分是来自电信运营商自有的互联网和移动互联网产品的数据。

这部分应该是大家都比较熟悉的数据资产吧。比如来自WEB和APP客户端的数据,一般通过JS插码或SDK的方式收集;来自后台的访问日志和交易记录、收藏、关注等信息;UGC数字内容等信息;监测数据等。

虽然相比正牌的互联网公司,电信运营商的互联网产品并不占据头牌。但是由于电信运营商拥有终端、管道和计费的优势,这部分也不容忽视。以中国移动为例,“和阅读”产品一个月的UV量在2.1亿、PV量在196亿的水平;“和视频”UV大概在4000万左右、PV 19亿左右;“和动漫”UA 1000万,PV 3亿左右。中国移动的应用市场——Mobile Market的覆盖率也较高。电信运营商将这些数据视为有用的补充数据,来增强数据的深度。

上面三个部分的数据综合起来,就形成了电信运营商相比其他公司独特的数据资产。依托这些数据资产,电信运营商可以走出自己数据变现的路线,不但可以使得自己的商业模式更加有竞争力,同时也可以帮助其他企业或行业的商业模式更加高效,从而提升整个社会的效率。

上图是对比了云、管、端各个产业中数据的情况。总体来说,相比互联网公司,电信运营商的数据深度有所不足、获取难度较大,但是数据的广度很好,能覆盖全行业的数据。

在数据资产部分,我最后想谈一点想法就是度量数据资产的价值。这是一个难点。因为按照资产的定义,衡量资产的价值要从资产未来带来的经济利益来看。对于数据资产而言,那就应该从最终的应用价值出发来衡量数据价值。但是我们采集和整理数据的时候,一般很难预测数据后续会如何用,会产生多少的数据价值。

因此,我考虑另外一个方法,也就是香农的信息论。通过数据的信息含量来评估信息的机制。假定信息量大的数据价值也大(这当然只是一个近似或简化的方法,价值最终还是会与受众已经掌握的信息,即前验信息有关)。大致来说就是设定一个评估的算法,计算数据在本企业所有数据中的显著程度,计算数据在其他行业或企业中类似数据的显著程度,由此来评估数据的价值。这样就可以评估为了收集、购买或存储这些数据,我们愿意付出多少代价。

二、电信运营商数据变现的典型模式

大家现在经常提的“数据变现”我理解应该是从Data Monetization这个词翻译过来的,坦率地说我觉得直译为“数据货币化”可能更加贴切一点。主要就是指将数据资产用来产生收益。这个收益包括经济收益、社会收益以及数据交换的收益。

随着摩尔定律的回旋加速,随着免费经济打破了围墙花园,所有“前向”模式的服务业都面临被颠覆的挑战,电信运营商也不例外,话音、短信收入已经开始下降,流量业务增量不增收现象明显。虽然很多东西都在变得更加充裕,但是有一样东西,它的供给是从古到今都变化不大的,那就是时间。人的一天只有24小时,保持清醒和高效率的时间只有十多个小时。如果让人充分利用这十多个小时,减少信息搜寻和匹配的时间,这将极大程度提高人的效率,从而提高了整个社会的福祉,这就是大数据蕴含大价值的理论基础。

更多的数据胜过更好的算法,正是多年运营的“前向”商业模式让电信运营商累计了大量的数据,这些是在移动互联网时代的重要比较优势。

大数据外部变现是一个长尾市场,有一个很标准的头部,同时也绝对不应该忽略那些长尾市场。这就要求电信运营商必须有合适的战略、机制、平台和合作模式来促进大数据的充分变现。我认为应该可以考虑如下几种形式:

标准数据产品(B2B)。根据标准化的需求打造出公众可以直接使用的数据产品,比如Google Trends和Telefonica的Smart Steps。面向行业中的政企客户,如果订购,仅需配置,不需开发,边际成本为0。

中间产品(B2B2X)。根据数据需求方的特殊需求,利用现有平台能力进行定制开发的产品。这种模式需要产品和业务团队全力参与,与对方组成融合团队。

分析和咨询服务(B2B2X)。根据数据需求方的业务场景,进行数据分析和挖掘,形成行业或企业分析报告,并提供业务咨询。这种模式更需要深入参与到相关企业的商业模式之中。

数据交换(B2B以及B2B2X)。通过数据市场或交易平台,进行数据变现或数据互换,充分挖掘数据价值,并获取外部数据。

从趋势上看,大数据作为一种能力对外输出并与通信以外的商业模式结合,才是电信运营商大数据应用更具潜力的发展方向。电信运营商的数据资源非常丰富,如果能够与更多的应用场景结合,将会体现极大的社会效益和经济效益。下面的图从数据的粒度和数据的用途两个角度来展示这些模式:

第一类典型的案例就是基于群体客户的数据产品。例如江苏移动建立的“智慧洞察”(Smart Insights)对外数据服务平台。该平台依托大数据强大的处理能力与海量数据,基于完全匿名和聚合后的数据,利用统计分析、数据挖掘等技术,提供标准化数据产品、大数据分析报告、高效Open API服务。为社会、政府、企业以及家庭、个人客户提供经过分析挖掘而形成的价值产品与服务,实现数据价值提升与共享。

“智慧洞察”具体的应用案例有“客源分析标准产品”,目前已应用于常州中华恐龙园、苏州金鸡湖、南京夫子庙、玄武湖、太湖等数十家景区。主要功能点:客源构成分析、景区景点人员密度、流量监控与预警。央视在大数据类栏目引用此平台界面与数据报道假日期间景区的游客情况。

还有数据开放API的产品。目前位置类API已应用在在南京旅委“南京智慧旅游数据运行监测中心”项目中,在2014年度江苏省智慧旅游推进会上,此项目被江苏省旅游局评为“江苏省智慧旅游优秀项目”。

“智慧洞察”平台使用的数据全部是经过匿名化转换后的数据,严格保护客户隐私。对外提供的标准产品、分析报告和API均不包括个体用户信息,以热点事件(比如青奥会)或热点位置(基站代码或GPS区域)为汇总粒度,整体采用了k-匿名算法来确保小用户群体不被区分。

第二类典型的案例就是基于受众、跨屏的RTB广告。在这方面有一些非常专业的公司正在做这方面的工作,比如集奥聚合、亚信、晶赞科技等。简单的说就是基于之前所描述的哪些运营商的数据资产,全方位的分析可能的广告受众的长期喜好和短期关注(DMP),并通过ID关联的方式打通各种帐号、Cookie和终端的信息,将这些客户标签信息以实时的方式提供给广告平台(DSP)作为实时竞价的依据之一。

因此,程序化投放类广告因其充分考虑受众的因素而能将长尾类的广告媒体资源与最合适的广告内容匹配,实现广告主和媒体方的双赢。因而汽车、IT、快消和互联网金融等品牌/品效类广告以及电商、游戏等效果类广告十分青睐这种投放模式。

在RTB广告中,最关键的就是竭尽可能地识别受众和分析受众,并能打破时间、空间和终端的分割形成对受众全方位的洞察。原有互联网模式下基于Cookie的ID链接和判断方式在移动互联网模式下存在难以跨屏、Cookie生命周期短、受众行为信息缺失等种种问题。而电信运营商对“管道”中的数据进行DPI解析,可以深度分析用户行为,可以识别用户的Cookie、IMEI、计费代码等信息,可以有效帮助DSP更加精确地投放广告。有数据显示,基于运营商DMP进行精确投放的广告效果相比未区分受众的模式提高了一个数量级。

这种精确广告的方式实际上也在改变电信运营商内部的精确营销模式。在通过运营商自己的渠道推荐自己的产品(套餐、终端、业务等)的时候,精确营销解决了受众的个性化,但是在营销手段方面有所欠缺。以往通过营业员面对面、客服人员外呼、短信彩信邮件推送的方式进行业务推荐属于“主动”的模式,这种模式打扰客户,接受度低,易引起客户的方案,而且成本颇高。学习互联网广告的方式,电信运营商自身业务的精确营销正在从“主动”变为“被动”模式,抓住每一个可能接触客户的机会(这些接触点不一定是自有的)进行推荐。在降低成本的同时“润物细无声”地完成了推荐工作。

以上是合作伙伴利用运营商的数据资产进行基于受众、跨屏的RTB广告的简要介绍。但是我认为,这只是一个临时的情况,只是个性化推荐的初级阶段。商业模式并没有优化到机制,也并没有给社会带来最大的价值。

广告模式浮于表层,考虑了广告主和媒体方的利益,但是将用户放在边缘的地位,这与互联网精神不一致。将用户视为“受众”其本身就含有这种自大的意味在其中。铺天盖地的广告(无论是传统的横幅、贴片还是原生和信息流)让人感到厌烦,让人质疑对客户隐私的窥探。这是一种粗放地使用数据所有权的现象,而且有数据误用的嫌疑(客户并未授权这种方式使用数据)。

我这段时间一直在反思这种模式的持续性。我认为只有真正帮用户实现了价值,才能实现良性的循环从而促进社会的福祉。同时在这个过程中需要竭尽可能保护用户的隐私不被主动、被动的泄漏。

首先,我认为在应用这类涉及个人客户而非群体客户的数据之前,必须要解决法律上的问题,并符合公共道德。具体来将就是要通过权利让渡获得数据的所有权和使用权,一些国际电信运营商和WIFI提供商以优惠的资费或直接免费的方式来做到这一点。此外要履行足够的告知义务,比如收集哪些数据,用于哪些方向,并切实保障这些应用方向是对客户有利。最后一点是客户要享有退出的权利(欧洲多采用Option-IN的方式,美国一般是Option-OUT)。

其次需要升华的地方是从单一地从广告主和媒体方的角度推荐“广告”,到与信息提供商一起组织为用户提供的期望“信息”。注意这里是期望的信息,是从用户角度上发出的期望。也就是说在社交网络上期望获得的是好友和信息的推荐;在电商网站上期望的是商品的推荐;在应用市场里面希望获得的是应用的推荐;其他的场景还包括团购、新闻、图书、餐饮娱乐等。

从推荐广告到推荐“内容”。通过为这些“信息提供商”提供个性化的引擎,让他们能更好地为用户组织“内容”。从预测CTR到预测推荐的内容对于用户的信息量(个性化但应保留足够的泛化能力),从用户的角度出发是最重要的。

最后,从技术上应该有更好的办法来实现这种个性化推荐。可以将数据分为“群体数据”和“个体数据”两个部分。利用脱敏后的“群体的数据”来分析特征、训练个性化推荐引擎。利用“个体数据”来使用个性化推荐引擎完成推荐。这里最重要的是“个体数据”的存放和使用,我认为最恰当的方法是这些数据用户可以选择托管到云中(DataBank)或本地装置之中(类似IC卡),以挑战-响应的方式使用个性化推荐引擎,保证个人信息不被泄漏。这里存在商业模式和技术的挑战,或许也是下一个创业的机会。

第三类典型的案例可能与经济价值无关,是利用电信运营商的大数据与学术可研机构来发现与社会、经济有关的规律,体现数据的社会价值。这个方向是我近期非常感兴趣的。因为它更加直接地回馈社会。

比如在《大连接》中描述的社交网络,这就可以利用电信运营商的数据资产进行很好的测量和分析。我们可以分析不同地区、行业和人群的社交网络构成和连接模型,分析事件和属性在社交网络中传播的规律(类似PageRank等在社交网络中的迭代计算),区分强连接和弱连接,计算不同圈子中的联通度,计算影响力等。

更简单一点的还有通过群体客户的时空特征来理解、预测和控制流行病;识别恐怖分子;交通道路设计;公共设施选址。这部分的需求已经有很多。有了这些数据资产进行支持,我们就可以更好地进行分析,真正将数据给科学家。

此外,还可以根据通信密度、频率等绘制一些社会指数,这个是我们正在做的一件事情,后续可能会作为企业的社会责任定期发布。

在这方面,或许三大运营商应该联合起来有一个专门关注公益的机构,能搭建开放平台让更多的科学家能分析这些数据,发现社会规律。个人觉得这比搞点什么吸引眼球的慈善活动更加有意义,是真正能改变企业形象的事情。

电信运营商数据变现中的几点思考

三、简单地谈谈几点思考。

第一就是“数据为王”。这个概念大家应该都非常熟悉,但的确是我这几年最深刻的感受。原本我们视为负担的数据现在是资产,是财富,因此我们还能不竭尽可能地收集它们吗?还能去定期删除它们吗?即使是电信运营商自身拥有了一定的数据资产,还应该通过购买、交换的方式让自己的数据资产更多,因为数据不同于实物,交换使用使得双方都能实现更大的价值。

第二就是“平台战略”。大数据最显著区分与传统数据分析和BI的就是它具有外部性。采集和拥有数据的企业很难预料这些数据最终的应用场景,因此这些企业理所当然地缺乏这些数据变现场景下所需的专业知识。比如广告为什么要与DSP合作呢?因为设计广告、与广告主建立关系、分析和优化投放这些不是电信运营商所擅长的。合作能发挥彼此的优势,通过平台的方式,能使得“长尾”部分的数据变现更容易,更加快速地进行尝试,失败成本更低。

第三就是商业道德和底线必须坚持。在相关法律缺位的情况下,必须要有“有所为有所不为”的决心。做人这样,企业也这样。

四、小结

电信大数据的应用潜力还有很大的挖掘空间。这是由两方面的原因决定的。一方面,电信网络与用户联系的广度和深度是其他行业所不具备的,随着网络智能化程度的进一步提升,电信网络获取的大数据将越来越丰富,并且这些数据都能某种程度上映射为用户的身份或行为;另一方面,整个商业在从生产主导向消费主导转移,各行各业都希望加强消费者洞察进而驱动数字化转型,对大数据的需求也百花齐放,电信大数据的价值将进一步提升。

电信大数据的应用过程中必须注意客户隐私保护的问题。从法理上需要获得数据的所有权或使用权,需要履行收集那些数据、用于合作用途的告知义务;从技术上必须实现最高等级的安全管理,并通过匿名化手段构筑最后防线。

我们正在尝试更多发挥大数据经济价值和社会价值的方式,希望我们能多交流和碰撞,希望能与各位合作!

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-12-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Rainbond开源「容器云平台」

解决这些问题,SaaS公司的业绩必将翻倍

1314
来自专栏CSDN技术头条

创业公司如何构建数据指标体系?

对于从 BAT 等互联网公司出来的人,经历了数据分析的历练后,会有做事之前看数据的习惯。而对于毕业之后就创业,或者是产品经理和运营专员的新手来说,一般对于构建企...

2137
来自专栏罗超频道

微信、百家和U3W,自媒体平台三国杀

继微信公众平台、百度百家和微博自媒体平台之后, 近日360、新浪微博和UC又高调联合推出自媒体合作平台。三人转中,UC浏览器负责移动流量入口,360则负责PC流...

3375

量子物联网离我们还有多远

谷歌预计在年底宣布它已经实现量子计算的优势——量子计算设备处理传统计算机不能解决的问题的能力。考虑到有限数量的公司直面这一挑战并不使人意外,而谷歌恰巧是其中之一...

2675
来自专栏PPV课数据科学社区

10大天然大数据公司,看他们如何挖掘数据价值

1、亚马逊的“信息公司”   亚马逊要处理海量数据,交易数据的直接价值很大。作为一家“信息公司”,亚马逊从每个用户的购买行为中获取信息,将用户在网站上的行为记录...

3829
来自专栏PPV课数据科学社区

【学习】DT时代:看IT运维高手如何“玩”数据分析

正如马云所言,我们身处在一个数据为王的时代,世界正从IT走向DT。在移动互联、云计算和大数据的穹顶之下,未来的IT运维管理被赋予了更多的信息挖掘和数据分析的重任...

3285
来自专栏java工会

做为一名java高级程序员,这些IT岗位你都了解么?

1856
来自专栏大数据挖掘DT机器学习

【总结】梦想与前行-一名数据人的自白

前段时间看微博话题讨论有些迷茫,有些已经被同行确认无疑的观点竟被反复强调,比如”数据挖掘/分析要懂业务”、”产品是数据价值变现的一条有效渠道”,观点没错,但听多...

2854
来自专栏程序员笔记

游戏测试

1863
来自专栏程序你好

谁说程序员是吃“青春饭”的?

1526

扫码关注云+社区

领取腾讯云代金券