想做“开放数据”这门大生意?先让数据“关联”起来

随着“开放数据”这项运动在中国的持续进行,各类开放的数据逐渐丰富起来。如何解决其中的数据孤岛难题?又如何最大化挖掘开放数据的商业价值?10月30日的线上数据侠实验室中,大数据交易平台“发源地大数据”创始人兼CEO马建军为我们分享了其在“开放数据商业化”方面的实践和观点,本文为其现场演讲实录。

▍大数据应用需求大,但痛点是获取成本高

从理论上来说,大数据可以应用在各行各业。特别是最近几年,人工智能火热的形势下,数据源作为大数据的基础设施,其价值已经体现得淋漓尽致。应当说,没有数据就没有人工智能,也没有机器学习、深度挖掘等,包括数据层面的应用。

我们认为,中小企业对数据的需求场景一般包括三大块,第一是将数据用于数据分析、市场调研等;第二是很多项目在早期启动或者运营过程中需要有数据的支撑,即启动/运营数据;第三是企业客户数据挖掘、精准营销,基于数据做一些用户画像等研究,供企业进行营销。

大数据的市场空间,大家都比较清楚了。差不多从2012、2013年,国内的大数据发展开始慢慢落地,到了2015年,依靠大数据做精准营销已经成了很明显的趋势。而且有一些基于开放数据的创业公司比如企查查、天眼查等也已经落地。

不过,尽管如此,我们还是看到,最近十多年来,数据分析在国内一直不温不火,短期内可能也很难落地。这和国外的情况显然不同。

我们今天的主题是关于开放数据,其获取的渠道可以是从QQ群、淘宝等进行交易;也可以通过传统的API模式,按调用次数购买;当然,也可以自行采集。第一种方式的成本高效率低,而且因为是交易,数据可能都是些历史数据。第二种API方式,虽然在前几年发展不错,但是接下来的发展并不让人看好,因为其成本高。而如果是由公司自行采集,往往是传统的单机方式,数据的利用和应用层面往往也有很多问题。

那么如何来解决这些痛点呢?

▍数据从开放共享到直接交易

要解决用户碰到的数据获取中的痛点,一个解决方法是推动数据的交易。在以前并没有数据交易的概念,从2015年贵阳成立大数据交易所这一个时间节点开始才有。

所谓数据交易,其主要目的是推动数据的开放共享、直接交易。在此之前,当然还要先制定一个规则:什么样的数据可以开放?如何开放?又如何去共享再到交易?

下面这张图是基于我们多年经验总结出来的数据流通交易的架构:

首先,开放数据要得到应用,需要有一个初加工的过程,然后再做清洗等深度加工。而这中间必须要有的一个环节是数据的处理。我们把这个过程形容为“从小麦加工成面粉、再加工成包子、馒头”,这才叫做应用。

我们认为,不管是开放的数据还是非开放的数据,从数据源头到终端的应用,用户都有加工的需求,有了这个环节后才能拿来做交易变现,实现更好的流通。这个过程其实可以称为“数据源”的交易。

数据源交易不同于我们传统的数据包。有一个概念叫做“块数据”,这种数据其实相对还是比较孤立的,还是一个个“数据孤岛”。而数据源交易则是一个活的交易。因为它其实就是一个数据产品,能帮助用户解决很多问题,比如数据的动态交付、数据安全、版权隐私等等,我们称之为“三元素”——先授权、后脱敏、最后再确权的一系列过程。

在将一个个数据孤岛打破、推动数据融会贯通的过程中,数据加工起到了很大的作用。如果没有这个环节,直接拿数据包来交易,其实并没有从根本上解决数据价值最大化的问题。下图是对前面架构的补充,这三个层级中,数据加工的重要性不言而喻。

▍开放数据商业化的关键——数据融合

接着我们再来看看具体的案例,我们将开放数据进行了“产品化”,并按照数据的应用类型做了分类。下图是我们目前能提供的各种数据类型:

上面这些数据,一般也是比较有价值、用户最为关注的数据。但值得一提的是,很多在大家看来可能一点价值没有的数据,其实也有一定的需求。什么原因呢?因为随着大数据的发展和开放数据的应用,尤其是数据融合的观念,数据整合越发重要。

目前要想让数据变现,就得看那些“长尾数据”,要有海量数据的观念,将一个个海量的数据孤岛先进行整合再进行融合管理。就好比大众点评,早期肯定也做了很多数据采集之类的“脏活累活”,但一旦建立了数据的索引,那么你就会发现其价值非常大。

大多数的用户对数据的应用需求其实都不是某一个数据源,而是多样化的。我们还可以看看下面这张图:

从上面这些应用场景来看,大多数的用户的需求都是基于某一个独立的数据源,然后再基于海量数据源或者多个数据整合使用。

对于开放数据来说,它的体量本身是非常大的。至于各种企业、机构的内部数据,其对外公开的难度更大,使用会受到各种层面的影响。未来,开放数据的体量一定是远远大于内部数据。从这个角度看,开放数据的应用空间是不可想象的。这种数据的矿山就像是金矿,如果不去开挖,那么可能就是一座座的数据孤岛,没有任何价值。

为了最大化数据价值,数据的融合贯通非常重要。我们可以拿“企查查”这家公司作为例子。在早期,这种APP可能只能够查询企业的工商信息,但这样并没有大的发展空间,但你现在看到在这类APP上能够查询到企业的多维度信息,比如股权、股东、知识产权、商标专利、相关的报告等等。有了这种多维的信息,将多维的数据打通,对于C端用户来说其价值就非常大了。

所以,我想说的是,不管是开放数据还是非开放数据。要让其发挥最大的价值就要做数据之间的关联。这样的关联模型一旦建好之后,其在未来的应用将非常大。

注:以上内容根据马建军在数据侠线上实验室的演讲实录整理,有部分删节。图片来自其现场PPT,已经本人审阅。本文仅为作者观点,不代表DT财经立场。

作者 | 马建军

编辑 | 胡世龙 : hushilong@dtcj.com

▍数据侠门派

本文数据侠马建军,大数据交易平台“发源地大数据”创始人兼CEO,硕士,10年大数据行业研发管理经验,曾创办多家企业。国内首款SaaS采集引擎的核心开发者;曾供职于腾讯,负责过腾讯首个游戏大数据预测引擎的研发。

原文发布于微信公众号 - DT数据侠(DTdatahero)

原文发表时间:2017-11-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

观点︱如何提升渠道ROI?在数据分析的基础上实现精准营销

著名广告大师约翰·沃纳梅克曾说过“打广告的钱有一半是浪费的,但客户永远不知道是哪一半。”尽管如此,每一位广告主都还是希望把漫天撒网的广告变成一种精准的目标广告。...

32090
来自专栏PPV课数据科学社区

☞【观点】成为“大数据企业”,献给不懂数据挖掘的你

文|郭迅华:清华大学经济管理学院副教授 一家中等规模的百货商场,通过视频监控记录下商场各个区域的客流人数,从而评估每天各个时段客流的在店时长,进而结合销售记录...

36070
来自专栏人工智能快报

调查显示美国人较能接受工作场合的生物识别应用

生物识别资讯网站findbiometrics于2016年1月14日报道,美国民间独立调查机构皮尤研究中心最新的一项研究结果显示,美国人对面部识别技术可能并没有部...

35380
来自专栏Java成长之路

程序员们,转变你的思维方式吧!

笔者已经工作两年多了,在这里我想谈下关于程序员关于职业的思维方式。对于职业的思维方式,决定了一个人的选择和成就。建立一个正确的思维方式,有利于我们主动管理自己的...

9130
来自专栏镁客网

硬纪元AI峰会实录 | 暴风集团副总裁王刚:让虚拟人代替你去做很多事

22140
来自专栏钱塘大数据

干货 | 物联网数据泛滥 企业该如何应对

导读:物联网时代的到来给人类生活带来天翻地覆的改变,预计2015-2020年间物联网市场规模将达千亿量级。许多企业都在奋力应对由此带来的挑战,虽说大数据分析是推...

34450
来自专栏腾讯数据中心

云时代下的IDC联合运营

Pony说过,腾讯把半条命交给了合作伙伴。这句话,同样用于形容腾讯和支撑腾讯业务的IDC运营商。的确,稳定可靠的IDC,是腾讯业务的半条生命线. 云对IDC的...

40760
来自专栏数据猿

【每周一本书】之《数据驱动:从方法到实践》(文末有彩蛋)

【数据猿导读】 自2017年起,随着大数据领域的发展,数据驱动的理念在多个行业成为业绩增长“标配”,摒弃主观决策的惯性,让数据“说话”,是个人、企业构建核心竞争...

29460
来自专栏大咖说

CEO 实话实说:我需要这样的 CTO

文章原创首发于微信公众号「 TGO 鲲鹏会」,原文地址:CEO 实话实说:我需要这样的 CTO

7000
来自专栏CDA数据分析师

袁岳:数据不在数量大,胜在“多元”

本文由CDA数据分析师小编 整理自零点研究咨询集团董事长袁岳在“2015年中国数据分析师行业峰会”上的演讲,转载请注明出处 大数据既是一个科学,它同时是一个艺术...

24690

扫码关注云+社区

领取腾讯云代金券