政府开放大数据,为何大公司优先?

原创2015-03-20罗超

大数据终于不再是纸上谈兵,而是进入到实际应用阶段,标志性事件是两会上,李克强总理明确表态,政府应该尽量的公开非涉密的数据,以便利用这些数据更好的服务社会,也为政府决策和监管服务。这是中国政府首次正式公开表态支持大数据。在此之前中国各级政府一些部门已在大数据开放上有所尝试,从实际情况来看,还存在开放规则不明朗的问题,不过一个大方向确实:大公司优先。

1、政府部门大数据成为企业眼里的“香饽饽”。

大数据是金矿,企业和政府都已经意识到其中的价值,在大数据上有野心的企业都期望获得更多有价值的数据,可能是来自其用户,可能是来自合作伙伴,还有一个重要来源是政府等组织机构的公开数据。

不同来源不同性质的数据关联在一起交叉挖掘分析,会发生“化学反应”得到更多价值。阿里巴巴拿到微博数据可以挖掘做好精准营销、拿到交通部门数据可以与菜鸟网络结合、拿到金融监管部门数据便可与用户交易和理财记录结合做个人征信;百度拿到交通部门数据可以与百度地图结合、拿到博彩指数公司数据结合网络数据做世界杯预测……

2015年开始中国政府对互联网、高科技和大数据产业的空前重视,并且明确表态要开放大数据,因此势必会有更多的政府数据开放给民间。这些大数据成为相关企业眼里的“香饽饽”。这些数据如何开放、开放给谁、如何使用,却还不明朗。

2、政府大数据使用权尚不明朗,需边走边看

阿里、百度这两家中国最积极的大数据玩家,过去便与一些政府部门接入了大数据。

  • 2013年2月25日,国家食品药品监督管理局与百度在北京联合举行“安全用药,搜索护航”战略合作签约仪式。国家药监局的三大药品数据库,总计20余万个权威药品信息全面入驻百度。
  • 2014年5月27日,中国气象局公共气象服务中心与阿里云达成战略合作,共同搭建“中国气象专业服务云”,面向有气象数据需求的企业提供专业化的云计算服务。
  • 2014年7月23日,百度推出名为“北京健康云”的智能医疗平台产品,这是北京市政府支持推动下的一个民生医疗项目。
  • 2014年10月15日,“云上贵州”系统平台正式开通运行,这是贵州省政府与阿里牵头的企业合建的云计算基础设施,应用在交通等领域。
  • 2015年1月13日,阿里健康宣布将药品监管网的基础设施从甲骨文数据库迁移到阿里云平台,阿里将利用大数据技术帮助解决假药问题。

政府在大数据上已经动了起来,百度和阿里成为第一批吃螃蟹者。问题是,这些数据不只是它们想要,阿里和百度之间有竞争关系不说,还有不少相关企业都有拿到这些数据的诉求。比如药监局的药品数据库,百度和阿里先后拿到之后,便有医学药学生命科学专业网站“丁香园”站出来表示,这些数据应该以公平的方式开放给更多企业,以达到数据安全,市场公平和效率最高的目的。显然在纷纷认识到大数据的重要性之后,围绕大数据的争抢已经展开。

美国政府在大数据开放上有着先进的经验,《大数据》这一大数据启蒙教材的主要案例便是围绕美国政府大数据的开放案例,这本书曾被副总理汪洋公开推荐给官员。“用纳税人的钱收集的数据应该免费提供给纳税人使用”书中提及的一个观点。不过,道理简单,操作却并不可一蹴而就:哪些数据是可以开放的(李克强总理提到非涉密数据,不知道是否已有明确界定规则)?开放的程度是怎样的?开放的方式如何:是面向特定企业开放还是建设系统纳入统一数据开放平台之中?是有偿开放给企业还是免费开放给所有企业?是直接开放原生数据还是开放基于数据挖掘的某些统计结果?显然,这些问题都没有统一答案,需要边走边看。

3、规则界定之前,政府开放大数据更倾向于“大公司优先”

政府开放大数据当前的案例主要是面向阿里、百度这样的互联网巨头。在一些中小创业型公司看来,这难免会有些“不公平”。不过仔细想想,大公司优先或许是必经之路。

首先,大公司具有更强的技术能力和资源。阿里巴巴给外界的印象是电商,其实它同时也是技术大牛,阿里云是最大的公有云平台,并且其面向大数据推出了ODPS(开放大数据处理服务)。同样,百度是技术驱动的互联网巨头,率先提供了大数据开放引擎,建立了大数据实验室。在这两家公司大数据已经是公司战略。它们有技术,肯投入资源利用大数据。如果说只能逐步开放大数据给不同企业,分批选择企业有限选择技术更强、资源更多的大公司合情合理。

其次,大公司在大数据隐私保护上更可靠。由于政府大数据不少涉及到国计民生,不少关乎公民隐私,比如健康数据、出行数据、信用数据等等。因此政府在开放大数据服务于民的同事,必须严格把关数据的使用者以及使用方式,避免出现公民隐私被侵犯的情况。如果不涉及公民隐私的数据直接开放自然没问题,但涉隐数据,自然要选择可靠的使用者。从概率上来看,声誉好的大公司出现问题的概率最小。这与普通用户选择个人云存储、个人邮箱、网络支付工具等涉及隐私服务,会优先考虑大公司,是一个道理。

再次,面向中小企业的数据开放必须通过系统。就算政府一些数据可以公开给任何符合条件的企业使用,也不大可能是“点对点”的方式,即不是签协议战略合作这类方式,而是基于开放式的数据开放平台,可能是公共API,也可能是美国政府的“DATA.GOV”这样的形式,只有这样才能一次开放多家使用。谈判、合作、协商、协议,这些都只适合针对个别企业的合作。因此眼下这样的可以整合不同政府部门相关数据的开放平台建设,已迫在眉睫。不过在建好之前,只能是大企业优先,与大企业的合作只会为后续的进一步开放提供宝贵的实践经验。

最后,大企业并非无偿使用数据还要贡献价值。还有一个重要的原因是,BAT等大企业本身便拥有海量大数据。这些数据来自中国网民的网购理财、来自用户社交搜索等等。2014年9月19日,国家统计局首次对外展示了其正在研究的基于百度搜索数据来预测房地产价格的新工具,以及新研发的网购数据统计,而其数据来源之一则是阿里巴巴。腾讯也在统计局的潜在数据源提供方名单之中。就是说,政府一方面要开放自己的大数据,另一方面也需要从大公司拿到特定数据。除了数据贡献之外,还有技术服务。政府不擅长技术,BAT们却擅长,帮助政府部门建基础设施、建开放平台、开发数据挖掘工具,在这一块的合作案例已经够多了。

从长远来看,政府开放大数据是必然趋势,取之于民用之于民。不过全面开放、完善开放规则还需要一个过程。在当前的个例式开放模式中,政府部门似乎更倾向于“大公司优先”。我想这只是暂时的,未来更多中小企业、以及政府所鼓励的创业者,都会享受到“大数据红利”,现在还需要多一点耐心。

“罗超”(luochaotmt)。互联网给了我们自由,这是最好的时代。罗超,是虎嗅网年度作者,WeMedia联盟成员,百度百家首批成员。

原文发布于微信公众号 - 罗超频道(luochaotmt)

原文发表时间:2015-03-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

机器人、失业与创新

文/梁建章、黄文政 随着人工智能和机器人技术的进步,许多人担心人类的工作机会将被机器人抢走。从历史上看,自动化和技术进步已经导致很多旧行业被新行业所取代,不过从...

2382
来自专栏华章科技

巨头纷纷布局人工智能,创业者的机会在哪里?

编者注:本文翻译自 TechCrunch,作者 Hossein Rahnama 是美国麻省理工学院和瑞尔森大学的客座教授,同时也是创业公司 Flybits 的 ...

942
来自专栏携程技术中心

深度 | 旅游+VR=?

虚拟现实(VR)是利用计算机生成一个三维立体逼真图像,在模拟环境中创造一个虚拟世界,提供用户视觉、听觉、触觉、力觉、运动等多种感知,让用户仿佛身临其境般自由观察...

3064
来自专栏镁客网

“云上”微软,第一个万亿巨无霸

1697
来自专栏罗超频道

百度发布“百度派”跟知乎抢生意?但故事可能要大得多

12月6日,百度知道继年中推出共享知识平台问咖之后,又发布了一款新产品:百度派,域名为p.baidu.com。据百度官方介绍,百度派定位为高质量话题讨论社区,希...

3045
来自专栏新智元

中国AI行业走向:新人胜旧人还是 BAT 牢牢掌握价值链顶端? | 新智元投资领袖论坛

【新智元导读】3月27日新智元开源·生态AI峰会上,6 位人工智能界顶级投资人齐聚,共同讨论 AI投资和行业发展问题。北大人工智能创新中心主任雷鸣主持,红杉资本...

35211
来自专栏镁客网

电信联手华为,完成首个5G网络无人机试飞 | 热点

1923
来自专栏腾讯研究院的专栏

德银VR报告中文完整版:了解关于VR的一切

?       英文原版作者:Ross Sandler       中文版作者:腾讯科技孙实、于春慧       德意志银行(以下简称“德银”)发布最新VR报...

1928
来自专栏镁客网

身为SaaS元老,Salesforce能够在云服务成功突围吗?

1734
来自专栏腾讯研究院的专栏

VR产业发展三大趋势:硬件端龙头初显,内容端机会犹存

中国信息通信研究院与腾讯研究院AI联合课题组 刘耀华  中国信息通信研究院政策与经济研究所工程师 ...

2608

扫码关注云+社区

领取腾讯云代金券