专栏首页数据猿投稿 | 现阶段我为什么不看好纯粹的数据交易?

投稿 | 现阶段我为什么不看好纯粹的数据交易?

原力大数据创始人江颖表示,尽管大数据交易平台建设正值爆发期,数据交易号称的市场规模也在不断壮大,同时也有国家大力的政策支持。但是短期内,我仍然不看好数据交易,因为现阶段的数据交易缺乏了必要的基础构建

来源:数据猿 作者:江颖

导言:

普通人发现,自己的隐私在不断被暴露,不是房屋中介就是股票推荐;

一般企业会说,“大数据就是骚扰电话和短信”、“能不能帮我找到客户发短信、打电话”;

业内人都清楚,现阶段大量的数据交易实际上就是客户隐私数据和敏感数据的出卖,并且已然催生了庞大的地下产业链;

现阶段的 “数据交易”,多限于个人身份、企业基础信息的核实验真,而更多的是客户隐私数据的黑市交易。

尽管大数据交易平台建设正值爆发期,数据交易号称的市场规模也在不断壮大,同时也有国家大力的政策支持。但是短期内,我仍然不看好数据交易,因为现阶段的数据交易缺乏了必要的基础构建。

1普遍缺乏大数据认知,不知道大数据能做什么

在大数据产业中最重要的因素是人,而在数据交易中,交易双方必须对数据有清晰的认知、理解。但在现阶段,大数据刚刚起步,绝大多数的行业、企业对于本身数据、数据如何使用并不清晰。所谓认知理解基础,指的是知道“我能用数据做什么”、“别人的数据对我有什么作用”、“我的数据对别人有什么作用”等等。

理想的数据交易是数据提供方与需求方能够进行对接,解决企业之间的数据缺失问题,完善数据价值。但大数据的能力和价值是抽象的,大部分是非直接的,这就导致很多人对数据价值的认识不到位,甚至不同位置的人之间也存在着严重的断层。

很多时候做搜集数据工作的人不知道拿数据做什么用,作数据分析的掌握不了数据质量,营销策划人员不知道数据能够帮助他们做什么,管理者会发现大数据的应用没有达到预期的效果。

再者,对于数据交易这个前所未有的领域,作为数据提供方、数据需求方或交易平台管理者,不同的角色该怎么发挥自己的作用,大家能够促成什么事情,其实很多人在思想上都是没有做好准备的。

2缺乏数据交易基础,高质量数据拿不出来

口径不一致,有数据却用不了

数据口径必须要极为明显、确保一致,才能保证后续高效利用。在建模分析中,对于所研究的变量,必须搜集、整理其时序的或某个时点的横断面数据资料,它们是建模的物质基础。这些数据资料的质量,直接关系到模型的质量,影响我们对数据的应用。

然而,大数据对于大部分行业都还是新鲜事物,部门、行业间存在严重的数据壁垒和孤岛现象,很多数据口径不明晰,别人读不懂你的数据;又或者同类数据口径不一致,没有办法合并同类项。

就拿大数据征信举例,不同部门的信用评级标准不一样,很可能对于同一个的评估结果就有天差地别。这时候该相信谁,该采用谁的标准?大数据本应是告诉你答案的,而不是让你陷入新的难题。但如果没有明晰、一致的口径,数据就不能帮助我们解决问题,数据交易又有什么意义呢?

数据拿不出来,躺着睡大觉

数据交易要发挥作用,必须要有高质量数据集的参与。但众所周知,越是高质量的、具有核心竞争力的数据,就越是容易涉及信息安全、信息敏感等问题,因此越是被高度保护、无法获取。

几乎每天新闻都会曝光非法的数据交易,利用各种社交工具售卖学生个人信息、银行卡卡号密码等等。明明是非法的勾当,却还是有那么多人以身试法,正说明了目前正规交易市场的数据其实远未能满足商业需求。

数据交易不应该触碰到用户个人隐私信息、敏感信息这条红线,那如何在不触碰红线的前提下,输出数据的能力,跟其他数据进行拼接,这是我们需要长时间不断探讨的问题。而现阶段的数据交易并没有办法释放这部分的数据能量。

可读性不足,数据形同虚设

我们有个客户,手头上掌握的数据能够帮助同行业的一些企业来做精准营销,但他的数据既有文本、又有数字,且规范性差,可读性非常的弱。有些政府数据也是如此,虽美其名开放数据,但数据孤岛、数据结构性差等问题大量存在,没有办法被机器读取。

像这样的非结构化数据其实不在少数,而且大都蕴藏着巨大的价值,但需要大量的时间、人力物力去做清洗、处理。这些基础工作在现阶段并没有做好,所以数据也就难以实现拼接和大规模流通。

3缺乏制度基础,交易环境不明朗

数据交易下,隐私和安全问题是社会最关注、最敏感的问题。随着大数据时代的到来,过往的法律法规并不能简单地套用到数据交易的场景中,需要制定特定的制度、法规。否则数据交易将会长期处于一个尴尬的境地,进退两难。

此外,行业与行业之间、企业与企业之间目前仍然没有数据互通的意识或共识,大家对于自己所拥有的数据还是持十分谨慎保守的态度。但未来这种态度必须要转变,因为跨界数据的整合才能够带来大数据应用的爆发。

4数据交易要蓬勃发展,把数据“拿出来”是关键

我认为数据交易是趋势、是未来,但由于不具备上述基础,现阶段还很难发展。在这些基础之上,最本质、最核心需要解决的是高质量数据“拿不出来”的问题。所谓“拿不出来”,意思是数据变现必须运用间接的方法,而不可能通过纯粹的原材料买卖来变现。

要怎么把数据“拿出来”,第一,必须要形成一套口径统一的标签体系。通过长期摸索,当标签极其规范时,我们就能够以标签化输出代替原始数据输出,信息孤岛才能够被打通。

第二,是要形成行业与行业、企业与企业良好的信息共享机制、保密机制,完善的法律法规,数据交易才能够顺利地进行,健康发展。

同时,像我们做大数据的公司,其实还肩负大数据普及教育的使命——提升大数据意识,培训大数据能力,激活企业大数据资产。要告诉企业大数据是什么,能帮你做什么;然后深入探讨交流,分析你所具备的能力,有什么需求;还要给企业做大数据培训,做能力建设等。

结语:

我曾经提出“技术不是大数据第一生产力,数据交易才能带来应用的爆发(链接)”,但数据交易绝对不是纯粹的数据原材料买卖,否自在未来将会丧失核心竞争力,借助大数据做一些现在做不到的事情,才是大数据交易蓬勃发展的未来!

本文分享自微信公众号 - 数据猿(datayuancn)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-09-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据24小时 | 美国创企LogicMonitor完成 1.3亿美元融资 ,京东金融再扩版图布局车联网大数据

    <数据猿导读> 提供数据中心监测服务的美国创企LogicMonitor完成 1.3亿美元融资;东南卫视与认知数据合作,布局影视文化大数据;京东金融再扩版图,合作...

    数据猿
  • 大数据24小时 | 贵阳出台新政为求大数据人才再砸金,雅虎、谷歌等数亿邮件数据流入黑市

    大数据服务商中商数据与“国际五大行”达成合作,将为其提供数据监测服务 ? 现如今,“大数据”发展得如火如荼,很多行业都陆续将眼光投放到“大数据”领域上,其中,“...

    数据猿
  • 数据猿对话 | 族谱科技CEO张力铭:对大数据的看法,很多企业都扭曲了!

    数据猿导读 大数据究竟是什么呢?它能做什么?为我们的生活又带来了什么改变?数据猿专门对族谱科技CEO张力铭进行了专访,由他为大家解答这些问题。 ? 来源:数据猿...

    数据猿
  • 大数据兴起预示“信息时代”进入新阶段

    导读:大数据已成为媒体与大众关注的新技术,大数据的应用也预示着信息时代将进入一个新阶段,但人们对大数据的认识有一个不断加深的过程。首先从“信息时代新阶段”、数据...

    钱塘数据
  • 大数据24小时 | 美国创企LogicMonitor完成 1.3亿美元融资 ,京东金融再扩版图布局车联网大数据

    <数据猿导读> 提供数据中心监测服务的美国创企LogicMonitor完成 1.3亿美元融资;东南卫视与认知数据合作,布局影视文化大数据;京东金融再扩版图,合作...

    数据猿
  • 英国2020《国家数据战略》与世界各国对比解析

    2020年9月9日,英国数字、文化、媒体和体育部(DCMS)发布《国家数据战略》(下文简称《战略》),支持英国对数据的使用,帮助该国经济从疫情中复苏,并将在20...

    明悦数据
  • 透过数据魔镜看人看物看世界

    万物皆数,透过数据的魔镜能够帮助人类照出万物的本质,看人看物看世界。正如实现心愿的如意——如意如意快快显灵,数据的如意如今已经成为评判人和物的标尺,给人给物画像...

    机器思维研究院
  • 盛世的阴影:大数据时代的挑战渐渐浮出水面

    数据猿导读 6月29日,由数据猿主办的金融大数据峰会在上海盛大召开,现场汇集了众多来自大数据领域内执牛耳的重量级嘉宾。大数据被誉为第四次工业革命的能源,整个产业...

    数据猿
  • 数据清洗 Chapter01 | 数据清洗概况

    这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者...

    不温卜火
  • 大数据正强势入侵生活的各个方面,你发觉了吗?

    随着互联网的发展,信息交流也在不断加速,大数据在各行各业几乎都站稳了脚跟,特别是越来越多的政府机构与公司组织都已经把大数据应用作为了重要的一环。那么,大数据在社...

    数据猿

扫码关注云+社区

领取腾讯云代金券