数据猿专访 | 上海数据交易中心合伙人申翔宇:“规则+技术”才是打造大数据交易平台的正确姿势!

<数据猿导读>

上海数据交易中心申翔宇接受数据猿专访时表示,中国的数据交易仍处于“摸着石头过河”的探索阶段。在数据交易规则和创新应用还不够成熟时,我们需要对数据流通实施必要的监管,明确行业发展底线

来源:数据猿 记者:春夏

众所周知,在大数据领域中,数据源是大数据企业发展的基础。但从目前市场整体情况来看,对于发展还不太成熟的大数据行业来说,大多数企业对如何获得数据并没有统一的答案。从数据猿采访过的众多大数据企业可以看出,大部分公司要么是自己就能产生数据量,要么是从其他渠道获取公开数据,还有公司选择从数据交易市场购买数据。 而从第三种情况来看,目前整个数据交易市场中,并没有明确公开的数据定价和规范合理的数据交易机制。同时,由于不同公司对数据的需求存在差别,导致同样的数据对于不同公司的价值也不一样。比如1000万份病例数据,对于金融公司来说可能只值10万元,但对于医药公司而言却可能出价100万。可以说,目前数据定价缺乏指导价格、参考价格的专项规制,行业内仍有“讨价还价”的空间,数据交易市场的痛点急需解决。

数据交易急需体系保障

上海数据交易中心合伙人申翔宇就强调了这一点。申翔宇拥有20多年电信运营商工作经历,熟悉运营商数据情况,可以说是首创了中国电信大数据应用DMP平台,并创造了可观的商业价值。

他接受数据猿专访时表示,中国的数据交易仍处于“摸着石头过河”的探索阶段。在数据交易规则和创新应用还不够成熟时,我们需要对数据流通实施必要的监管,明确行业发展底线。而数据交易机构的出现,不但起到了对数据流通的规范作用,保障建立健康、安全的数据交易市场,同时推动了数据产业的发展进程。

他说,“数据交易中心为数据需求方和数据供应方提供了桥梁,促进了商业数据的市场化流通,推动跨区域的企业合作,实现数据互联创造新价值”。

以上海数据交易中心为例,其本身不存储任何交易方的数据,而是通过建立数据交易平台,为数据供应方和需求方提供规范透明的数据交易平台,规范交易流程,把控交易数据的质量,进行数据类型细分,实现有序交易。

为构建安全有序的数据交易市场,上海数据交易中心联合大数据行业专家学者,对数据安全规约进行了探索,制定并发布了《数据互联规则》、《个人数据保护原则》、《流通数据禁止清单》等文件。同时,为了保障数据供应方和数据需求方的权益,上海数据交易中心对数据交易进行全范围、全周期的管理,以构建合理有序的数据交易环境,保证数据交易的合法性。

“去身份”数据保护个人隐私

针对数据领域最受关注的安全与隐私问题,上海数据交易中心有一套自己的保障数据主体合法权益保障规则。

据了解,在欧盟今年发布的《个人数据保护法》中有一条数据“匿名处理”原则,即将数据与个人身份隔离以后,进行“匿名化”,使其可以在一定条件下应用。由此,上海数据交易中心在《个人数据保护原则》中,特别强调了个人数据与其身份信息必须进行隔离,然后才能进入流通。

申翔宇说,“为了落实个人数据保护原则,我们汇集分析了10多份涉及个人信息的国家法律法规,参照列出了30多项数据的禁止清单,凡是与个人隐私相关的规定,不管是数据流通、数据交易还是数据共享,我们都不会触碰”。

从技术方面来看,上海数据交易中心采用自主知识产权的IKVLTP六要素数据结构和EXID虚拟标识技术,结合24小时去中心化的线上交易模式,采取对数据标识统一加密、转译处理的方法,实现对交易数据“去身份”,同时在配送过程中运用二次加密技术,确保个人身份信息不发生泄漏。

此外,上海数据交易中心不响应应用场景合理维度之外的任何数据请求、不存储任何交易方的数据、不传输任何个人的隐私数据(PII信息)、不允许并技术性限制使用方非授权数据留存。

“规则+技术”双重保障数据互联

10月7日,上海数据交易中心正式宣布开放交易系统,采用会员制形式进行数据互联。同日,二十家首批会员也正式入驻交易系统,其中很多是上海数据交易中心的股东。比如,联通、电信等公司作为数据供应方加入了交易平台。另外,晶赞科技、复星星际大数据、东方航空、建设银行等有数据互联需求的公司也成为其第一批会员。

申翔宇告诉数据猿记者,“我们发布了数据互联规则,之所以没有简单使用‘交易’二字,是因为,我们认为在大数据行业中,数据是相互流通的,可以按需使用。另外,我们更希望交易中心产生增量价值。所以,在三年之内,我们不需要向交易双方收取佣金。”

据了解,在交易系统的数据互联流程中,数据供应方要提供原始数据授权,还要在上海交易中心事先划定的数据标签库中选取可供应标签数据产品,添加对应的数据属性描述,最终形成挂牌后的可供应数据产品。

而对于数据需求方来说,可以在交易大厅中查询所有数据供应方已挂牌的可供应产品,并将所需产品添加进购物车,经供需双方确认价格之后,生成数据商品订单。订单生成以后,即进入数据配送环节。为此,上海数据交易中心采用同步/异步实时在线方式进行单次或批量的数据配送。最后,在财务清算方面,数据交易系统会自动记录数据配送系统日志,并向各成员定期发送结算清算结果。

“营销+征信”应用打造数据交易单品

在数据交易品的组织设计方面,上海数据交易中心开设了两大应用板块——营销应用与征信应用。

申翔宇告诉数据猿记者,他认为精准营销领域的数据应用已经相对成熟,其市场规模约占整个精准营销行业的5%,有很大发展前景。目前,在交易中心营销应用数据交易品中,包含汽车、母婴、金融三大行业的特有数据单品。

而在征信应用方面,交易平台主要的数据单品方向为身份要素验证。目前交易系统主要支持三要素(身份证、姓名、手机)、四要素(身份证、姓名、手机、银行卡)验证,后续将扩展到五要素、六要素等加入多维度身份要素的验证。

对于未来规划,上海数据交易中心有自己的打算。申翔宇表示,交易中心会进一步在互联规则、功能设置等方面进行突破,以规范数据的互联进程,继续探索推动数据交易市场合法有序健康发展。

对于数据交易方来说,规范的数据交易中心为其提供了合理的保障。另一方面,交易中心也顺应了国家发展大数据战略趋势,可以说,在大数据产业发展进程中起到里程碑式意义。

来源:数据猿

本文分享自微信公众号 - 数据猿(datayuancn)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-10-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏c#开发者

task Scheduler

在业务复杂的应用程序中,有时候会要求一个或者多个任务在一定的时间或者一定的时间间隔内计划进行,比如定时备份或同步数据库,定时发送电子邮件等,我们称之为计划任务。...

34180
来自专栏阮一峰的网络日志

回车和换行

今天,我总算搞清楚"回车"(carriage return)和"换行"(line feed)这两个概念的来历和区别了。 在计算机还没有出现之前,有一种叫做电传打...

33650
来自专栏架构说

使用虚拟节点改进的一致性哈希算法

1 作者:@lionets 分析缺点 连接:http://my.oschina.net/lionets/blog/288066 2 作者:@糖拌咸鱼 ...

465140
来自专栏阮一峰的网络日志

为什么寄存器比内存快?

计算机的存储层次(memory hierarchy)之中,寄存器(register)最快,内存其次,最慢的是硬盘。 ? 同样都是晶体管存储设备,为什么寄存器比内...

37170
来自专栏架构说

题目:将链表的奇数位和偶数位调换组成新的链表

题目:将链表的奇数位和偶数位调换组成新的链表 原题链接: http://oj.leetcode.com/problems/swap-nodes-in-pairs...

71490
来自专栏马洪彪

Java设计模式(八)Proxy代理模式

一、场景描述 代理在生活中并不少见,租房子需要找中介,打官司需要找律师,很多事情我们需要找专业人士代理我们做,另一方面,中介和律师也代理了房东、法律程序与我们打...

38960
来自专栏机器人网

探秘日立存储器工厂:双臂机器人与人并肩协作

从JR小田原站出发,驱车约30分钟。日立制作所的工厂就坐落在住宅区的一角(图1)。这里便是日立存储器业务的“心脏”。 ? 图1:日立制作所信息与通信系统公司...

404150
来自专栏木可大大

漫谈Git和Github

上期漫谈版本控制系统中我们谈到了版本控制系统的四个演进过程,即悲观锁版本 -> 乐观锁版本 -> 多分支版本 -> 分布式版本,目前我们使用最多的是分布式版本,...

54440
来自专栏阮一峰的网络日志

理解inode

inode是一个重要概念,是理解Unix/Linux文件系统和硬盘储存的基础。 我觉得,理解inode,不仅有助于提高系统操作水平,还有助于体会Unix设计哲学...

38970
来自专栏架构说

题目:判断一个单链表是否回文链表

题目:判断一个单链表是否回文链表 Given a singly linked list, determine if it is a palindrome. C...

37380

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励