京东万象总经理杜宇甫:用科技助力数据流通,社会将更加智慧!(内附PPT)

数据猿导读

数据是可以推动智慧的前进,但在智慧流通过程中实际上存在很多问题。在由中欧国际商学院和数据猿共同主办的“中欧微论坛”上,京东万象总经理杜宇甫从版权、质量、合规、指导、集成5个方面进行的阐述。

作者 | 杜宇甫

2017年2月16日,由数据猿、中欧商学院、腾讯直播共同举办的《中欧微论坛|数据猿·超声波》活动在中欧商学院北京校区圆满落幕。此次活动大咖云集,共吸引了600+人报名,并最终筛选出300+观众莅临现场,更有超过20000名观众收看了在线直播,开启了一场大数据、人工智能领域的头脑风暴,台上台下、线上线下共同畅想科技引领下的商业未来!

作为数据猿推出的主题为《大数据的2016,我的2016》2016—2017年度大型策划活动的一部分,在2016年底征稿期,活动就受到了100+大数据领域内知名企业的高度关注,收到了36位业内领袖的投稿,并入驻成为数据猿专栏专家。

以下是“京东万象总经理杜宇甫”的精彩文字版演讲内容:

分享长度为3500字,建议阅读7分钟

随着全球大数据技术的成熟和发展,大数据产业正在逐步成型。数据的依赖也愈加广泛,随着社会对数据认知程度的快速提高,如何智慧的应用数据价值,其讨论热度也在持续增长。在我看来,从远古时期的钻木取火到今天每一次商业的进步,都是由技术作为先驱来推动。

数据推动社会智慧化发展,但在数据流通过程中实际上存在很多问题,我今天跟大家分享这些问题以及解决思路和方法。

2016年,数据不断地改变我们的认知,3月15日,AlphaGo击败了世界上最聪明的棋手李世石;9月24日,索尼创造出了两首机器人创作的曲子,并根据个性需求定制曲风;同月27日,Google发布了新的翻译系统,可以跟人类的翻译能力相媲美。

这一系列的发展过程,机器显然变得越来越智慧,根据不同的数据创造价值,智慧化我们的生活。但是,在数据智慧化应用的同时,也产生了严重的问题。也是同月的18日,徐玉玉同学遭遇电话诈骗,被骗光了筹借的9900元学费,在报案后回家的路上,心脏骤停不幸离世。数据智慧了生活,却也促生了黑色产业链的发展,这使得数据流通在今天依然是一个非常非常重要的话题。

当前有多重问题阻碍数据流通

每个人都想成就自己的商业,提升自己的商业智能,究竟如何有效发展?

机器可以变得很聪明,但AlphaGo并不会下跳棋。如何让我们的机器更加的智慧?

在当今的商业模式及社会中,高纬度与低纬度相较是非常容易胜利的。那么如何增加纬度?

我想到一个笑话:拿坡仑接见一个瑞典的小伙子(在打仗过程当中非常骁勇善战,小伙子非常崇拜拿坡仑),但他不懂法语。在拜访前,有人告诉他,拿坡仑会问你三个问题:你多大了?回答“28(法语)”即可;加入军队几年了?回答“3(法语)”;最后拿破仑会问,你是喜欢当兵还是喜欢为我服务?你就回答:“全都是(法语)”。

然后,这位瑞典小伙子每天练习背诵这三个答案的法语。当他见到拿坡仑的时候,拿坡仑问他第一个问题:“小伙子你在我这里参兵多少年了?”他说“28”;拿坡仑心想自己的军队建立并没有28年;“你多大了?”他说“3”,拿坡仑已经怒不可遏,他气氛的问道“你有病还是我有病”小伙子回答“全都是”。

从这个笑话中我们不难看出,瑞典小伙子接触的数据纬度很少,只背诵答案,却没练习问题。对于数据应用企业来讲,如何获取到更多纬度的数据才是更重要的事情。

但是在我们获取数据的时候,这些数据存在很多问题:

1、版权。数据有产生和消费两方面。如果没有良好的保护数据版权的机制,那么在数据流通过程中,数据版权归属问题无法判定,数据价值也将会形如泡影。

2、质量。实体物质比较容易判定质量优良,比如我买的鞋,穿两天坏掉和穿很久坏掉,就可以很清晰的感知哪一双质量好。那么数据如何衡量质量呢?

3、合规。个人数据的重要性尤为凸显。那么在服务用户的过程中,如何在合规范围内利用个人数据产生更大价值?

4、指导。今天大家都在热炒如何将数据变现。什么数据在什么时间会变成什么价值?尤其是,谁能够指导我应用数据?

5、集成。当不同的数据快速集成的时候,如何提效率降成本?

今年京东的开年大会上,刘强东指出,京东未来发展的十二年主要有三样东西:技术!技术!技术!同时他仍强调客户为先的发展理念,提升用户体验、降低用户成本、提升用户效率。其实这就是我们一直在追求的东西。

版权:数据权属问题如何解,区块链恰逢其时

首先,聊一聊版权归属问题。数据是一个数字性的产品,在流通过程中存在倒买倒卖和正版数据难寻等问题,如何改变现状?交易过程中什么成本最高?信任!那么,首先需要解决的就是最基础的信任问题。如何解决呢?区块链!

据麦肯锡的研究表明,区块链技术,是继蒸汽机、电力、信息和互联网科技之后,目前最有潜力触发第五轮颠覆性革命浪潮的核心技术。

咱们简单谈谈什么是区块链?区块链可以理解为一个帐本系统,在互联网上的任何一笔交易,都会在这个帐本中进行记录,它的公正性是由大家一起公正的。可以想象每个人手中都有相同的数据库,没有人有权利对原始数据进行篡改,所有人的行为都会记录下来并且同步。

这是2008年由中本聪提出的概念,今天我们把这个技术用在数据流通过程中,把数据变成一种虚拟货币,让它在区块链上进行流通。《经纪学人》杂志上说过这样一句话:区块链是制造信任的机器,我们希望利用区块链技术,在数据流通过程中创建整个互联网的信任。

智慧时代需要数据不断快速流通,降低成本,提升效率,那么在这种信任成本如此低廉的情况下,机器和算法之间如何快速交换数据,变得尤为重要。每一笔数据都有数据证书,每一笔数据在本地都有证明。这些数据在区块链上像货币一样进行交易,由区块链来保证在数据流通过程中建立信任,通过区块链的溯源方式,让每一笔数据在流通过程中都可以智能的记录下它的主人是谁?在哪些人手里流转?流转了哪些路径?让每一笔数据都具有智慧。

质量:数据如何流通会更好?

这里我们讨论另外一个话题,就是数据如何流通?在我们看来,数据流通有两种形式:一种叫数据块,无具体形态被打包的数据在互联网进行流转;第二种叫API,这是种非常流行的数据流通形式,就好像两个人之间的交流,一问一答。通过一步步的通关密码逐渐获取你所需要的答案。那么如何使机器之间有效率有质量的沟通?

可以从5个维度来看:响应速度、负载能力、吞吐量、并发能力以及容错能力,这是在进行数据质量调研过程中避免不掉的关键点。如果想做有效的数据流通,那么必然需要衡量:数据在合理流通过程中,提高流通质量与效率。

如果你真的想把数据流通好,需要衡量出这一点:数据在合理流通过程中要提高流通效率,也是今天需要面临的一个很重要的问题。

合规:个人授权服务,让数据流通成为可能

个人数据在各行业也开始广泛应用。如何证明你是你?社交平台如何证明你是你?社会怎么证明你是你?最终会面临这样的尴尬:只有到公安部才可以证明“你是你”。

对于公安部来说,在线上有你的身份证ID,在线下有EID。通过互联网进行授权,再通过互联网授权和EID相结合的形式,把数据授权和流通各个环节记录到具有不可篡改特性的区块链中,以证明数据流转的安全性和可信性,保证整个数据流通的安全可追溯。

指导:如何使用数据?

数据如何应用到我的行业?如何集合更多数据,成就企业价值?什么数据对企业是有效数据?在数据应用的过程中,还需要的一项是经验共享。如何将人与人之间有社交网络模型应用到数据之间?这是另外一个需要思考的话题。

这种数据的关联性,在电商行业较为突出,用户在京东上购物,会提示与本书类似的书籍有那些?或者买了这本书的人还关注了哪些书?用户可以通过这个关系模型,打开眼界;平台通过这样的方式,增加商品流通的纬度。那么,如何使用数据,如何增加更多的纬度,也是一个需要研究很好的方向。

从数据类别、名称、应用行业、应用场景等维度生成数据流通网络图谱,用该图谱使行业与数据的关系、热度得以清晰呈现,指导数据需求方找到目标行业最需要关注的数据,并指导数据提供方拓展数据方向、有的放矢。

集成:如何把数据联合起来?

最后,今天纷繁复杂的数据当中,如何删繁就简、降低成本、提升使用效率?将异构的数据统一接口,增强访问和集成数据功能,我们称之为数据联邦。那么首先,如何把这些数据联合起来?就需要统一一个集成的形式。从不使用数据到使用数据,到收集数据,再到混合更多的数据,智慧集成就成为一个很大的话题。

在所有的数据之上,架起一座桥梁,通过公用的语言,混合成可识别的结果。

对于今天来说,我们需要变得更加的智慧;对于智慧来说,我们需要更多的数据;但是对于数据流通来说,现阶段存在着种种的问题需要我们来一起合作。

最后,我想用罗振宇的一句话来结束我的演讲:“只要他试图通过提升自己的认知,和更多的人达成协作,做一件前所未有的事,他就是一个创业者”。 在智慧的今天,我们更需要更多的人达成协作,做成一件前所未有的事,让我们变得更加智慧。

好,我今天的演讲结束,谢谢大家!

原文发布于微信公众号 - 数据猿(datayuancn)

原文发表时间:2017-02-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

业界丨周鸿祎当了一把“直播网红”,谈360在人工智能上走过的坑

编者按:2016年12月6日晚8点,360公司董事长周鸿祎做客直播间与网友互动,大谈对人工智能的看法。本文已得到公众号“大佬微直播”授权,雷锋网在不改变愿意的基...

3718
来自专栏数据猿

投稿 | 现阶段我为什么不看好纯粹的数据交易?

原力大数据创始人江颖表示,尽管大数据交易平台建设正值爆发期,数据交易号称的市场规模也在不断壮大,同时也有国家大力的政策支持。但是短期内,我仍然不看好数据交易,因...

3424
来自专栏PPV课数据科学社区

如何系统学习数据分析?

很多学习数据分析的同学也都有这样一种困惑“为什么学了那么多工具,还是不会数据分析?”,原因无外乎两个,一是只学到了碎片的知识,没有建立知识之间的连接,无法形式自...

3028
来自专栏罗超频道

李彦宏的新专利和Google对话搜索有何不同?

文:罗超,封面图:李彦宏在2015年极客公园创新大会演讲 近日,李彦宏参加了极客公园一年一度举办的创新大会,主持人与李彦宏聊到了他最近申请的一个专利吸引了我的...

3448
来自专栏钱塘大数据

观点丨为什么人工智能是中间阶层的噩梦?

导读:面对人工智能的突飞猛进,从经济到产业,从政策到法律,从社会到伦理,我们真的已经做好准备了吗? 12月6日,亚马逊即将开业的线下生鲜实体店AmazonGo...

3818
来自专栏企鹅号快讯

如何快速高效地学习互联网新技术

我们生活在一个振奋人心的时代,区块链、人工智能、大数据,现在各种新技术层出不穷,那么如何快速高效地学习互联网新技术呢?我认为首先思想要主动求变,敢于跳出自己的舒...

2086
来自专栏DT数据侠

从“芯”领略人工智能 | 数据科学50人·吴强

吴强博士,毕业于普林斯顿大学计算机科学专业,现任地平线 CTO 兼工程院院长、南京研发中心总经理。他曾先后任职于 INTEL、AMD、Facebook 等科技巨...

1702
来自专栏新智元

【AI 引擎】84岁新华社启用机器人记者 | 不需要降落的无人机 | 基因编辑工具CRISPR 2017前在人身上测试

1、“快笔小新”上岗了!84岁新华社启用“机器人记者” ? 2015年11月7日,在84岁生日来临之际中国国家通讯社新华社将迎来机器人新“员工”——“快笔小新”...

2264
来自专栏机器之心

业界 | 医疗AI应该更关注「数据」还是「人」?数据工程师反思机器学习模型的力量

最近,《华尔街日报》的一篇文章——《Models Will Run the World》(模型将玩转世界)在网上流传。我相信这种观点在很大程度上是有道理的。机器...

942
来自专栏DT数据侠

从“芯”领略人工智能 | 数据科学50人·吴强

吴强博士,毕业于普林斯顿大学计算机科学专业,现任地平线 CTO 兼工程院院长、南京研发中心总经理。他曾先后任职于 INTEL、AMD、Facebook 等科技巨...

1712

扫码关注云+社区

领取腾讯云代金券