【观点】大数据专家舍恩伯格最新演讲全文

6月19日上午消息,第十二届中国国际软件和信息服务交易会在大连世界博览广场开幕。本次会议时间为6月19日-22日,聚焦智慧城市、云计算、物联网等技术热点和产品服务,主题锁定为“智城市,酷生活”。

维克托·迈尔·舍恩伯格:最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互 联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中心网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。有一百多篇论文公开发表在《科学》《自然》 等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。《大数据时代》一书作者。

以下为舍恩伯格在大会的演讲全文:

非常感谢给我这样的机会,能跟大家在一起进行这样的介绍,非常高兴能够来到大连,来跟大家聊一聊大数据的重要性,因为之前我们说到云的快速改变,在过去一段时间改变我们的生活,我想说一下大数据对经济的含义和对商业的含义。

大家都在说大数据,大数据到底有多大?到底有多少信息说到ZB字节,我们说10的21次方,这是什么意思?它的含义是什么?它如何发挥作用?我们看一下这张图,它给我们显示的是数据随时间流失的发展趋势,我们看一下它在背后告诉我们的故事是什么?1987年,也是很久,那个时候我在大 学,1987年数据世界还没有达到30亿GB,这是1987面的规模,2007年的时候增加到3000亿GB,所以20年间数据的数量增加了100倍。如 果说回到历史的话,看上一次,数据像这么快的增长,那个时候是数据翻一番的,那是50年间,因为印刷的革命,带来了数据翻一番的增长,20年间实现的,这 是历史,我们看一下颜色,深色是数字信息,浅色是类比信息。

这对我们来说意味着什么,我们看一下我们的图片,如果每一分钟对这匹马进行拍照是这样的;如果每一秒钟对这匹马进行拍照,是这个状态。如果是六十分之一秒照一次相,就会有连续的动作,所以我们创造了影片。

新的对世界的理解,我们有更多的海量的数据及相关的数据联系起来,我也要跟大家解释一下,这个更多的意味着什么呢?意味着更多的和数据相关的或 者问题相关的一些数据,我们可以让数据说话,我们如何了解这一点呢?如何真正的理解它呢?我们再想一下照片,如果我现在要拍一个照片,把所有人都拍进来, 我必须要有聚焦,我必须要选择对我来说什么是重要的,是第一排的还是后面一排的,如果我关注的是第一排的人,那遗憾的是后面一排的人就看不到了,因此我必 须要进行一个选择,目前在收集数据时进行选择,什么是重要的,什么是不重要的,但是很多时候我不知道什么是重要的,什么是不重要的,这种情况下,有些数据 丢失了,我们要考虑一下。

这张照片是我四岁的儿子,这不是正常的照片,是大数据的照片,是大数据的相机拍下来的, 这样的话,我儿子就聚焦了,我可以把我儿子聚焦,也何以把牙刷聚焦,因为我把所有的数据都收集了,我可以让数据说话,而且可以用这些数据来回答问题,或者 回答我之前没有的问题,一旦我收集了这些数据,我们可以 做到这一点,因为我们把所有数据都收集到了,我有这么多数据,可以做一些工作,因为我在某些方面丢失了一些东西,在某些方面就获得了一些东西,我们必须用 全新的视角考虑世界。

过去我们考虑世界的时候是以因果的关系考虑世界,我年轻的时候,我爸妈跟我说,在冬天的时 候,出去戴上帽子,否则会感冒,因此他创造了这样一种 因果关系,就是不戴帽子就会感冒,尽管并不是如此,是有一些病毒会导致感冒,而不是戴不戴帽子导致感冒。这就是过去的时间里,人们想理解世界是通过因果关 系的连接,我们想要了解到事物后面的原因是什么,来了解世界。我们想了解为什么,尽管我们不知道发生了什么事情,在大数据时代我们可以了解发生了什么事 情。

沃尔玛可以对收集的数据进行分析,比如一个飓风侵袭了某个地方,可能会对他们产生影响,比如人们会买一些苞米 花,美国人经常买苞米花,但是到现在也不知道为什么买苞米花,但是他们把这个东西拿出来,可以看出销售增长了30%,这个数据之间有更多的相关性,因为这 些卖家他们更好的了解了这些数据, 对这些数据进行分析,了解它的地点,地点可能不太容易获取这样的信息。现在在日本,研究者们对我们的姿势进行了一个分析,为什么这么做呢?好象说姿势很独 特,而且可以对他进行利用,进行抽取数据,怎么做呢?可以用来防止小偷,一个小偷进了一个车,手的动作,我们通过这个方面进行分析哪个是小偷。

这是谷歌的眼镜,第一版不是那么强大,第二版可以有更多的信息,我们可以分享一下,这个数据价值非常大,我们可以了解一下,她看了什么东西,她看的 是广告板 吗?看的是某一个商场,看的是某一个人,我们可以看到这些数据。也就是说,数据让我们获得了一些数据源,结果是什么?第一个结果是我们如何进行营销,我们 如何把我们的东西更好的卖出去,亚马逊很好的利用了这一点,我们都知道亚马逊,而且我们知道它的一个推荐,他会给你推荐产品,他有推荐的软 件,我们可能感到很惊奇,但是刚开始的时候,亚马逊聘请了工程师对它进行设计,这个工程师设计了推荐的引擎,是基于买家30种不同的行为进行推荐,推荐的 是之前预先定义的品类,亚马逊的工程师说这是一个灾难,好象你去购物,好象一个很愚蠢的人不知道自己怎么样去购物,亚马逊说会从小数据转向大数据的思维, 而且不是预先定义的品类,不再这么做了,我们看在大数据领导是什么样的状况?我们把它一项一项推荐,现在大概占到亚马逊销售的30%,就是让数据可以说 话,而且这对我们来说是全新的变革,比如在制造业方面,我们可以想到100年前,亨利福特生产了福特的汽车,那是了不起的创新,是工业革命的初期,现在有 红色、蓝色或者白色的汽车,亨利福特说可以有任何颜色,只要颜色是黑色的话,因为他们只能生产黑色的车,大量生产和制造,那个时候亨利福特的工厂没有买家 的数据,他们也不知道生产什么颜色的汽车,也就是生产界可以有很大的变化,也就是灵活的生产,也就是为客户量身定制,生产他们所需要的东西,而不仅仅是生 产唯一的东西,客户没有什么选项。

第三个转移或者变化就是我们了解数据的价值。过去我们可以用数据来帮助销售更多 的产品,在大数据的时代,数据本身是一种资源,这也改变了我们业 务的模式,甚至说在传统的制造业企业里面,比如劳斯莱斯,劳斯莱斯过去是生产飞机的企业,而且营业额也很高,利润也很高,但是后来随着飞机的发展,他们在 里面有一些软件以及硬件来对发动机进行改进,因此他们可以获得很多的数据,他们现在有一些资源了,劳斯莱斯改变了自己的营业模式,过去是销售产品的公司, 现在这个公司销售的是服务,也就是固定费用的维修服务,尤其是针对全球各地的飞行公司,生产飞机的公司提供服务,因此如果能够很好的了解,数据本身可以成 为资源,可以带来价值。

我们再来看移动电话的公司,我们看这个图,这个不是手机的发射塔,电信行业现在面临很大的 困难,主要是价格的问题,因为价格的竞争非常激烈,我 们不想通过价格来竞争,我们想通过价值来竞争,怎么做呢?应该认识到你有什么样的机会和资源,一个移动手机的运营商,在荷兰有一个很好的例子,信息的强度 是不一样的,因为天气的不一样,发射器的信号强度也不一样,我们可以利用信号的变化来预测天气,比如降雨或者湿度,我们有很多这样的发射塔,他们突然想到 有很多这样的天气预测,真正实现了实时的传递天气预报的信息,基本是免费的。现在还有一个有趣的观察,全球没有一个国家,除了英国之外,英国对天气感兴 趣,所有人都会对当地感兴趣,除了英国之外,英国对全国天气感兴趣,荷兰的手机运营商有新的业务模式,可能成为全球最佳的天气预报的服务商。

创造一种新的价值,或者新的资源,而且我们可以看到手机的信号发射塔,他们会有不断的信号传来,这是新的业务模式,这个发射塔是收集信息的平 台,以非常低的成本收集信息,因此有很多新的机会,同时也会有新的竞争者,没有任何业务的领域,都是新的,因为总会有新的人加入,因此你不会永远保持在新 的状态。

我们看汽车行业,汽车在不断 的发展,而且是革命式的速度在发展,过去几年最大的创新是什么?无人驾驶汽车,谷歌在这方面研发速度非常快,已经有 几十万的历程,而且成为了这方面的专家,第一次在交通灯停下来的时候,发生了一次撞击,是因为驾驶人员决定把计算机关掉自己驾驶,不然是零事故的,为什么 是BMW研发的?不是奔驰研发的?因为他们没有看到新的机会,谷歌成为了新的竞争对手,看到了新的机会,当然也是新的竞争。

再来看健康和医疗,之前是结果非常完善的行业,如果我感冒的话,如果我吃阿司匹林,我要么吃多了,要么吃不够,因为剂量是 针对平均患者的,我和平均患者是不一样的,我们都不同,每个人都是不一样的,都有不同的DNA,不同的新陈代谢,有不同的严重程度,但是我们吃同样的剂 量,为什么?因为在医疗 行业没有数据,让他能够更加的定制化,有了大数据以后,我们能够走向个人化、个性化了医疗,不仅能延长我们的寿命,还能提高我们的生活质量,能够让我们更 快的获得医疗。

再考虑另外一个方面,之前没有想到大数据的影响,就是人类学习。我们现在对学生测试,他们学的多 好,多蠢啊,我们没有想到的做法就是我们看他们 的学习方法,我们的书、我们应用的教学方法,我们没有测试这些教学方法,我们还用过去200间使用的教学方法,我们知道是否有效吗?不知道有效性,为什么 继续使用呢?因为我们没有数据,不知道,这个点要改变,而且改变速度会比你想象的快。

我们有这样的应用,曾经上百 万人在用,这个应用能够帮助你学习语言,非常漂亮,很有趣,是个游戏,很有意思,因为有千万级的用户,保存了这样的 数据,他们知道西班牙人怎么学英文,中国人怎么学英文,有了这样的数据,他们发现,西班牙人教授英语哪些方法是错误的,应该改变这些方法,改变的方法能够 很快的提高学习的结果,这个是以结果为导向的方式。

有这么一个人叫做专家,就是以自我为风格的这些专家,大家都知 道,很了解这一类人,一般年纪要大一些,坐在那儿,声音非常洪亮,我知道正确答案 是什么,相信我吧,有时候他们只是装一下,但是没人敢说,没人敢挑战他们,因为他们有权威,你没有任何可以驳斥他的数据,将来这个局面会改变。

举 个例子,有这么一个公司你肯定听过叫做谷歌,41种不同的蓝色,他们有个首席设计师,进行测试来选择一个颜色用于设计,大概是两个象素,他说 一定要是这个蓝色,为什么呢?上司说有没有进行数据分析, 设计师说我是设计师,我知道,上司说我不相信你,我要进行测试,设计师说你要强迫我进行数据分析 我就辞职,因为我是设计师我就是知道,所以这个设计师的上司说你的辞职报告我接受了,你被解雇了,41种不同的蓝色,他发现差别非常细微,能够创造多的多 的点击率,最后能够把年营业额增加几百万美元,他真的把这个设计师解雇了,所以要记住这一点。

未来如何改变一个组 织和机构?大数据是看待现实新的角度,不仅改变市场营销,改变生产制造,改变我们从事商业的方式,因为数据不再说你能不能 做,而是数据本身就是唯一的资源,就成为一个价值的资源,一个来源,也就是对我们来说意味着新的商业机会,没有哪一个行业有这种竞争的免疫能力,都将会受 到这个影响,包括医疗、包括学习,所有的机构,无一幸免,都必须要能够适应大数据,他确实说得上是一个革命,所以要不断的学习,谢谢大家!

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2014-06-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

不只针对AI!微软CEO提出10条AI和人类行为准则

14920
来自专栏镁客网

「公开课实录」幻境视界周志强:艺术+VR,一次非冲动的完美跨界

18240
来自专栏科技向令说

响铃:17173赵佳:媒体要呈现的价值,就是游戏圈寻找的用户价值

游戏厂商、玩家、媒体及相关从业者的年度盛典ChinaJoy圆满结束了,除了精彩纷呈的热游新游、酷炫的游戏科技,CDEC会议上17173媒体群总经理赵佳在演讲中关...

9130
来自专栏人称T客

IBM联合Salesforce 要搞死微软占领AI

T客汇官网:tikehui.com 撰文 张珅健 IBM、Salesforce宣布要强强联合,推出Salesforce的Einstein平台,将微软赶出IBM,...

40860
来自专栏西安软件开发

软件开发公司人难招与程序员前途渺茫的对立困局原因分析

软件开发行业流传着一句俗语“程序员有三宝,钱多、话少、死的早”。但是每一个程序员都不是天生的程序员,都是通过后天努力而达到的程序员,这其中的艰辛与苦就是所谓的说...

7630
来自专栏程序员互动联盟

IT技术人员,经常思考的15个问题

行内的人自嘲是程序猿、屌丝和码农,行外的人也经常拿IT人调侃,那么究竟是IT人没有价值,还是没有仔细思考过自身的价值? 1.搞IT的是屌丝、码农、程序猿? 人们...

36850
来自专栏大数据文摘

寻找阿托卡之旅:量化投资一席谈

23490
来自专栏VRPinea

押注AR:Oculus正秘密建设孵化团队,打造AR硬件

25630
来自专栏数据猿

数据猿专访 | 艾漫数据总裁曹永寿:我们是一家最懂“文艺”的大数据公司

<数据猿导读> 艾漫数据是一家为影视产业提供大数据服务的公司,比如,利用大数据为电影预测票房,剖析艺人商业价值,评估电视节目等。可以说,艾漫在大数据领域中非常懂...

38780
来自专栏新智元

【达沃斯论坛】人工智能发展到了哪一步?

看似巧合,从《星际穿越》《火星救援》《2001太空漫步》到热映的《星球大战》,无数科幻片的主角身边,总有个机器人助手或者人工智能协助系统。这就是人类设想的未来吗...

28650

扫码关注云+社区

领取腾讯云代金券