首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >涂子沛:数据之巅通向智能社会

涂子沛:数据之巅通向智能社会

作者头像
大数据文摘
发布2018-05-21 16:47:47
5810
发布2018-05-21 16:47:47
举报
文章被收录于专栏:大数据文摘大数据文摘

7月4日,由中关村科技园区管理委员会、中国科学院国家科学图书馆主办,北京长风信息技术产业联盟、神州数码“发现城市”创新论坛承办,中关村社会组织联合会协办中关村创业论坛第108期在国家科学图书馆举办,结合“大数据时代,中美IT产业是否将‘分道扬镳’”等话题,知名大数据专家涂子沛发表了精彩演讲。涂子沛通过对美国谷歌无人驾驶汽车对大数据的采集和运用总结认为:使用数据的巅峰形式是机器学习,即通过向机器喂取数据,让机器产生智能,自动地为人类完成任务。

以下为涂子沛发言主要内容:

很高兴今天跟大家分享我对大数据的看法我的演讲题目是“数据之巅通向智能社会”。

为什么说是“巅”,先来破一下题。我觉得“巅”有三个维度,我的新书是文化维度,登上数据之巅看数据文明是怎么兴起的。第二个,这个时代使用数据巅峰的形式是什么?我的结论是让机器学习来使用数据,实现智能化。大数据的兴起标志着社会向智能化的社会迈进和转型。第三个巅的意思,大数据需要站在巅峰之上、需要顶层设计。

我们从这三个维度来看今天的演讲,今天的演讲会从四个定律来认识大数据、展望大数据的未来。刚刚戴秘书长说了时下最热的话题不是大数据,而是世界杯。刚才提到了大数据的另外一个维度“赌球”,我们看看德国队现在是怎么训练的。德国队已经把传感器装到了每一个队员的身上,装到了足球上面。一场比赛下来6000万条记录,一个球员控球时间的长短、传了多少个球、奔跑的加速度是多少、奔跑的长度是多少,这些全部都可以计算。我们可以看到一个精细化的管理,数据给我们带来了精细化的管理。从这个案例来讲是数据是收集来的,把传感器放到足球和队员的身上而收集来的。

第一个定律是“数据是人为的现象”,一切的数据都是人为收集的。数据有三个来源,一个是测量,第二是记录,第三是计算。正是因为所有的数据都是收集来的,我们说要建设好大数据一定需要顶层设计,这个设计首先要从收集开始。到底什么是数据呢?我们到底收集了什么呢?在前信息时代数据意味着对客观世界的测量,它是有一个有根据的数字。进入了信息时代之后,数据的内涵其实发生了深刻的变化,为什么?就因为计算机产生了。计算机产生之后有一个新的名词叫数据,音频、视频都统称为数据,视频的内涵扩大了。不仅内涵扩大了,容量也发生了变化。

现在Twitter上一天产生的数据量相当于以前一百多年产生的数据量,这部分微博、微信数据称之为非结构化的数据,因为这部分数据的爆炸引起了大数据时代的到来。

第二个定律,我们有大数据的定律,什么是大数据?我的定义是传统的小数据+现代的大记录。现在的大记录就是指音频、视频,它的来源是源于记录事件,传统数据是来源于测量事件。

接下来看数据有什么用?传统的小数据和现在的大记录到底在怎么样影响我们的生活?我们说数据对生活当中的作用由来已久,不是现在的事情,可以在历史中追溯到很早。我们以美国为例,美国《宪法》当中有很多数据的因子,美国在立国的时候就强调用数据来管理。最典型的例子美国在立国、立宪的时候怎么去分配国家的权利,最后争论的结果国家的权利要按人口多少来分配。他们就说每十年要进行一次人口普查,这是二百多年以前挨村各户普查,按照这个地区人口的多少去分配议员。

人口普查有什么作用呢?在未来发生重大的作用。立国之后的南美战争,南美战争是后来的一个概况,为什么会打南美战争?当时南美双方拼命的辩论,北方说我们的制度好,要自由。北方的图书馆、农产品、工业品、教会、学校都比南方多,所以制度更加优越。南方说不是这样的,南方说你们总体人多的,但是我们效率更高,整个社会总是要有脏活、累活有人干。你们标榜着自由,但是有更多的问题,残疾人也高。最后战争怎么打起来的呢?还是因为人口的差异,人口普查是最后南方的敌人,所有的事件都要到国会去辩论,这时候越来越多的移民选择了去北方,没有去南方,所以北方的议席越来越多,所以之后就产生了打架。

我们再看打仗,这个就说到了将军谢尔曼,谢尔曼当时带着6万大军去攻打亚特兰大,打完了之后就说,我要切断后勤,不要补给。带着6万人不要任何粮草打到东海岸去,这个战役叫“向大海进军”。

大家可以想像兵马未动、粮草先行,现在粮食都不要那怎么打?他根据人口普查的数据哪个地方有多少头牛、多少匹马、家禽,他把部队分了五路大军。在地图上算这个东西走到这里,这个部队走到这里粮食能不能够支持到。后来证明了什么?后来证明这些数据非常有用,6.2万人一个多月没有任何不及打到了目标。谢尔曼被认为美国历史上具备现代意义的将军,为什么?因为他会使用数据。这个是谢尔曼的回忆录,“这场战争濒临结束之后种种事件证明,没有数据我赢不了”。这也是他写给美国人口普查局局长的信。

我们再说人口普查,人口普查不仅在政治、经济、社会中有重要作用,而且驱动了全人类社会迈向了新世界。为什么?因为美国人多啊,一次普查数据完了之后要七年、八年最后数据才能整理出来,就推动了技术创新,就产生了什么?产生了打孔机,产生了第一个数据之父霍尔瑞斯,也是后来的IBM。第一台商用计算机,第一个客户就是人口普查局,因为第一个项目也是人口普查。

回头看当时美国的人口普查是政治决定,但是这个政治决定却推动了美国社会最后登上了信息技术的巅峰,改变了整个人类社会的进程。我们刚刚讲的在政治生活、军事生活、经济生活当中的应用。再看看文化生活,文化生活有一个很著名的案例。

第三个定律,人类的政治、经济和技术生活是靠对数据的规定、解释、处理和探索展开的。我们再来看文化生活,大家知道《纸牌屋》,大数据的电影。要说大数据驱动了电影第一部是《乱世佳人》,这就说到美国第一个具有现代意识的数据大师盖勒普。这个电影出来之后盖勒普做了两年的调查,好莱坞的制片人完全按照这个数据来打造电影,这部电影到底拍多长,上集、下集、彩色、黑白,以及用谁做电影,全部用数据调查。当时的制片方一塌糊涂,全部按照盖勒普做的调查。盖勒普做了什么调查?用谁做女主角,最后是拍成彩色的,拍成四个小时的。最精彩的是盖勒普预测这部电影最终的票房是5650万。我们看第三点是5650万,当时美国有1亿多人,这部电影一共上了四轮,每一轮盖勒普都会告诉他这部电影在哪个城市里多少人看,群体是屌丝还是精英,票价、广告策略做什么调整,全部按照数据去做。最后的票房是5997万。

通过《乱世佳人》这个电影,好莱坞对盖勒普五体投地,盖勒普华丽转身成为了观众调查研究所,把数据驱动的方法带到了电影行业。

我们再来看看,看了历史再来看今天的现在。今天的大数据给我们生活带来了什么样的影响?我们注重看一个东西,设备越来越小,传感器无处不在。传感器在干什么?传感器在收集数据。一句话是万物皆联、无处不计算。再举几个例子,这几个例子在我的书里面都有,具有各种各样的传感器不停的在收集数据,比如埋在土里面根据土壤的湿度、结合空气的温度,能够确定花坛或草地什么时候开始浇水或者浇多少水。大数据最终导致的是大计算,我们在迈向计算型的智能社会。

还有最经典的例子,那就是Google的无人驾驶汽车,也是大数据驱动的。首先要收集数据,首先是街景式的去收集数据,然后有无人驾驶汽车到路面。

然后说这个时代我们在干什么?我们在沿着这样的路径在前进,从数据到信息到知识再到智能。所谓的智能是通过像机器获取大量的数据,让机器自动的计算、自动为人类服务完成一些任务实现智能化。

我们来看最后一条定律,我们未来的世界或者说现在的世界是什么样子?数据驱动的世界,软件在定义世界,软件定义世界还可以再分一下,谁在写软件?程序员在写软件。程序员在用代码和数据重新定义这个世界的流程,不要看不起IT男,我们在重新定义这个世界,我们通过软件重新定义所有的流程,数据是我们迈向智能社会新的土壤。

我的下一本书《大停滞》,就在分析智能社会,我们即将迈进智能社会,这个智能社会有许许多多的挑战我跟一个美国经济学家合作,他在写美国的挑战,我在写中国的挑战。

最后做一个结论,这个时代用数据说话远远不够,我们要改变思维方式。我们现在要从数据当中寻找知识、启迪、规律,用数据去预测未来,用数据去管理社会,但是这还不够。我们还要用数据创新,像Google的无人驾驶汽车一样,因为我们正在迈向一个智能型的社会,所有的创新都离不开数据。

摘自:和讯

【涂子沛简介】

江西吉安人,现居美国硅谷。2012年其著作《大数据》在中国社会开大数据之先河,引发了大数据战略、数据治国和开放数据的讨论,历史学家许倬云先生盛赞其“为华文世界开创了一个重要话题”。2014年《数据之巅》为作者第二本著作,全书对大数据追根溯源,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,必须把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。作者本科毕业于华中科技大学计算机系,研究生毕业于中山大学和卡内基梅隆大学,获公共管理硕士和信息科学硕士学位。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2014-07-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档