前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >对话涂子沛:数据不是工具,是社会基石

对话涂子沛:数据不是工具,是社会基石

作者头像
小莹莹
发布2018-04-19 16:09:44
5320
发布2018-04-19 16:09:44
举报
文章被收录于专栏:PPV课数据科学社区

【悦读客】:2012年,您的著作《大数据》引发了人们对大数据的强烈关注与思考,是什么原因驱使您写作了第二本有关大数据的书籍《数据之巅》?

【涂子沛】:第一本书是中国最早的一本大数据的书,那本书谈的还是现象,由现象引发的一些思考,我对大数据认识的过程也是循序渐进的过程,当认识到大数据不仅是个技术革命,不仅是商业管理革命,而且是社会革命,引起社会方方面面的变化,它和云计算不一样,云计算就是一个单纯的技术革命,一种技术的重新架构,当我的第一本书受到关注的时候,我便有一种使命感,应该把第二本书写出来,第二本是从历史的角度,我想传递的是种数据文明,数据文化,从而引起全社会的重视,还要掌握未来,未来是什么样子以及我们在全世界的竞争中处于一种什么样的地位,我只是想对咱们中国提一些战略性的建议,在与美国历史这种对比之中发现我们的不足与弱点。所以我专心在家用了八个月的时间写就这本书,这本书的价值我自己认为比第一本书的价值更大一些。

【悦读客】:您从开篇便讲到美国的人口普查,您是怎么想到以人口普查作为切入点的?如何看待人口普查对整个数据时代的意义的?

【涂子沛】:我们这本书是数据之巅,为什么是之巅呢,因为数据是个人为的现象,全部是人书写的,要是没有人就没有数据,所以数据是需要顶层设计的,大数据的设计需要顶层数据,这也是数据之巅的一层含义,那我们说一个国家的数据中什么是最基本的数据?就是国土多大,人有多少,所以人是最基本的,人口普查在政治、经济、军事在整个美国历史上起到很大的作用,有些作用还没有写出来,但是最后因为人口普查的数据太大了,每次人口普查都耗费多年,后来有了二进制,引领人类社会进入了信息时代,我们说什么是最基本的数据,有多少人,但是要算清楚多少人这个问题太难了,即使今天算清楚都很难,问题是人不停地出生死亡,要算清楚非常难,这是最原始的问题也是最具挑战的问题,也是个数据量非常大的问题,所以最早的大数据就是人口,比其他数据都要大。美国的人口普查也是阴差阳错,他也不知道因为人口普查有一天信息社会就这么产生了,但是他们很认真,没有说因为这个难做就不做了,他们当时用人口普查来分配权力,然后逐步扩大。

【悦读客】:所以您查阅了很多有关人口普查等等这些美国历史的资料。

【涂子沛】:我是学工科的,但是我从小就喜欢读书,书读的不少,有人评价这本书是用数据谱写了美国历史,我在写这本书的时候是重新把美国统计史、人口普查史、工业普查史、农业普查史都看了几遍,需要在所有这些资料中寻找到哪些是有意义的点,有建设性启发性的点,把它挑出来。

【悦读客】中国对待数据文化与国外对待数据文化的理念有很大区别,比如中国人对数字的概念缺乏一个理性的描述和陈述,他们更习惯于用所谓的程度词来形容,比如差不多,深、浅、多、少,但这又是基于中国从古至今深入人心的传统所致,您认为两者区别在哪里?

【涂子沛】:区别在于哪里呢,就在于我们还仅仅把数据当成工具来看,符合我们利益的我们会用,不符合我们利益的我们就不用,但是西方社会比较好的一点比如美国,它把数据当做基点和基石来看,所有的角色都建立在上面,首先反映的是事实,我们得尊重它,一切从事实出发,把它作为角色的基础,认为数据是神圣不可侵犯的,事实是不可侵犯的,因为数据最根本的是对客观世界的建立。

【悦读客】:那中国的这种对数据文化的传统思维方式能改变吗?

【涂子沛】:当然能改变,这就上升到文化层面上,所以我提出了口号“科技符号”上升到“文化符号”,让大家都有精确的意识,都去追求精确,可以有很多方法去描述事实,用文字来描述,用色彩描述都可以,但用数据描述是最精确的事实,大家应该尽量用数据去描述,所以我希望中国能向西方学习,用数据去描述事实,追求精确、理性与逻辑。

【悦读客】:中国在数据文化上一直落后于国外,但也会有诸如陈正祥这类的大家对数据潜心研究,您觉得中国落后于其他国家形成成熟的数据文化体制的原因是什么?

【涂子沛】:原因很多,最大的原因是我们封建体制比较长,人治社会的历史很长,我们的数据文化不发达,我们的数据文化停留在一种工具基础上,停留在丈量田亩、兴修水利、分配劳力、计算税收、运输粮食等实用上。我们是木匠数学,没有强调去追寻一个公理、定理,抽象性的数学使用原理没有发动起来,这是第一;第二人治的社会,事实是极端被扭曲的,所以数据文化中尊重事实得不到认可,整个社会的事实得不到尊重,然后我们中国的传统文化当中又强调混沌、含蓄、大而化之等等这些东西。我们中国讲究模糊美,认为这种模棱两可某种程度上是种美,的确有时确实是种美,但是到现在的商业社会,就不适合社会发展了,就必须去扬弃。

【悦读客】:所以您认为数据这样一种理性的东西也是一种美?

【涂子沛】:数据就是精确的事实,一是一二是二,是科学的载体,是科学的语言和出发点,没有数据就没有科学,所以数据之美就是科学之美,所以社会一定要讲科学,讲数据。

【悦读客】:您在书中说到,美国的数据安全制度早在镀金时代就已经开始建立并逐渐完善,现在美国的数据安全制度的完善程度如何?您认为中国的数据安全制度还有哪方面需要向美国借鉴的?

【涂子沛】:美国有数据的锁定制度,是指数据的决定权是在专业人士手里,行政长官是没有权力掌握和介入的,比如要新闻发布了,提前十五分钟告诉部长,然后部长来发布,这个制度也是在不断完善,前两年奥巴马大选,那个时间美国失业率一直很高,但是在奥巴马投票竞选的时候投票率降低了,所以有人质疑奥巴马,很多人包括GE前总裁韦尔奇,质疑奥巴马是不是修改了数据,当时他的质疑在当时美国社会引起了很大的反响,很多人都笑韦尔奇说他根本不懂美国的制度,奥巴马根本不可能更改数据,很多统计学家站出来捍卫奥巴马,并要求韦尔奇道歉,我们能看到,中国的数据安全制度则相对来说差一些。美国人口普查只能经过公民同意之后才能够成为法堂的证据,不能给行政部门、纳税部门、安全部门,其他部门不能来查这些数据。虽然我们不能说美国已经百分之百完善了,但相对来说还是比较完善的。所以需要我们去不断学习。

【悦读客】:提到进步时代时,您提到当时的美国存在大量问题,如病死猪肉做成香肠,过期食品加工罐头等触及道德底线的问题,但当时的进步主义者通过科学的方法化解了这些社会矛盾,您建议中国应该向美国学习,那您觉得中国是否正处于当时的美国所处的进步时代?中国应怎样利用好数据,来解决这些问题与矛盾?

【涂子沛】:我认为是的,咱们现在就处于不断改良不断完善的时代,美国当时也处于那个时代,中国现在就处于大变革的阶段,所以中国要循序渐进,用数据的、科学的方法,相信专家。美国在进步时代时候还有许多特征,就是很多公益组织出来,宗教对个人、对社会都会有约束,并且促进这个社会更快的进步。所以我们也希望中国的公益组织能更多更完善一些,让更多的人参与到其中。

【悦读客】:您认为,让中国政府部门实现向社会购买云服务存在哪些阻力?您的建议是什么?

【涂子沛】:主要是中国社会的信任机制还需进一步完善,商业社会不够发达,彼此不相信对方,云服务一直推广不开来,所以政府应该带头。我发现一件有意思的事情,咱们中国见面会互相给名片,很多人的名片上不是自己公司的邮箱,而更多的是自己的邮箱是全社会的邮箱,这就表明了这个公司是不是有自己的云服务,是不是注重自己的隐私,而中国云服务的整个版块没有打破,打破的方法首先就是政府可以带头,如果政府可以把数据放在第三方的平台上,对社会是一个很好的推动。

【悦读客】:您把美国的数据历史分为初数时代、内战时代、镀金时代等,您认为中国的数据文化历史可以有这样详细的分割吗?

【涂子沛】:中国比较模糊,从来没有系统的去收集,中国的数据文化是分散的,吉光片羽的,我们说数据是很人为的现象,但我们一直没有去努力系统收集。不过值得庆幸的是,中国现在已经开始了对数据重视,开始进入正常的数据系统收集的轨道。

【悦读客】:您在文章中提到美国的内开放发展历程经历了1.0、2.0、3.0时代,您认为中国的内开放处于何种程度?

【涂子沛】:这个问题是我非常想强调的,我也花了很多心思去写,因为我们总是讲对外开放,其实我们应该注重对内开放。对内开放有三个层次:第一个是为了知情权内开放,第二个是为了政府认识到开放是一个管理的工具,是制衡的工具,可以通过开放来调节整个社会,第三个层次就会发现到了网络经济时代,数据时代,开放数据是推动创新,是推动发展的阶段,这是三种不同的开放。而我们中国则不是很完善,但已经出现了很多人性的改变,比如PM2.5,就是数据知情权的开放,我希望通过将这段历史写进去,让人们意识到开放还是可以用来调控的,可以解决很多问题。到现在这个时代,要开放数据,而开放数据已经不是一个简单的知情权的问题,而是中国的经济要向创造型社会转型,要由粗放向精细转型,现在数据成为了一个创新的主体,要去开放数据,从而促使网络经济的发展,促进新经济的发展,我们到达了一个用数据去创新的时代。

【悦读客】:您提到智慧城市,在向智慧城市迈进的过程中,政府和人民间的关系在逐渐发生变化,您认为,中国的政府、公民各自应该怎样做,才能促进智慧城市的建立与普及?

【涂子沛】:提到这里其实最核心的思想就是,城市当中最智慧的是谁?是人。假设在一个下水道里装上感应器,这个下水道的盖子不见了,跟一个人发现了去报告,这个成本谁高?所以要调动大家去关心这个城市,关心这个社会,所以我提到了一个观念,众包,要调动大众的力量去管理去关心这个社会,所以政府要搭建这样一个平台,政府即平台,政府不仅作为官员去管理这个社会,更要让大众来参与,这样的城市才是最智慧的。

【悦读客】:无论在中国或国外,数据文明的建设和普及一定要调动全社会的力量,您提到,无数公民才是推动一个社会不断进步的源源动力,和美国及其他国家人民相比,您对中国公民在推动数据文明的建立上有怎样的期待或是建议?

【涂子沛】:首先要建立数据意识,用数据去管理去决策,追求精确,第二要意识到数据是种权利,要用数据说话。数据不仅仅是种工具,它代表隐私,代表知情权,整个社会文明的生活都是围绕数据而开展的。第三要知道数据是一种资源,对企业对个人都是一种资产,一种创新的资源。谷歌的无人驾驶汽车基于大数据,阿里巴巴为什么能在短时间可以贷款是基于数据,很多都是基于数据。

【悦读客】:涂子沛老师除了是IT精英外,其实还是一个优秀的文艺青年,您有什么书想要推荐给我们悦读客的读者吗?

【涂子沛】:我从小就很爱读书读小说,推荐几本书给朋友们吧,奥地利作家斯蒂芬•茨威格的《一个陌生女人的来信》,许倬云老师的《万古江河》,美国政治经济学家奥尔森的《集体行动的逻辑》都非常值得一看!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2014-08-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档