前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【精读】十分钟读完《大数据》

【精读】十分钟读完《大数据》

作者头像
钱塘数据
发布2018-03-02 15:10:23
6650
发布2018-03-02 15:10:23
举报
文章被收录于专栏:钱塘大数据钱塘大数据

推荐语:

在极权的国家,他们手上拥有足够的资讯,足以利用这资讯,掌握每一个人的日常生活;“老大哥”的影子,可以无所不在……涂子沛先生《大数据》这部书,清楚地叙述了资讯时代对我们生活的影响与社会的控御力。他讨论的范围方方面面、极为广泛。我们要对涂子沛先生致敬与致谢,因为他为华文世界提出一个重要的话题。

  ——【许倬云】 [史学大家、匹兹堡大学历史系荣誉讲座教授]

在很多领域,中国政府和中国的企业都有雄心勃勃的计划,这引起了全世界的关注,这些雄心和计划,现在应该拓展到大数据的领域。涂子沛先生的《大数据》这本书,将在这个重要的领域,为中国政府和企业的努力提供引导和帮助。无论是对中国政府,还是就中国的商业组织而言,《大数据》都是一本重要的书。

   ——【托马斯H达文波特】 [哈佛大学商学院访问教授]

大数据为华文世界提出一个重要话题

许倬云

涂子沛先生的新著《大数据》,已经完成,是一部300多页的大作。最近他将这本书的打样稿送来给我看,并且要求我作序文。可惜的是,我将要远行,而他索序甚急,我只能在浏览一遍之后,发抒自己一些感想。至于细细咀嚼和消化这本有趣作品的内容,必须要在一两个月以后,也就赶不上涂先生大作的出版时间。我事先声明,这些只是我浏览他大作以后的一些感想,非常立即的直觉,也一时谈不上深刻的见解。

  这本书的内容,强调今天是一个大量数据公开于大众的时代。自从资讯革命以来,资讯工具、硬件、软件,平行发展、与时俱进。数据在我们生活之中,日常接触,已是处处可见的现象。收集数据,当然是靠电脑的快速分类和记录,然而更重要的是搜索引擎的进步,与网络之间网际的交流。到今天,一个一个网,不但可以串联在一起,互相沟通,而且“云端”(云计算)的设计,可以将每一个地区个别数据,储成一个大的数据库,有助于我们更迅速广泛地搜索。

  这些现象,20世纪最后四分之一以来,已经呈现加速度发展的新事物,在21世纪进展速度之快,更是铺天盖地、无所不在。涂先生在这本书里强调:不仅数据经过管理而大量地存在,而且,在现代的国家,开放的社会与政府之间,经由数据,彼此一目了然、无所隐瞒。一个掌握公权力的政府,跟任何其他政府一样,有压倒社会的庞大力量,因为他们手上掌握了人生需要的许多数据。不过,这些数据,公民也可以一样取得,使政府所作所为,可以摊开在天地之间,让我们检验。过去封建专制和一些集权政体,其执政者能压迫老百姓,而老百姓没有办法回制公权力的压迫。涂先生特别标榜,美国奥巴马接任以后,尽力将数据开放于大众,固然奥巴马是一个有开放心胸的政治人物,如此将政府掌握的数据,大量地开放于群众,也是拜时代之赐,有如此的机缘,才能将数据公开。

  涂先生引用胡适之先生与黄仁宇先生的话。胡先生说中国人习惯于“差不多先生”,凡事马马虎虎、不求精确。黄仁宇先生认为,中国不懂得用数字来管理国家。涂先生引用这两位先生的名言,当然是要彰显传统中国和今天美国之间的巨大差异。不过我必须有所说明:胡先生和黄先生的话语,都是“爱之深而责之切”的心态,他们身经当时中国的混乱,激愤而出此感言。

  从历史上看,不论中国和西方,任何国家发展到可以有一个复杂文官系统管理以后,没有不依照数据来治国的。人口、资源、土地、财产种种的统计数字,在中国历史上,自从战国时代形成列国的国家体制以后,没有一个朝代不具有一定的数据库;只是以今天的标准来讲,粗糙和细密之间,古今有很多的差别而已。以汉代为例,汉简所显示的家户统计,每一户中的人口,男女老小,以及拥有的资产数目字,都详细统计,而且不论是居延边塞,或是荆州内郡,格式一致。汉简各种家户统计,与唐代西域州府的记录对比,其内容格式也是相当一致。这种基本的数据,在列朝的会典中,都见到其大概。当然,各个朝代的数据,有做得好的,也有做得差的。大致讲起来,外族侵犯中国建立的朝代,以武装力量强制建立政权,也往往依靠暴力的掠夺,取得他们所需要的资源。一个上轨道的朝代,其数据还是相当完整。

  再看西方历史。希腊时代,我们了解的资料不够。罗马帝国时代,全帝国包含各种不同的政治单位,并没有一个大一统的文官政府;因此,全国性的资料库似乎不存在。等到中古黑暗时期,国不成国,地方不过是大小封建领主占有领土而已,他们并没有建立详细的资料库。近代以来,列国各自组成完整的主权国家,这些数据也纷纷出现了。

  这是以历史上政权掌握数字而言。一家大型的企业,例如,中国清代的票号,如果他们手上没有复杂的数据库,就不能进行汇兑、放款、存款等活动。英国的东印度公司,手上握有丰富的资源,他们也不能不具有一个相当完整的数据库,否则无以经营这么复杂的开拓业务。

  今天的数据时代,我已经在前面提过,不仅公司单位都有搜集数据的能力,而且更重要的,有搜寻引擎可以将资料迅速检索,从其中归纳出条理,有助于了解情况。举一个例说,最近我们才看到,数据资料显示,美国1%的人口,拥有全国财富40%以上,99%的人口,拥有全国财富才过半而已。对于许多长期习惯于美国是开放社会的一般人民,这一组数据显示的现象,几乎可说是理想的破灭,使大家必须检讨: 美国真是如此开放吗?还是相对地在逐渐关闭?是不是财富与权力,已经逐渐集中到社会顶端一小撮的人手中?他们以财富作为魔法师的指挥棒,安排了我们的生活、决定了我们的未来。这种现象能够暴露于众,当然就因为在美国究竟资讯是公开的。

  相对而言,在极权的国家,他们手上拥有足够的资讯,足以利用这资讯,掌握每一个人的日常生活。资讯管理、资讯控制,是无影无踪,又是无所不在。说到这里,我们不能不更多警惕。

  作为一个史学工作者,看惯了世间的灾难和创伤,不能不提出警告:这个中性工具,也只有在了解到资讯工具阴暗面—双刃剑的特性,在权势独占这一工具时,可能出现的危险。有此认识,我们才能善于利用这了不起的工具,开创更好的未来,也防治不虞的灾害。

  涂子沛先生《大数据》这部书,清楚地叙述了资讯时代对我们生活的影响与社会的控御力。他讨论的范围方方面面、极为广泛。我盼望有了这本书作为起头,还有很多对资讯工具有研究、也有心得的人,参加讨论,让我们更清楚地了解,这个21世纪新的知识工具。为此,我们要对涂子沛先生致敬与致谢,因为他为华文世界提出一个重要的话题。

吐槽:

在没读这本书之前,我充满了期望。

读完这本书后,很遗憾的,是失望。

之前,有位朋友去参加涂子沛先生的交流会,回来后说,不太明白大数据为什么这么受追捧。我当时还觉得,朋友可能对管理信息化等不太了解,所以不明白大数据的巨大作用。等我读完这本书,我似乎明白了朋友的感受。

其实这本书可以换个别的名字,比如《美国的信息开放历史》等,但肯定不如《大数据》卖座。

书是论文式的写法,结构谨严,论证详实,不过我的确没觉得对于大数据的阐述有多么精彩。

美国历史上曾经发生过的故事,的确很精彩,对于中国民主化的进程,也会有启迪意义,大数据在其中也起到了一定的作用,然而,对于一本名叫《大数据》的书,这就够了吗?尤其是,封面上还写着“正在到来的数据革命,以及它如何改变政府、商业与我们的生活”。

我相信历史是有人关心的,比如研究者们,然而书的读者群,我相信普遍不是研究者,他们更希望从书中了解正在发生的数据革命,以及未来的趋势。

如果真想了解大数据,还是看维克托的《大数据时代》吧,那才是名副其实的书。

——萧秋水

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-12-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 钱塘大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 大数据为华文世界提出一个重要话题
  • 许倬云
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档