首页
学习
活动
专区
工具
TVP
发布

智能时代——读书笔记(一)

前言:

就在这2019年春节来临之际,利用自己一些碎片化时间,将吴军博士写的《智能时代》一书通读完毕。在此之前,也是得益于晓书童、罗振宇及其在“得到APP”的影响下,购买了这本书,这段时间有幸将其认真读完后,收获颇丰,但自己对很多知识点理解的还不够,于是打算后面这段时间里,将书中重要的部分,用我自己的理解记录下来,并且分享给朋友们。一方面希望自己能再次加深对全书内容的理解,另外一方面,也希望大家能够对吴军博士描绘的大数据思维、未来智能时代有所了解。

首先,我简单阐述一下对全书的理解。当我翻开这本书之前,我只能看到标题《智能时代》四个字,猜测书中描绘的应该是未来世界里,智能时代到来后的一些景象,以及对我们生活各个方面的影响。当我翻看这本书后却发现,书本中只有最后几个章节里的部分内容,描绘了未来智能时代的各个行业、各个阶层发展趋势的判断,而书中大部分内容,都在描述大数据思维的重要性、大数据能产生价值等。

说到大数据,这个词其实大家早就不陌生了,我之前也参加过好几次与大数据相关的论坛,而论坛中一般只会介绍其应用的场景、领域以及技术原理,而对大数据有一个更全面、更深层次的理解,要归功于阅读吴军博士写的《智能时代》这本书了。里面从第一章开始,一直到第五章,都是在阐述大数据的概念、大数据与机器智能的关系、大数据的思维方式、大数据对商业模式的影响以及大数据目前存在的技术挑战。

整书的逻辑是以大数据技术为核心,让计算机逐渐变得越来越聪明、越来越智慧,最终将会带来一场对整个世界影响巨大的智能革命。所以,前面我会花比较多的内容,来讲述对于大数据发展的理解,在最后几期文章中,我会带领大家看看未来的智能时代,会对我们的生活、工作以及整个社会的方方面面带来哪些重要的影响。

接来下,我们进入正题。

人类的胜利

本书一开始,介绍了2016年由Google 开发的AlphaGo战胜世界围棋冠军李世石的故事,究其本质,下围棋这个看似高智商的事情,其实就是大数据和算法的问题,AlphaGo之所以在这个时间点上能够完胜李世石,最主要的还是要归根于Google拥有大数据、大量的计算资源等技术的优势,AlphaGo通过学了几十万盘围棋高手之间博弈的棋局,进行深度学习,不断训练模型,才取得了今天这样的成绩,并在一夜之间被家喻户晓。这件事情,也标志着机器智能水平上了一个新的台阶。

现象、数据、信息与知识

回顾人类文明的进步,其流程可以大致总结为以下几个过程:

我们可以想象一下,以前在历史、物理、化学等书上,看到的各位数学家、发明家,天文学家,大部分都是通过一些生活中现象、不断进行总结、分析,最后形成一个牛逼的公式或真理,用于推断其他相类似的事物。

当然,比较复杂一点的分析要算在天文学上有所成就的科学家们,像拓米勒、开普勒对行星运动的推测,他们一般都需要建立一个相对复杂的数学模型来才能比较准确的描述和预测一些天文现象。

不过从这些科学家们的事迹可以看出:数据是来源对现象记录,而信息则是在数据的基础上抽象出来的一些概念,最后再将诸多的信息,抽象成为一些人类积累的知识,写入我们的教科书中,所以,严格的来讲,数据、信息、知识不能混为一谈,他们之间其实是一层一层递进、抽象关系,人类的今天的高度文明也就是这样慢慢的建立起来了。

数据相关性的重要性

在20世纪70年代,中国国际交往开始恢复正常,为进一步加快中国的建设,政府就一些重大项目进行招标,而大庆油田的石油开采设备招标,就是当年的一个重大项目。因为当时的社会背景,大庆油田的具体情况中国政府一直对外保密,所以其他国家对此也了解甚少。最后来自日本的投标单位,却提出了非常有针对性的方案并一举中标,那么其背后的原因具体是什么呢?

我们是否还记得这张照片是否在哪个课本上出现过?这是1964年《人民画报》刊登铁人王进喜的照片,日本人通过分析王进喜穿着棉袄、头戴大皮帽、手握钻井机以及背后高高的井架等等这些细节,暴露了油田的位置、油田的深度、直径及油田的产量,因此他们提供的设备,是非常有针对性,当然也就很快中标了。从这个故事我们可以看出数据相关性的重要性了。

包括我们熟知的Google搜索,通过各个方面的数据,准确统计出电视节目的收视率与观众的喜好,准确预测出2009年甲型H1N1流感的传播范围与传播速度等,这些都是利用大量数据的相关性统计进行了准确的判断。

数据统计与数据模型

我们都知道,统计学是建立在概率论基础之上,通过收集、处理与分析数据,找到数据内在的关联性与规律性。一般情况下,要做数据统计,我们都要求数据量要充足,要想结果越准确,那么被统计的数据量就要越大。但是,只要数据量大就够了吗?

盖洛普预测美国总统选举就是一个很好的反面案例,由于1940年、1944年前面几次预测都非常准确,所以1948年,包括蒋介石在内的许多民众都相信盖洛普民调公司得出的结论:候选人杜威将以很大优势能击败当时民主党候选人杜鲁门,结果大家都知道,杜鲁门以较大优势获胜。

远在大洋彼岸的老蒋之前本来与杜鲁门关系一般,加上之前得知杜威将选举获胜,非常兴奋,并在公开场合支持杜威,并期待杜鲁门下台后能从美国得到更多援助。结果可想而知,杜鲁门本来一向就不喜欢老蒋的独裁与腐败,对这次公开支持杜威当然大为不满,日后对老蒋更是不待见了。而这一切的核心原因,都是因为当时盖洛普调查的数据不够全面、不够具有代表性所致,可见数据量大,但不具有代表性的数据也会“坑死人”啊。

在做数据统计时,除了数据量大、数据要具有代表性以外,还要有一个最合适的算法模型,才能得出一些准确的答案来。而数据模型的匹配,涉及到许多数学相关的知识,找到一个合适的模型其实并没那么简单。如今以数据驱动的方法,恰巧能够解决这一难题。

当年美国与苏联在设计飞机、航天器等高科技设备上,最大的不同在于理念与方法论,当时苏联拥有大量数学功底深厚的设计人员,而缺乏大量的数据和计算机,而美国相比之下,其设计人员的数学功底平平,但是他们拥有很强大的计算资源,以及更多的数据。数学牛逼的科学家当然都想着找到一个非常复杂的、但是比较精确的数学模型,而数学功底一般的科学家一般喜欢用很多简单的模型来替代一个复杂的模型,然而,从结果上看,美国似乎更胜一筹。

其原因主要在于,采用简单的模型一般比设计一个精确的模型成本低,而且有足够的数据去契合这些模型,然后进行不断的调整与优化,这种方式被称为数据驱动方法。这种方法的优势在于,可以依赖摩尔定律描述的计算机技术发展的速度,保证了有足够多的数据与计算能力,从而可以慢慢的打磨模型、改进模型。前面说的AlphaGo就是一个典型的案例,在人类一辈子都学不完的几十万盘棋局数据里,AlphaGo通过总结得到了一个统计模型,对于不同局势下,应该如何行棋有一个比人类更准确的判断。这就是AlphaGo为什么显得这么聪明的原因了。

好了,本期内容就是这么多,希望能够帮助到您,感谢您能读到最后,如果觉得内容不错,请您点赞转发给予鼓励,咱们下期再见。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190116G061SE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券