用人工智能改变世界

新智元

发布于 2018-03-22 11:42:24

1.3K0

发布于 2018-03-22 11:42:24

文章被收录于专栏：新智元

【新智元导读】2016年4月23日是“世界读书日”，今天你AI了么？你的书单中，有没有加入一本人工智能类图书。不想out？跟小机器人一起来读书吧！

今年以来，人工智能类图书也格外火爆。承蒙新智元订户与广大读者的垂青与厚爱，《新智元：机器+人类=超智能时代》新书在京东和当当人工智能类新书热销榜上都名列前茅，并曾摘得京东人工智能类新书热销榜冠军，目前也仍然高踞新书销售榜前3位。（在当当网居于人工智能类新书销售榜前5位）

读书的目的在于探索真知，让我们可以认识世界、改变世界。今天是世界读书日，我们为新智元读者呈上科大讯飞董事长兼总裁刘庆峰为《新智元：机器+人类=超智能时代》撰写的序言，同时分享科大讯飞轮值总裁、研究院院长胡郁在这本2016年人工智能热销书：“人工智能大咖独家解读AI新智元”一章中的独家技术重磅解密《人工智能需要一场认知革命吗？》。

刘庆峰：用人工智能改变世界

刘庆峰，1990年考入中国科学技术大学，1998年获“通信与电子系统”专业硕士学位，2003年7月获“信号与信息处理”专业博士学位。中国科学技术大学兼职教授、博士生导师，中华全国青年联合会委员、中国科协七届委员和十届、十一届、十二届全国人大代表。1999年创办科大讯飞股份有限公司，并担任总裁至今，2009年4月起同时兼任董事长。2013年第十四届CCTV中国经济年度人物颁奖晚会上荣获“年度经济人物奖”。

60 年前，马文·明斯基和麦卡锡共同发起“达特茅斯会议”，“人工智能”诞生了。60年来，人类用科技和智慧共同哺育了这个全新的生命。现在，人工智能在经历了一个甲子的跌宕起伏之后，借互联网、移动互联网和物联网的IT时代浪潮，以深度神经网络算法为基础，以大数据、云计算、移动互联网为支撑，终于进入到即将全面爆发的前夜。

人工智能成为下一个风口已经成为全球IT产业界的共识。《失控》和《必然》

的作者，硅谷著名科技哲学思想家凯文· 凯利就明确说：“如果你问我未来20 年

最重要的技术是什么？毫无疑问，我会告诉你是人工智能”。全球首富孙正义提出一个著名的“孙正义公式”，他认为未来决定一个国家的GDP 排名的不是人口，而是机器人。人类当前最伟大的科学家霍金更是预测“人工智能可能在接下来的100 年中将人类取而代之！”。今年全球消费类电子展（CES2016）上，71%的展品、展位是跟人工智能有关的。麦肯锡调研显示普通人45%的日常活动可用当前技术自动化。不仅是简单重复劳动，很多复杂的专业性工作也会被机器替代。《科学》杂志（《Science》）预测，截至2045 年，人工智能将会颠覆全球就业率，平均会有50%的劳动人口因机器人等人工智能技术发展丢掉工作，其中印度和中国受影响最为严重，这个数字将达69%和77%。人工智能已经不仅仅是一个学术名词，产业界和大众已经可以切实地感到他正在冲击着我们的现在，影响着我们的将来！

未来5 到10 年，人工智能会像水和电一样，进入到我们每个人的生活。过去

的60年，中国人在人工智能领域默默地投入和耕耘。今天，中国人工智能领域的科研工作者和企业家开始走在了全球的风口浪尖之上。如果我们能够抢抓机遇，掌握住人工智能的主导权，就能在下一次产业浪潮中处于价值链的高端；如果错失机遇，那就将不得不继续处于价值链的低端。因此人工智能不仅仅关乎单个企业、单个行业，更是国家必争之地。

我们已经可以看到，人工智能开始上升为世界各国的国家战略。美国已启动

“大脑活动图谱计划”（BRAINInitiative），欧盟也启动了“人类大脑工程”（Human Brain Project）。中国在去年启动了人工智能的重大专项之后，正在积极酝酿准备启动“中国脑计划”。脑科学与人工智能，机器人与人工智能的学科交叉与产业交叉为人工智能更高、更快的发展提供了机遇与可能。然而，在这个过程中，还有很多的问题需要回答，也有很多的难题需要破解。人工智能如何更好地借鉴脑科学的最新研究成果？深度学习是不是等于人工智能？大数据是不是人工智能的唯一原材料？人工智能在运算上已经通过Deep Blue 证明了自己的实力，那是不是在感知和认知上也马上就能超越人类？如果人工智能有了意识和情感怎么办？他们会颠覆人类么？这些问题的答案将能够帮助我们看清楚人工智能新纪元的发展轨迹。

《新智元：机器+人类=超智能时代》一书，从回答以上这些关键性问题的角

度出发，全面呈现了国内外人工智能最新研究成果，以专家视角描绘了一幅人工智能发展的未来图景。同时更加重要的是，通过国内外人工智能领域核心领导企业的角度解读产业发展，深刻揭示了人工智能成为继互联网之后新的产业浪潮，是国家未来打造核心竞争力的关键要素，对于我们思考未来人工智能发展趋势和格局构成具有重要的启迪意义。

作为国内人工智能领域最有影响力的智库组织——新智元，综合了国内外在

该领域的各方面专家，所以才有《新智元：机器+人类=超智能时代》这样一本在合适的时间、合适的地点向合适的受众撰写的合适的书。应该说，这里面汇聚了过去两年多人工智能百家争鸣前沿最强声，也是新智元在中国人工智能领域强大凝聚力的体现。在人工智能即将到来的更加波澜壮阔的历史长卷中，新智元和《新智元：机器+人类=超智能时代》将成为其中的前行者之一。

在《新智元：机器+人类=超智能时代》即将出版之际，由谷歌公司天才科学家Demis Hassabis 开发的AlphaGo 与韩国国际围棋冠军李世石的人机大战正如火如荼，人工智能所表现出来的惊人学习能力和巨大优势让所有的人都有这样的感觉“人工智能是不是真的能够在很多领域像在围棋一样快速超越人类？”带着这样的问题在本书中寻找答案，让我们拭目以待！

胡郁：人工智能大咖独家解读AI新智元

胡郁，科大讯飞轮值总裁，讯飞研究院院长。中国科学技术大学信号与信息处理专业工学博士，国务院特殊津贴专家，语音及语言处理国家工程实验室执行主任，中国科学技术大学兼职教授、博士生导师，科技部863 人工智能重点项目首席专家。负责主持公司语音合成、语音识别、语音分析、语音评测、自然语言理解等智能语音及语言核心技术的研究工作，科大讯飞人工智能前瞻项目——讯飞超脑计划总体牵头人。

一、人工智能需要一场认知革命吗？

人工智能作为未来IT产业的战略性和前瞻性新兴产业方向，一直是全球科技界和产业界关注的焦点。尤其是伴随着大数据、云计算等新一代信息技术的快速发展和智能化应用需求的日益凸显，人工智能领域在全球范围内掀起了全新的热潮。美国、欧盟等发达国家分别提出了“BrainInitiative”和“Human BrainProject”等人脑研究计划，投入巨资并将其提升到与“人类基因图谱”重大工程并重的高度。苹果、谷歌等国际IT产业巨头也相继推出了Siri、Google Now语音搜索等一系列人工智能应用，力争在新一轮人工智能技术竞争中取得先机。本文将从What、When、How和Where四个方面对人工智能的概念以及关键问题进行讨论。

二、What -人工智能是什么？人工智能和机器人是什么关系？

人工智能（ArtificialIntelligence）这个词最早是在1956年美国的Dartmouth会议上提出的，当时参加会议的包括明斯基、西蒙、麦卡塞等一些计算机领域的专家。关于人工智能的定义，不同的教科书中往往会有不同的解释。其中有一种比较简单、易于理解的定义，就是人工智能指的是“能够和人一样进行感知、认知、决策、执行的人工程序或系统。”

另外一个关于人工智能值得探讨的关键问题，就是人工智能和机器人的关系，即人工智能和机器人是不是一回事？人工智能研究的专家往往来自计算机科学领域，他们所研究的是数字世界和虚拟世界，也就意味着他们所说的感知、认知、决策和执行，全部是在数字世界里面执行的。但同时有另外一些研究机器人科学的专家，他们是在物理世界和真实世界中探求能否实现这样的机制。他们要解决的是机械手、机械控制，他们要做的是在真实世界里面做感知、认知、决策和执行，所以说他们的执行一定要有物理实体。比方说针对“在家中客厅遥控关闭卧室灯”这样一个问题，人工智能专家和机器人专家往往会采用不同的方法。人工智能的专家会考虑在手机上做个软件，通过互联网连到卧室里的智能装置，然后把卧室中的开关连上物联网，这样就可以用手机遥控将电灯关掉，这一过程是在虚拟世界中可以完成的。但是对于一个机器人专家，他可能会做一个爬楼梯的机器人，然后给机器人下达指令，机器人接到指令就会跑到卧室去把灯关了，这个过程是要在物理世界里面来完成的。所以从本质上来讲“人工智能”和“机器人”二者是非常接近的，但是其背景是不一样的。

人工智能的第三个关键问题是它的学科基础。人工智能的软件实现涉及计算机科学、信号信息处理及统计模式识别等若干学科。计算机科学包括算法、网络等；信号处理涉及傅里叶分析、拉普拉斯变换及其他时空分析方法；统计模式识别依赖概率论和数理统计，我们现在使用的深度神经网络（Deep Neural Network，DNN）和统计模式识别的算法来自这里。人工智能专家往往有着计算机科学和电子工程的背景。但是机器人领域往往强调控制论，包括卡尔曼滤波、自动控制原理、机械控制理论等。机械控制理论中又有很多机械原理是涉及物理规则的。从中也可以看出，人工智能和机器人是两个相互关联又有区别的研究领域。

三、When - 什么时候人工智能将实现革命性的突破？

人工智能第二大方面的问题是When，就是人工智能什么时候能实现革命性的突破？对于这个问题，大致有两派的观点。一派我们称为“威胁派”，这一派的代表人物是霍金、比尔盖茨和马斯克，他们都提出要警惕人工智能，它对我们人类威胁太大。而且现在越来越多的科幻电影好像是配合他们的说法，不断地向我们展示人工智能对人类构成威胁的一面，如“复仇者联盟2”和“终结者”。但是另一派的观点相对理智，以Michael Jordan、Yann LeCun、Andrew Ng等学者为代表，他们认为其实我们现在与实现人工智能还距离很远，人工智能还远远没有达到威胁人类的地步，还有很多探索的工作需要开展。

最近有一本书叫《人类简史-从动物到上帝》，是以色列一位年轻的历史学家写的。他在这本书里面讲了一个事实，并且做了一个推论。大家都知道，人类的产生大概距今300万到400万年前，那时候世界各地出现了猿人，非洲叫智人，欧洲叫尼安德特人，亚洲叫直立人，东南亚叫梭罗人。北美洲和南美洲都有猿人，他们是各色各样的猿人，在中国也出现了山顶洞人、元谋人和蓝田人。非常可惜的是他们不是我们现在汉族人的直系祖先。因为在7万年发生了一件事情，非洲的智人跑到了全球，他们每到一个地方，就把当地的猿人全部杀光，包括欧洲的尼安德特人，并且占领了整个世界。

为什么7万年前的时候这些智人像突然开窍一样迅速占领地球并且成为地球的上帝呢？当我们在问人工智能什么时候能达到智能突破的时候，我们或许可以先问一个类似的问题：人类的智能是如何突破的？这里有很多神创论、宗教，包括达尔文的进化论在后面支撑。猿人在地球上已经存在了300到400万年了，到7万年前才实现了智能的突破，这是一个非常漫长的时间过程。而计算机出现的时间刚刚只有几十年的时间，和猿人产生智能的时间周期相比，计算机刚刚度过的时间只能算一瞬间。

四、How - 如何实现人工智能的突破？

第三个问题是很多人讨论的How的问题，就是我们如何实现人工智能突破。自从Dartmouth会议以来，我们人类人工智能能够取得突破的一个核心要素，现在看来就是深度神经网络。深度神经网络(DNN)是基于统计的模式识别的一个成功代表。另外一个关键要素就是大数据。以谷歌为代表的世界互联网公司，包括中国的阿里、腾讯、百度、讯飞，就是利用深度神经网络与大数据结合来推动人工智能技术的进步，这已经成为当前人工智能研究的一条主流路径。这条路径中还有一个非常重要的内容，就是基于互联网和移动互联网的“研究-工程-产品-用户”大闭环优化，它推动了工业界人工智能技术直接迈过了可用性门槛。

从2013年开始，DNN已经被广泛地应用在语音合成、语音识别、语音评测、语音增强等一系列智能语音技术方向。我们可以看到现在这个方面的工作，已经成为了当前机器学习和统计模式识别的主流。目前的DNN对人脑神经网络的借鉴是非常抽象的，我们可以通过对人脑的研究进一步优化DNN。

基于互联网和移动互联网的“研究-工程-产品-用户”的大闭环优化的核心思想，可以用简单的四个字概括就是“大、智、移、云”。

移动互联设备对智能交互（包括语音和图像）提出了迫切的需求，而传统的嵌入式移动设备不能够提供足够的运算能力且缺乏足够的电力供应，而在云计算出现以后，这些复杂的计算都可以放在云上。通过云计算自然就存储了大数据，而这些大数据结合DNN，可以很好地解决一些人工智能问题。

本文将这个过程形象地总结为“涟漪效应”。“涟漪效应”就是水滴刚刚滴入水面的这个过程，会产生一个波纹，逐步覆盖整个水面。我们可以想象一个人工智能产品刚开始投入市场的时候，有些性能是不好的，如讯飞的语音输入法。水波纹每一圈向外扩散就会有更多人使用，这些不断累积的真实数据和使用经验就会放到云上，系统会根据这些数据和经验进行自我学习和更新。当它扩散到更多人群的时候，就是波纹覆盖水面扩大的时候，已经是改进以后的系统。前一千万人免费使用系统的同时也贡献了宝贵的数据和经验。当第一千万零一个人使用的时候，他往往会惊异于系统的优异性能。

2010年以前的语音识别无法在真实场景下使用，科大讯飞刚推出语音输入法的时候，在实验室里测试识别准确率是90%，在真实的环境下识别准确率只能达到55.8%。但是利用涟漪效应和“大、智、移、云”优化之后，现在的语音识别准确率已经达到95%，并且识别错误率还在以每年30%的速度降低，以这样的速度大概5年以后就可以达到人类的语音听写水平（准确率约为99.5%）。

现在工业界所依赖的大闭环优化、深度学习和大数据，跟脑科学的研究思路结合也是完全有可能的。因为现在人工智能网络借助于新的学习机理甚至拓扑结构上的改进，将可以进一步成为人工智能发展强有力的推动力。例如，一种新型的递归型深度神经网络（Recurrent Neural Network，RNN）已经成为当前语音识别的一个新的标准配置，比传统的DNN方法可以再降低20%～30%的识别错误。RNN就是一种非常新的网络拓扑结构，它和人脑神经网络可以在时间上进行信息积累类似，通过网络拓扑结构的优化和改变，可以实现对序列性数据更好的处理能力。正是涟漪效应、深度学习和大数据的结合，成为目前推动着人工智能向前发展的最有效的路径。

从另外一个角度，最近这几年，包括美国、欧洲、中国都在积极推进脑科学的研究，包括奥巴马政府要做的“BrainInitiative”和欧洲的“Human BrainProject”，中国也在酝酿“中国脑计划”，如中科院卓越创新工程中也涉及了这方面的研究。这些国家层面的重大项目都试图从脑神经科学的角度尝试人工智能发展的另一条途径。

我们都知道大脑皮层是一个非常复杂的结构，人脑分为大脑、丘脑（也叫中脑）、小脑、脑干、海马体、脑垂体等。但是人类跟动物一个最大的区别是人类的大脑皮层，它的面积很大，如果摊开大约一张餐桌纸大小，跟所有动物都是不一样的。当把它皱起来的时候它就形成一个空间实体。当人脑在处理信息的时候，大脑皮层的不同区域，会处理不同的任务。有些是处理视觉的，有些是处理听觉的。那么人脑更有意思的地方是什么？我们现在研究图像、语音、文字、触觉都是分离的，但是人脑处理不是这样的。人脑的结构是一层层上来，到了顶层以后，视觉、触觉和听觉会交叉的。这就是“概念”，它跟人工智能中的认知能力实现是非常相关的。

如果再细化一点，大家知道大脑皮层是有厚度的，如果把它的厚度再展开，它一共有六层，L1至L6。大脑皮层一共有360亿个神经元细胞，这些细胞之间是一个非常复杂的连接网络。大脑皮层有一个非常重要的特点，就是它的记忆功能。记忆和存储是不一样的。记忆是各种各样的信息的抽象。

举一个简单的例子，我给领导递交一份报告，最底层的记忆是记住这个报告的所有内容，然后再上层是记住这个报告大意，包括标题是什么，再上一层是记住有这么一个报告，但是写在一个什么纸上的，再上面一层记忆是我给领导提交过这份报告，但是报告的细节一点都不知道。记忆是需要计算的，而这是计算机在存储时所没有的。

大脑还有几个关键的特性，一个叫存储序列模式，比如说听一首歌曲，从前往后听是可以的，但是如果倒过来听，人是肯定不记得的，因为人的大脑里面有可能是用类似RNN的结构来进行记忆的。第二点是它有自联想的回忆模式，比如当人看到一个猫的上半部脸，他马上能想到这个猫的下半部脸应该是什么样子，因为人有记忆的预测功能。而且当他听到句子前半部的时候，他能够预测到句子的后半部分，这能解释为什么我们在嘈杂的鸡尾酒会上都能具有超强的识别能力。人脑最强大的地方在于它的恒定表征，也就是祖母细胞。当人看到这个脸就知道是谁，它不需要复杂计算，这和我们现在使用计算实现人脸识别的过程是不一样的。所以说大脑皮层超强的记忆功能能够实现预测，我们现在所有的动作都依赖预测结果；而计算机的工作是通过运算和存储实现的，且能耗极高。将以上关于脑神经科学的知识用于人工智能的实现也仍然需要一定的过程。

总结一下，人工智能的创新需要有计算机科学的背景，包括电子工程和机器学习，同时还需要脑科学、神经科学方面的理论支撑，另外也要机器人相关的控制论和工程学。人工智能的技术突破需要同时具备这三个方面的基因。

五、Where -人工智能到哪了？

第四个问题要讨论的是Where，就是大家一直关心的人工智能发展到哪了？世界上一个非常著名的公司Gartner研究过，一项新的技术从开始研究到最后成功的产业化之间要经过很多过程，包括一开始的推崇备至发展到期望巅峰，然后到跌入现实低谷的痛苦，很多技术在这个过程中慢慢消失了，或者被新的技术代替了。人工智能其实是一个非常广泛的概念，语音、图像、语义理解等都属于人工智能。各项人工智能技术以不同的状态分布在整个曲线上。

人工智能所涉及的各项技术的发展是不均衡的。现阶段计算机比较具有优势的是运算能力和存储能力。1996年IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫，从此，人类在这样的强运算型的比赛方面就不能战胜机器了。江苏卫视有个《最强大脑》的节目，让每一个人类选手记100个4位数，然后回答第58、第64个4位数是多少。这对于计算机来讲根本就不是问题。所以从运算智能的角度来说，人类早就不是机器的对手。

同样，我们看到机器在感知世界方面，比人类还有优势。人类都是被动感知的，但是机器是可以主动感知的。比如：激光雷达、微波雷达和红外雷达。不管是Big Dog这样的感知机器人，还是自动驾驶汽车，因为充分利用了DNN和大数据的成果，机器在感知智能方面已经越来越接近于人类。

但是，人类跟动物的区别在于人类拥有自己的语言，有语言就可以表达知识，有知识就可以进行逻辑推理，而有逻辑推理以后我们就有向更高阶段发展的能力。我们认为正是语言的使用区分了人与动物，也将是人工智能面临的最大挑战。或许我们会问：“动物难道没有认知吗？”动物对自然世界确实有认知，但是它的认知也只能是停留在哪些是固体、哪些是液体、哪些是能吃、哪些是不能吃的，等等。所以说，动物只能对自然世界产生简单的认知，同时对人造世界的自然属性产生认知。动物能够看到月亮，但是它不知道月亮是一颗星球。如果一只兔子来到这个会场，它会知道这里有很多活物（人），有桌子、椅子这些固体，但是它不能理解这些物体和人类社会之间的关系。现在的问题是，计算机能理解这一切吗？这是非常关键的一点。

让我们回过头来看一看人类智能的突破。七万年前智人的智能有过大的突破，研究表明，这是因为他们有特殊的语言和认知。我们到现在分析人类历史都知道有农业革命、工业革命、信息革命。现在历史学家有一个共识，在七万年前人类发生了“认知革命”。其中的核心是智人拥有丰富的语言，从而产生了三个结果，这些智人通过语言更好地描述自然世界，从而可以执行更加复杂的计划。而最重要的一点，就是智人有了语言之后可以描述在梦中想到的东西和他们脑子里面想到的东西，从而产生虚构、产生宗教，产生各种概念。

正是因为这样，现在很多正在做人工智能研究的专家，包括Michael Jordan和Yann LeCun等都已经意识到，自然语言理解对于人工智能来说是一个突破口。

科大讯飞目前正在执行的讯飞超脑计划，就是想实现包括感知智能和认知智能在内的全面突破。在感知智能领域，语音识别、手写识别方面每年保证30%～50%的错误率的下降。进一步的，我们不仅能够识别普通话，还能够识别方言；不仅能够理解人类和机器的对话，还能理解人和人之间的对话；不仅能够识别联机手写的字符，还能识别离线手写的字符。我们在认知智能上的研究目标，关键是让机器能理解会思考，这必须要突破语言理解、知识表示、联想推理，自主学习等多个方面。

评判一个人智商的标准就是让你参加考试，虽然这个方法很多人都在批判，但是没有其它更好的办法。美国华盛顿图灵中心在研究如何让机器人通过美国高中生物测试。日本国立情报研究所在研发能够考上东京大学的高考机器人。我国863计划也正在开展一个题为“类人答题系统”的科研项目，其目的就是要研发高考机器人。该项目包括9个课题组，全国共有31家单位参加联合攻关，其中科大讯飞作为牵头单位。将来一份试卷不管是手写识别的，还是选择题涂抹的，都可以先通过OCR转变成计算机可以理解的文本和图像，再让计算机自动对答案的正确程度进行评判，这其实是感知智能和认知智能的结合。现在安徽省合肥市和安庆市的会考中，英文和中文的考试已经全部使用了整套感知智能和认知智能技术进行自动评分，取得了非常好的效果，以后此技术将会被全面推广到包括文科和理科的所有课程。

六、结束语

可以看到，随着技术的发展，人工智能将来在智能硬件、车联网、机器人、自动客服、教育等方面都会发挥越来越多的作用。在这样大的环境下，最后大家所期望的人工智能梦想一定能够实现。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2016-04-25，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能

本文分享自新智元微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

人工智能

登录后参与评论

0 条评论

热度

用人工智能改变世界

用人工智能改变世界

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐