从AlphaGo到BeltaGo，未来如何下好AI这局棋?

钱塘数据

发布于 2018-03-06 11:40:41

1.2K0

发布于 2018-03-06 11:40:41

文章被收录于专栏：钱塘大数据

2016年，人工智能60周年。

1956年夏，麦卡锡、明斯基等正式确立了人工智能（ArtificialIntelligence）这一术语，标志着人工智能学科的诞生。

60年后，AlphaGo战胜李世石，确立了人工智能新的里程碑。智能时代正在到来，站在人工智能的历史性关口，斯蒂芬·霍金、雷·库兹韦尔、尤瓦尔·赫拉利等一大批国际学者对人工智能的未来做过大胆预测。人工智能已上升为国家战略，国家“科技创新2030 重大项目”将新增“人工智能2.0”。最近，我国一批院士以及专家学者对未来人工智能和人工智能2.0进行了深刻阐述。

一、从AlphaGo看人工智能现状

1、AlphaGo是谁？

根据世界围棋排行榜，AlphaGo的工作单位是Google DeepMind，性别：无，国籍：英国。它的战绩为，2016年一月份胜了欧洲冠军，两个月后胜了世界冠军，当时，有同学问我，如果AlphaGo和柯杰下，谁赢?当时，我说，我猜AlphaGo赢，因为AlphaGo是在科学原理上赢了李世石。很不幸，我猜中了。2017年1月份对决柯洁等，60胜1和，聂卫平随后在微博上赞叹：“它是围棋上帝派来给人类引路的”。

*来源：www.goratings.org，2016.7.1

2、AlphaGo为什么能赢？

围棋是棋类游戏的皇冠上的明珠，最复杂的棋类游戏，最能体现人类智慧。在这么一个19*19的棋谱上，它的搜索复杂度高达250^150。

这有多复杂？

这是宇宙级别的复杂度，根据天体物理，整个宇宙粒子数量在10^80级别。由此可见，围棋有多复杂，这也是AlphaGo震撼人类的原因。我们知道人类高手下围棋主要靠宏观的直觉，加上局部的计算。AlphaGo能够赢在于利用最新的深度学习技术，模仿高手，并通过自我学习超越高手。

AlphaGo的第一招：模仿高手，学习高手的棋形。

要模仿高手棋形，AlphaGo需要一个分类器来判断棋形象不象高手的棋形。围棋盘可以看成是19*19的图像，虽然这个图像很小很小，但是有250^150种变化，要对这些变化分成高手棋形、非高手棋形，是一个挺难的机器学习问题。难就难在高手棋形的特征不好定义、不好提取。在人脸识别、车牌识别中，我们可以定义颜色、边缘、关键点等特征，显然围棋棋形的特征不能这样定义。深度学习是一种最新的特征学习方法，能够自动学出好的特征。

AlphaGo用了最新的图像分类器，叫深度卷积神经网络（DCNN）。不同于传统的人工神经网络，他层数特别多，学习和分类的能力特别强。神经网络1943年就提出来了，50年代末和80年代中兴起过两波研究热潮，以前的人工神经网络层数很浅，一般只能训练两个隐层，只能解决一些简单识别问题。2000年左右，G. Hinton等提出了一套预训练后向传播的方法，当时就能训练10几层，现在的深度学习能够学习100多层。DCNN是专门针对图像识别的深度学习方法，对局部图像进行卷积计算，效率很高。

*来源：图片来自于互联网

Nature上有一篇介绍深度学习的综述，G. Hinton、Y. Lecan、Y. Bengio等深度学习三巨头是共同作者[1]。Hinton、Lecun相继去了Google、Facebook，而Bengio继续留在学术界。这是一个非常有意思的现象。一方面，深度学习跟以前的学术热点不太一样，之前，学术界曾经有过很多的热点，但工业界很少跟进，更谈不上花巨资去学术界挖著名科学家。Hinton、Lecun到工业界兼职，说明深度学习是真正有用的，有可能改变产业格局。另一方面，深度学习的成功更多是在应用层面的，很多理论问题还不清楚。两人去工业界，一人留在学术界，是一种很健康的现象。

深度学习能够发挥巨大威力的前提是，要有大量的数据用来训练深度结构，深度学习会涉及到到上百万、甚至上亿的参数，如果数据不够，很容易过拟合、降低性能。而要进行这样大规模的训练，就要有超强的计算能力。其实DCNN 1998年就提出来了，当时只能解决NIST符号识别问题，现在能够解决ImageNet问题，其使用的深度学习结构基本没变，主要是用了更强的CPU和以前没有的GPU，并且用了千万倍的训练图像。据说，AlphaGo存有15万职业棋手、百万业余高手的棋谱，训练的时候会用到1202个CPU，176个GPU。现在GPU服务器在深度学习研究中已经是基本配置。

*来源：Fei-Fei LI，ICME2016大会报告

AlphaGo的第二招：自我学习，自我进化。

模仿高手还不足以超越高手，要超越顶尖高手，AlphaGo用了一个自我学习的方法，就像金庸小说《射雕英雄传》中的老顽童周伯通，左右互博，自己跟自己学。AlphaGo可以开出两个程序，自己跟自己下。高手也会自己跟自己摆棋谱，高手摆棋谱摆得慢，需要吃饭、休息。而阿尔法狗只要有电，就一直可以左右互博下去，这就使得阿尔法狗有可能超越高手。

为了达到左右互博的效果，AlphaGo用了一个叫深度强化学习的技术，Google 2014年收购DeepMind后, 申请了深度强化学习的专利。强化学习很符合智能体的学习规律，小孩在不断跌倒中学会走路，猴子在胡萝卜加大棒下学会做马戏。强化学习的特点，一方面是Agent通过环境交互中学习，另一方是，训练标注稀少，奖赏在现实世界中，通常是不轻易使用的，并且通常是有一定延时的。比如，孩子考试考得好，我们会给点奖励，但是考试不是经常考，考完要有一段时间才能知道结果。

强化学习主要包括感知、行动、奖赏三个环节，构成一个状态转移空间。学习过程可以用马尔科夫决策过程来表示。以前的强化学习的算法训练只能解决很小的状态转移空间。AlphaGo面临的是一个超大转移空间的问题，同时还是一个带有超长延时训练标注的问题，一开始的棋，不太好量化好坏，直到很后面才能够数出各自大概的目数，判断输赢，这就可以归结成为一个深度强化学习问题。这个问题恰恰可以用深度的递归神经网络（DRNN）解决。DRNN的训练和前面的卷积神经网络没有太多的区别。

在左右互博中，AlphaGo 局部会采用一种叫蒙特卡洛搜索树的随机策略进行搜索，先用前面提到的CNN的简化版本，快速定位比较好的落子方案，同时通过随机策略，给了其他位置一定的概率。随机策略使得整个系统能够自我进化，简化的CNN兼顾了速度和效率。

把两招合在一起就是：深度卷积网络，模仿高手，寻找好的落点；深度强化学习，形成左右互博，自我进化。深度强化学习另外一个副产品就是产生了海量的对局，用来充实深度卷积网络的训练数据，两招完美结合在一起。

3、再论AlphaGo是谁？

AlphaGo是最新深度学习方法、棋谱大数据以及最新超算体系的总和，它还以现代科学技术指数发展原理继续进化，并且没有任何情绪波动。既然AlphaGo是这样的一个人工智能系统，是不是它已经在科学原理上已经战胜了人类棋手？在此我想说，作为人类个体的李世石、柯洁们，虽然告负，但对人类整体来说，这无疑是人类自我挑战的新的里程碑！

二、未来人工智能和AI2.0国家战略

1、漫谈未来人工智能

关于未来，尽管以AlphaGo为代表的现在人工智能已具备了很高的水平，但还有很多的局限性。中科院院士谭铁牛在2016年中国人工智能学会年会《关于人工智能发展的思考》报告中，曾经总结过四句非常有意思的话。我是这么理解的，我的理解不一定对。

第一句是“有智能没有智慧”。智能就是“能干”，现在AI能做好非常具体的事，比如扫地、下棋，但是不具备灵性，不能创造。

第二句是“有智商没有情商”。如果让阿尔法狗训练一下智商测试的题目，估计智商可能会爆表，科大讯飞的人工智能要参加2020年高考，据说要争取考上大学本科，但估计情商还是很低。

第三句话是“会计算不会算计”。现在人工智只有“解空间”层面的局部策咯，没有“问题空间”层面的宏观战略，不会挖坑、下套这样的高级博弈。

第四句话是“会专才不会通才”。主要说现在人工智能举一反三的能力差。

基于此，未来人工智能应该做“四有新人”，也就是有智慧、有情感、有算计、有通才的新一代人工智能。当然，要实现这样的强人工智能，人类还有很长的路要走。

2、AI2.0国家战略

我国正在大力发展AI，“人工智能，中国之崛起”，对此，我们可以大有信心。AlphaGo的例子我们知道，AI由三部分构成，机器学习是AI的大脑，超算是AI的躯体，大数据是AI成长的养分，据统计43%机器学习相关论文是中国人写的，我国已经有众多的AI人才，这形成了AI垂直产业应用的人才基础。超算方面我们的太湖之光、天河二号排名世界前二，我国发展人工智能具有很强的硬件基础。大数据方面，相对欧美日等国家，我国不仅拥有更多的“冷数据”（包括人口、地理等静态数据），而且用用更多样的“热数据”（比如交易、诊疗等动态数据），大数据优势将促使我国形成特色，在人工智能时代弯道超车。

人工智能已经上升为国家战略，国家“科技创新2030 重大项目”将新增“人工智能2.0”[2]。潘云鹤院士于2016年12月在中国工程院院刊Engineering（主刊）发表了论文“Heading towardartificial intelligence 2.0”，提出了人工智能2.0的核心理念“基于重大变化的信息新环境和发展新目标的新一代人工智能”[3]。2017年1~2月，中国工程院院刊信息与电子工程学部分刊Frontiers of Information Technology & Electronic Engineering出版了“Artificial Intelligence 2.0”专题[4]，该专题分为六大方向，潘云鹤、李未、高文、郑南宁、吴澄、李伯虎、陈纯等多位院士以及专家学者对人工智能2.0中所涉及的大数据智能、群体智能、跨媒体智能、混合增强智能和自主智能等进行了深刻阐述。

三、未来人工智能视觉感知的思考

1、未来人工智能：类人服务、超人感知

根据国内外专家，未来人工智能有很多、很高远的愿景。我个人理解，至少其中一个愿景是“类人服务、超人感知”，也就是，以类人的方式服务人类自身，以超人的方式感知外部世界。在智能时代，人类智能与人工智能相互增强，相互对偶，类人服务要求具备类人智能：从人类的视角看，未来人工智能应该在感官和思维上像人；从机器的视角看，未来人工智能应该能够理解人的行为和情绪。

在传统社会是一个二元空间，人类社会和物理空间形成互训关系。在信息社会，人、机、物三者相互融合，形成一个三元空间，未来人工智能能够进行人、机、物信息的整合，以超越人类的精度和时空尺度，感知三元空间的信息关联性。多学科的研究，特别是脑计划的研究，将进一步夯实机器学习的理论基础，三元空间的大数据和超算能力将进一步提高机器学习的工程能力。机器学习、大数据、超算三者共同推动未来人工智能超人感知、类人服务的愿景。下面就这个愿景，稍微做点技术上的展开思考。

2、类人智能

类人智能就是要将类人知觉和类脑思维整合在一起，如果机器人具备逼近人类的人机交互能力，那么现在击败人类的阿尔法狗就有可能进化到陪伴人类下围棋的BeltaGo（或称之为“陪Ta狗”？）。

*来源：图片来源于互联网

在知觉层面，随着低成本、低功耗传感器的发展，未来人工智能要在视、听、味、触等不同的模态上实现对现实世界的感知和认知。具体到视觉感知，深度学习三巨头在2015 Nature上的综述论文，介绍了用CNN+RNN实现看图说话。反过来，语言能不能驱动机器视觉？我们说一句话，能不能把对应的物体定位出来？更难地，能不能自动造出来一张与这段话对应的图像?最近，生成式对抗网络（GAN）在图像自动生成方面取得重大进展[5]。如果图像和语言能够双向翻译，这将使得人工智能的视觉知觉达到一个全新的高度。

在思维层面,未来人工智能要实现类脑计算。2014年IBM 发布了类脑芯片TrueNorth，集成了100万个“脉冲神经元”，能力相当于一台超级计算机，功耗却只有65毫瓦，主要是因为它采用Spike NN结构，用类脑的异步脉冲来驱动电路，而非传统电路的同步时钟。但它还没办法高效模拟另一个重要大脑机理，也就是触突的可塑性，因此，性能离大规模商业应用还有一段距离。

从长远来看，研究类脑计算是通往强人工智能的有效方法[6]。传统的计算机相当于左脑，擅长逻辑思维，处理数字；神经元芯片相当于右脑，擅长形象思维，处理图像。IBM正想办法将两者整合在一起实现全脑的类脑计算。

*来源：图片来自于互联网

3、三元空间感知：人机物协同感知

超人的三元空间感知，在侧重物理空间的感知层面，科学家正在研究人机物协同感知。突破肉眼感知的局限性是人工智能的传统强项，目前太赫兹技术得到很大的进步，上海交通大学跟相关公司合作，在研究太赫兹图像识别，有可能在5-10米外就能够识别藏在人身上的刀枪甚至毒品。2017年3月，上海交通大学还跟联影公司成立了医学影像先进技术研究院，合作研究成像装备和大数据诊疗。可见光谱、红外光谱、太赫兹、核磁共振等一起实现全谱感知，相当于赋予了人类以天眼、慧眼。

人机物协同感知的一个重大应用就是无人车。在美国加州，全功能的无人车已经允许上路。MIT Technology Review将自动驾驶卡车评为2017年10大突破技术。百度成立了无人车事业部，也在硅谷设立了专门的研究院。

4、三元空间感知：群体智能

超人的三元空间感知，在人类社会层面，正在涌现出群体智能新技术和社会计算新学科，利用互联网、社交网络、通信网络、监控网络等不同网络的大数据，克服传统社会学调查方法数据稀少的问题，更好、更快地分析人群、组织和社会的行为。上海交通大学较早开展了这方面的探索，2009年承担了973项目“混合网络下社会集群行为感知与规律研究”，联合了信息学、管理学、社会心理学等不同领域的专家开展交叉研究，一些成果为国家提供了决策。我本人承担了其中“大尺度跨媒体社会集群行为感知”课题，结合网络媒体和视频监控，为世博会、亚信峰会等大型活动管理提供了技术支持。

在973课题基础上，我们最近承担了国家重点研发专项课题，开展大规模人群透彻感知研究，针对反恐维稳、智慧城市、交通控制等需求。利用大数据和深度学习的优势，进行多尺度、跨相机、跨平台分析，有望实现群体感知从简单、低密度、小范围场景到复杂、高密度、大范围场景的跨越。

5、三元空间感知：互联网超级智能

超人的三元空间感知，在侧重信息空间的层面，未来学家认为互联网正在向超级智能的方向不断进化，形成互联网、人工智能和人类大脑的联合智商，互联网与人类大脑高度相似，它将具备自己的视觉、听觉、触觉、运动神经系统，也会拥有自己的记忆神经系统、中枢神经系统。2011年谷歌提出了“谷歌大脑”计划，以大脑功能区，重新定义Google的业务群。最近，我国也推出了中国脑计划。

四、关于未来人工智能的

社会经济影响的思考

未来，强人工智能将深刻改变人类生活，也给人类带来巨大挑战。霍金称人工智能或威胁人类，马斯克认为人工智能是在“召唤魔鬼”。尽管我们可以相信人类能够和人工智能包容发展，至少我们要注意两方面的挑战。

一、改变就业结构。不仅大量的流水线工人正在被替代，大量的白领工作岗位也将消失。十几年前IBM深蓝打败了卡斯帕罗夫，今天我们还是不能小看IBM，AlphaGo还在打名气，IBM的读片机器人已经开始上岗。华尔街的量化交易机器人正在替代金融交易员，“今日头条”的推荐机器人正在替代初级的内容编辑。

二、强人工智能将冲击伦理关系。机器人保姆带大的小孩，还会不会跟亲妈亲？如果美女机器人拥有非凡魅力，人口数量和结构会带来怎么变化？植入了智能器官甚至机器大脑的人，还算不算人？

进一步，我们假设有一天“阿尔法狗”遇上“薛定谔的猫”的时候，也就是当强人工智能运行在量子计算机上的时候，我们的未来会怎样？

未来，机器人会是怎么样？未来学家们可能正在研究，机器人会不会做梦（意识）？机器人会不会结婚（性别）？机器人会不会用钱（信用）？机器人会不会统治人类（政治）？

未来，人类自身会怎么样？从历史观看，尤瓦尔·赫拉利不仅写了《人类简史》，还写好了《未来简史》，认为人类会从智人演化到智神。

未来，人类自身会怎么样？从生物观看，人类的密码在基因，基因分析是典型的计算密集型问题，这种单一任务的工作恰恰可能是人工智能的传统强项。有了基于量子计算的强人工智能后，人类是不是最终会全面破解基因？很久很久以前，亚当和夏娃遇上了那条蛇，偷吃了智慧之果，被逐出伊甸园。亿万年后，他们的后代遇上了一只“狗”和一只“猫”，打开了强人工智能的魔盒后，会不会摘下传说中生命树上的长生之果？这一切，人性中的欲望和贪婪，是否冥冥中早已注定？

本文作者：杨小康

来源：小康视界

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-08-28，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能

本文分享自钱塘大数据微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

人工智能

登录后参与评论

0 条评论

热度

从AlphaGo到BeltaGo，未来如何下好AI这局棋?

从AlphaGo到BeltaGo，未来如何下好AI这局棋?

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐