首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >从AlphaGo到BeltaGo,未来如何下好AI这局棋?

从AlphaGo到BeltaGo,未来如何下好AI这局棋?

作者头像
钱塘数据
发布2018-03-06 11:40:41
1.1K0
发布2018-03-06 11:40:41
举报
文章被收录于专栏:钱塘大数据钱塘大数据
2016年,人工智能60周年。

1956年夏,麦卡锡、明斯基等正式确立了人工智能(ArtificialIntelligence)这一术语,标志着人工智能学科的诞生。

60年后,AlphaGo战胜李世石,确立了人工智能新的里程碑。智能时代正在到来,站在人工智能的历史性关口,斯蒂芬·霍金、雷·库兹韦尔、尤瓦尔·赫拉利等一大批国际学者对人工智能的未来做过大胆预测。人工智能已上升为国家战略,国家“科技创新2030 重大项目”将新增“人工智能2.0”。最近,我国一批院士以及专家学者对未来人工智能和人工智能2.0进行了深刻阐述。

一、从AlphaGo看人工智能现状

1、AlphaGo是谁?

根据世界围棋排行榜,AlphaGo的工作单位是Google DeepMind,性别:无,国籍:英国。它的战绩为,2016年一月份胜了欧洲冠军,两个月后胜了世界冠军,当时,有同学问我,如果AlphaGo和柯杰下,谁赢?当时,我说,我猜AlphaGo赢,因为AlphaGo是在科学原理上赢了李世石。很不幸,我猜中了。2017年1月份对决柯洁等,60胜1和,聂卫平随后在微博上赞叹:“它是围棋上帝派来给人类引路的”。

*来源:www.goratings.org,2016.7.1

2、AlphaGo为什么能赢?

围棋是棋类游戏的皇冠上的明珠,最复杂的棋类游戏,最能体现人类智慧。在这么一个19*19的棋谱上,它的搜索复杂度高达250^150。

这有多复杂?

这是宇宙级别的复杂度,根据天体物理,整个宇宙粒子数量在10^80级别。由此可见,围棋有多复杂,这也是AlphaGo震撼人类的原因。我们知道人类高手下围棋主要靠宏观的直觉,加上局部的计算。AlphaGo能够赢在于利用最新的深度学习技术,模仿高手,并通过自我学习超越高手。

AlphaGo的第一招:模仿高手,学习高手的棋形。

要模仿高手棋形,AlphaGo需要一个分类器来判断棋形象不象高手的棋形。围棋盘可以看成是19*19的图像,虽然这个图像很小很小,但是有250^150种变化,要对这些变化分成高手棋形、非高手棋形,是一个挺难的机器学习问题。难就难在高手棋形的特征不好定义、不好提取。在人脸识别、车牌识别中,我们可以定义颜色、边缘、关键点等特征,显然围棋棋形的特征不能这样定义。深度学习是一种最新的特征学习方法,能够自动学出好的特征。

AlphaGo用了最新的图像分类器,叫深度卷积神经网络(DCNN)。不同于传统的人工神经网络,他层数特别多,学习和分类的能力特别强。神经网络1943年就提出来了,50年代末和80年代中兴起过两波研究热潮,以前的人工神经网络层数很浅,一般只能训练两个隐层,只能解决一些简单识别问题。2000年左右,G. Hinton等提出了一套预训练后向传播的方法,当时就能训练10几层,现在的深度学习能够学习100多层。DCNN是专门针对图像识别的深度学习方法,对局部图像进行卷积计算,效率很高。

*来源:图片来自于互联网

Nature上有一篇介绍深度学习的综述,G. Hinton、Y. Lecan、Y. Bengio等深度学习三巨头是共同作者[1]。Hinton、Lecun相继去了Google、Facebook,而Bengio继续留在学术界。这是一个非常有意思的现象。一方面,深度学习跟以前的学术热点不太一样,之前,学术界曾经有过很多的热点,但工业界很少跟进,更谈不上花巨资去学术界挖著名科学家。Hinton、Lecun到工业界兼职,说明深度学习是真正有用的,有可能改变产业格局。另一方面,深度学习的成功更多是在应用层面的,很多理论问题还不清楚。两人去工业界,一人留在学术界,是一种很健康的现象。

深度学习能够发挥巨大威力的前提是,要有大量的数据用来训练深度结构,深度学习会涉及到到上百万、甚至上亿的参数,如果数据不够,很容易过拟合、降低性能。而要进行这样大规模的训练,就要有超强的计算能力。其实DCNN 1998年就提出来了,当时只能解决NIST符号识别问题,现在能够解决ImageNet问题,其使用的深度学习结构基本没变,主要是用了更强的CPU和以前没有的GPU,并且用了千万倍的训练图像。据说,AlphaGo存有15万职业棋手、百万业余高手的棋谱,训练的时候会用到1202个CPU,176个GPU。现在GPU服务器在深度学习研究中已经是基本配置。

*来源:Fei-Fei LI,ICME2016大会报告

AlphaGo的第二招:自我学习,自我进化。

模仿高手还不足以超越高手,要超越顶尖高手,AlphaGo用了一个自我学习的方法,就像金庸小说《射雕英雄传》中的老顽童周伯通,左右互博,自己跟自己学。AlphaGo可以开出两个程序,自己跟自己下。高手也会自己跟自己摆棋谱,高手摆棋谱摆得慢,需要吃饭、休息。而阿尔法狗只要有电,就一直可以左右互博下去,这就使得阿尔法狗有可能超越高手。

为了达到左右互博的效果,AlphaGo用了一个叫深度强化学习的技术,Google 2014年收购DeepMind后, 申请了深度强化学习的专利。强化学习很符合智能体的学习规律,小孩在不断跌倒中学会走路,猴子在胡萝卜加大棒下学会做马戏。强化学习的特点,一方面是Agent通过环境交互中学习,另一方是,训练标注稀少,奖赏在现实世界中,通常是不轻易使用的,并且通常是有一定延时的。比如,孩子考试考得好,我们会给点奖励,但是考试不是经常考,考完要有一段时间才能知道结果。

强化学习主要包括感知、行动、奖赏三个环节,构成一个状态转移空间。学习过程可以用马尔科夫决策过程来表示。以前的强化学习的算法训练只能解决很小的状态转移空间。AlphaGo面临的是一个超大转移空间的问题,同时还是一个带有超长延时训练标注的问题,一开始的棋,不太好量化好坏,直到很后面才能够数出各自大概的目数,判断输赢,这就可以归结成为一个深度强化学习问题。这个问题恰恰可以用深度的递归神经网络(DRNN)解决。DRNN的训练和前面的卷积神经网络没有太多的区别。

在左右互博中,AlphaGo 局部会采用一种叫蒙特卡洛搜索树的随机策略进行搜索,先用前面提到的CNN的简化版本,快速定位比较好的落子方案,同时通过随机策略,给了其他位置一定的概率。随机策略使得整个系统能够自我进化,简化的CNN兼顾了速度和效率。

把两招合在一起就是:深度卷积网络,模仿高手,寻找好的落点;深度强化学习,形成左右互博,自我进化。深度强化学习另外一个副产品就是产生了海量的对局,用来充实深度卷积网络的训练数据,两招完美结合在一起。

3、再论AlphaGo是谁?

AlphaGo是最新深度学习方法、棋谱大数据以及最新超算体系的总和,它还以现代科学技术指数发展原理继续进化,并且没有任何情绪波动。既然AlphaGo是这样的一个人工智能系统,是不是它已经在科学原理上已经战胜了人类棋手?在此我想说,作为人类个体的李世石、柯洁们,虽然告负,但对人类整体来说,这无疑是人类自我挑战的新的里程碑!

二、未来人工智能和AI2.0国家战略

1、漫谈未来人工智能

关于未来,尽管以AlphaGo为代表的现在人工智能已具备了很高的水平,但还有很多的局限性。中科院院士谭铁牛在2016年中国人工智能学会年会《关于人工智能发展的思考》报告中,曾经总结过四句非常有意思的话。我是这么理解的,我的理解不一定对。

第一句是“有智能没有智慧”。智能就是“能干”,现在AI能做好非常具体的事,比如扫地、下棋,但是不具备灵性,不能创造。

第二句是“有智商没有情商”。如果让阿尔法狗训练一下智商测试的题目,估计智商可能会爆表,科大讯飞的人工智能要参加2020年高考,据说要争取考上大学本科,但估计情商还是很低。

第三句话是“会计算不会算计”。现在人工智只有“解空间”层面的局部策咯,没有“问题空间”层面的宏观战略,不会挖坑、下套这样的高级博弈。

第四句话是“会专才不会通才”。主要说现在人工智能举一反三的能力差。

基于此,未来人工智能应该做“四有新人”,也就是有智慧、有情感、有算计、有通才的新一代人工智能。当然,要实现这样的强人工智能,人类还有很长的路要走。

2、AI2.0国家战略

我国正在大力发展AI,“人工智能,中国之崛起”,对此,我们可以大有信心。AlphaGo的例子我们知道,AI由三部分构成,机器学习是AI的大脑,超算是AI的躯体,大数据是AI成长的养分,据统计43%机器学习相关论文是中国人写的,我国已经有众多的AI人才,这形成了AI垂直产业应用的人才基础。超算方面我们的太湖之光、天河二号排名世界前二,我国发展人工智能具有很强的硬件基础。大数据方面,相对欧美日等国家,我国不仅拥有更多的“冷数据”(包括人口、地理等静态数据),而且用用更多样的“热数据”(比如交易、诊疗等动态数据),大数据优势将促使我国形成特色,在人工智能时代弯道超车。

人工智能已经上升为国家战略,国家“科技创新2030 重大项目”将新增“人工智能2.0”[2]。潘云鹤院士于2016年12月在中国工程院院刊Engineering(主刊)发表了论文“Heading towardartificial intelligence 2.0”,提出了人工智能2.0的核心理念“基于重大变化的信息新环境和发展新目标的新一代人工智能”[3]。2017年1~2月,中国工程院院刊信息与电子工程学部分刊Frontiers of Information Technology & Electronic Engineering出版了“Artificial Intelligence 2.0”专题[4],该专题分为六大方向,潘云鹤、李未、高文、郑南宁、吴澄、李伯虎、陈纯等多位院士以及专家学者对人工智能2.0中所涉及的大数据智能、群体智能、跨媒体智能、混合增强智能和自主智能等进行了深刻阐述。

三、未来人工智能视觉感知的思考

1、未来人工智能:类人服务、超人感知

根据国内外专家,未来人工智能有很多、很高远的愿景。我个人理解,至少其中一个愿景是“类人服务、超人感知”,也就是,以类人的方式服务人类自身,以超人的方式感知外部世界。在智能时代,人类智能与人工智能相互增强,相互对偶,类人服务要求具备类人智能:从人类的视角看,未来人工智能应该在感官和思维上像人;从机器的视角看,未来人工智能应该能够理解人的行为和情绪。

在传统社会是一个二元空间,人类社会和物理空间形成互训关系。在信息社会,人、机、物三者相互融合,形成一个三元空间,未来人工智能能够进行人、机、物信息的整合,以超越人类的精度和时空尺度,感知三元空间的信息关联性。多学科的研究,特别是脑计划的研究,将进一步夯实机器学习的理论基础,三元空间的大数据和超算能力将进一步提高机器学习的工程能力。机器学习、大数据、超算三者共同推动未来人工智能超人感知、类人服务的愿景。下面就这个愿景,稍微做点技术上的展开思考。

2、类人智能

类人智能就是要将类人知觉和类脑思维整合在一起,如果机器人具备逼近人类的人机交互能力,那么现在击败人类的阿尔法狗就有可能进化到陪伴人类下围棋的BeltaGo(或称之为“陪Ta狗”?)。

*来源:图片来源于互联网

在知觉层面,随着低成本、低功耗传感器的发展,未来人工智能要在视、听、味、触等不同的模态上实现对现实世界的感知和认知。具体到视觉感知,深度学习三巨头在2015 Nature上的综述论文,介绍了用CNN+RNN实现看图说话。反过来,语言能不能驱动机器视觉?我们说一句话,能不能把对应的物体定位出来?更难地,能不能自动造出来一张与这段话对应的图像?最近,生成式对抗网络(GAN)在图像自动生成方面取得重大进展[5]。如果图像和语言能够双向翻译,这将使得人工智能的视觉知觉达到一个全新的高度。

在思维层面,未来人工智能要实现类脑计算。2014年IBM 发布了类脑芯片TrueNorth,集成了100万个“脉冲神经元”,能力相当于一台超级计算机,功耗却只有65毫瓦,主要是因为它采用Spike NN结构,用类脑的异步脉冲来驱动电路,而非传统电路的同步时钟。但它还没办法高效模拟另一个重要大脑机理,也就是触突的可塑性,因此,性能离大规模商业应用还有一段距离。

从长远来看,研究类脑计算是通往强人工智能的有效方法[6]。传统的计算机相当于左脑,擅长逻辑思维,处理数字;神经元芯片相当于右脑,擅长形象思维,处理图像。IBM正想办法将两者整合在一起实现全脑的类脑计算。

*来源:图片来自于互联网

3、三元空间感知:人机物协同感知

超人的三元空间感知,在侧重物理空间的感知层面,科学家正在研究人机物协同感知。突破肉眼感知的局限性是人工智能的传统强项,目前太赫兹技术得到很大的进步,上海交通大学跟相关公司合作,在研究太赫兹图像识别,有可能在5-10米外就能够识别藏在人身上的刀枪甚至毒品。2017年3月,上海交通大学还跟联影公司成立了医学影像先进技术研究院,合作研究成像装备和大数据诊疗。可见光谱、红外光谱、太赫兹、核磁共振等一起实现全谱感知,相当于赋予了人类以天眼、慧眼。

人机物协同感知的一个重大应用就是无人车。在美国加州,全功能的无人车已经允许上路。MIT Technology Review将自动驾驶卡车评为2017年10大突破技术。百度成立了无人车事业部,也在硅谷设立了专门的研究院。

4、三元空间感知:群体智能

超人的三元空间感知,在人类社会层面,正在涌现出群体智能新技术和社会计算新学科,利用互联网、社交网络、通信网络、监控网络等不同网络的大数据,克服传统社会学调查方法数据稀少的问题,更好、更快地分析人群、组织和社会的行为。上海交通大学较早开展了这方面的探索,2009年承担了973项目“混合网络下社会集群行为感知与规律研究”,联合了信息学、管理学、社会心理学等不同领域的专家开展交叉研究,一些成果为国家提供了决策。我本人承担了其中“大尺度跨媒体社会集群行为感知”课题,结合网络媒体和视频监控,为世博会、亚信峰会等大型活动管理提供了技术支持。

在973课题基础上,我们最近承担了国家重点研发专项课题,开展大规模人群透彻感知研究,针对反恐维稳、智慧城市、交通控制等需求。利用大数据和深度学习的优势,进行多尺度、跨相机、跨平台分析,有望实现群体感知从简单、低密度、小范围场景到复杂、高密度、大范围场景的跨越。

5、三元空间感知:互联网超级智能

超人的三元空间感知,在侧重信息空间的层面,未来学家认为互联网正在向超级智能的方向不断进化,形成互联网、人工智能和人类大脑的联合智商,互联网与人类大脑高度相似,它将具备自己的视觉、听觉、触觉、运动神经系统,也会拥有自己的记忆神经系统、中枢神经系统。2011年谷歌提出了“谷歌大脑”计划,以大脑功能区,重新定义Google的业务群。最近,我国也推出了中国脑计划。

四、关于未来人工智能的

社会经济影响的思考

未来,强人工智能将深刻改变人类生活,也给人类带来巨大挑战。霍金称人工智能或威胁人类,马斯克认为人工智能是在“召唤魔鬼”。尽管我们可以相信人类能够和人工智能包容发展,至少我们要注意两方面的挑战。

一、改变就业结构。不仅大量的流水线工人正在被替代,大量的白领工作岗位也将消失。十几年前IBM深蓝打败了卡斯帕罗夫,今天我们还是不能小看IBM,AlphaGo还在打名气,IBM的读片机器人已经开始上岗。华尔街的量化交易机器人正在替代金融交易员,“今日头条”的推荐机器人正在替代初级的内容编辑。

二、强人工智能将冲击伦理关系。机器人保姆带大的小孩,还会不会跟亲妈亲?如果美女机器人拥有非凡魅力,人口数量和结构会带来怎么变化?植入了智能器官甚至机器大脑的人,还算不算人?

进一步,我们假设有一天“阿尔法狗”遇上“薛定谔的猫”的时候,也就是当强人工智能运行在量子计算机上的时候,我们的未来会怎样?

未来,机器人会是怎么样?未来学家们可能正在研究,机器人会不会做梦(意识)?机器人会不会结婚(性别)?机器人会不会用钱(信用)?机器人会不会统治人类(政治)?

未来,人类自身会怎么样?从历史观看,尤瓦尔·赫拉利不仅写了《人类简史》,还写好了《未来简史》,认为人类会从智人演化到智神。

未来,人类自身会怎么样?从生物观看,人类的密码在基因,基因分析是典型的计算密集型问题,这种单一任务的工作恰恰可能是人工智能的传统强项。有了基于量子计算的强人工智能后,人类是不是最终会全面破解基因?很久很久以前,亚当和夏娃遇上了那条蛇,偷吃了智慧之果,被逐出伊甸园。亿万年后,他们的后代遇上了一只“狗”和一只“猫”,打开了强人工智能的魔盒后,会不会摘下传说中生命树上的长生之果?这一切,人性中的欲望和贪婪,是否冥冥中早已注定?

本文作者:杨小康

来源:小康视界

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-08-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 钱塘大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云小微
腾讯云小微,是一套腾讯云的智能服务系统,也是一个智能服务开放平台,接入小微的硬件可以快速具备听觉和视觉感知能力,帮助智能硬件厂商实现语音人机互动和音视频服务能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档