【兵棋工程总师点评】AlphaGo 的胜利与未来战争变革的曙光

胡晓峰,国防大学教授,少将军衔,兵棋工程总师。兼任中国系统仿真学会副理事长,军事运筹学会副理事长等职。长期从事智能化战争模拟及军事系统工程教学与研究工作,出版专著11部,获得国家科技进步奖3项。

万众瞩目的AlphaGo与李世石的围棋五番棋大战,最终以4:1的最终结局,宣告人类在又一个引以为傲的智能高地上败北。如果这仅仅是“深蓝”战胜人类事件的重演,倒也没有什么可以大惊小怪的。但是,AlphaGo带给我们的却是更多惊讶,以及惊讶之余的思考。虽然,悲观论者由此而开始担忧人类命运未免有点杞人忧天,但如果不能从中发现暴风雨到来之前给我们发出的信号,那我们国家和军队也就有可能在未来面临重大的挑战。AlphaGo的胜利对未来战争揭示了什么?又带给了我们什么启示?这需要我们在“大战”之后的平静中重新思考。

1、AlphaGo做到了什么?

在人机大战的五盘对弈中,透过弥漫的“硝烟”和各种各样的“喧哗”,我们看到AlphaGo到底做了些什么使我们感到惊讶?我觉得以下三点特别值得关注:

第一,与“深蓝”完全不同的学习能力。1997年“深蓝”战胜国际象棋大师卡斯帕罗夫,但它的意义完全不能同AlphaGo相比。这是因为AlphaGo的核心技术是深度学习方法,也就是说,它的围棋知识不是像“深蓝”那样是编在程序里的,而是它通过大量棋谱和自我对弈自己学会掌握的。而且,这种学习能力具有相当大的通用性。自己学习的能力,使得计算机有了进化的可能;而通用性,则使其不再局限在围棋领域。尽管这个能力目前还很初级,但却展现了极好前景,使得以前困扰我们的人工智能自我学习问题,有了解决的可能。这是一个很大的创新和进步。

第二,局部落子和整体棋局着法的平衡能力。AlphaGo通过深度学习产生出来的策略网络(或称走棋网络),在对抗过程中可以实现局部着法的优化;通过估值网络实现对全局的不间断的评估,用于判定每一步棋对全局棋胜负的影响。而且,还可以通过快速走子算法和蒙特卡洛树搜索机制,加快走棋速度,实现对弈质量和速度保证的合理折衷。这些技术使得计算机初步可以既考虑局部得失,又考虑全局整体胜负。而这种全局性“直觉”平衡能力,正是过去我们认为是人类独有的。

第三,超出人类对围棋博弈规律的理解能力。在五番棋的对抗过程中,从观战的超一流棋手讨论和反应可以发现,AlphaGo的着法有些超出了他们的预料,但事后评估又认为是好棋。有棋手就认为,人类真的可以向计算机学习围棋,加深对围棋规律的理解,觉得“它可能比我们更接近围棋之神”。这意味什么?意味着AlphaGo的深度学习算法,甚至可以从大数据中发现人类千百年来还未发现的规律和知识,为人类扩展自己知识体系开辟了新的认识通道。

这三点我认为对人工智能发展具有里程碑意义。可能有的人会认为,AlphaGo不过是一个围棋程序而已,离人类智能还有很大的距离,不值得我们如此看重。我承认,从人工智能的角度来看,AlphaGo的智能还只是非常初级的水平,无法与人类相提并论,但我为什么认为它具有里程碑意义呢?这就需要从机器智能的分类与应用说起。

一般说来,机器智能主要分为三大类:计算智能、感知智能和认知智能。在计算智能领域,以科学运算、逻辑处理、统计查询等形式化规则运算为核心,在有些方面计算机早已超过了人类,比如“天河”的科学运算和“深蓝”基于规则的暴力搜索。但也有些还无法超越人类,比如复杂符号推理。在感知智能领域,以图像理解、语音识别、语言翻译、运动控制等为代表,近期由于深度学习方法的突破,取得了重大进展,开始逐步趋于实用水平。比如谷歌的图片标注、讯飞的语音速记、机器人“大狗”等。但是,在认知智能领域,以理解、推理和决策为代表,强调“会思考”、“能决策”等,因其综合性更强,更接近人类智能,研究难度更大,长期以来一直进展缓慢。2011年出现的问答智能程序“沃森”、谷歌的无人车等,就是比较接近此类智能的典型。AlphaGo在深度学习技术上的突破,使其在自主学习、理解和推理能力上取得重大进步,使我们终于在认知智能方面看到了曙光,尽管现在还非常非常的初步。

深度学习方法在认知智能上的突破,技术上意味着我们可以在机器智能领域取得更大的进展,将原先止步不前的机器智能研究推向一个新的阶段。比如,感知智能技术会因此上一个很大的台阶,如图像理解程序就实现了自己学会认识“猫”。但在发展趋势上则意味着机器智能开始进入认知智能时代,也就是IBM说的“认知计算时代”。所以,我说AlphaGo的这个突破,与其他智能技术相比,可能更具时代里程碑的意义。

2、会对战争相关领域带来哪些影响?

一般说来,战争需求总是牵引着技术的发展。历史上一些著名的发明,比如计算机、因特网、激光、核裂变、卫星等,都是由战争需求牵引产生出来的,几乎无一例外。即使最初并没有想到用于战争,但一旦出现,它也会很快被纳入战争需求的轨道。另一项对技术牵引最大的需求则是医学,你会发现很多技术总是被首先用于医学领域,智能技术也不例外。这是因为战争会决定一个国家的命运,而医学则可以决定一个人的命运,任何人都不会等闲视之,都舍得投入巨资研发。那么,从战争需求的视角,我们从中可以看到什么样信号呢?

以深度学习方法为核心的认知智能的突破和发展,我觉得主要会在以下几个方面对战争相关领域产生重要影响:

第一,会催生更多的聪明武器和自主化无人平台。现在已经投入作战运用的无人平台,比如无人机,一般都是遥控的,还没有基本的自主决策能力,任何行动都像风筝一样,由后方操作员操纵。但认知智能的进步,会使无人平台逐步脱离操作员的控制,实现战场上的自主决策。这样,无人平台即使与后方失去联络,它也可以自主地去完成任务。如果果真如此,无人化战争也就指日可待。即使暂时还做不到完全自主,但任何认知智能技术的进步都会使武器装备变得更加“聪明”,提高武器装备的作战效果,或大大降低操作的复杂程度。

第二,会使指挥员对战场态势的认知速度大幅度提高。由于战场态势的复杂性,态势认知一般都由人来完成。比如对侦察情报的判读,面对各类手段获得的海量多媒体数据,人工分析效率极低。如果引入深度学习算法,仅仅判读目标图像一项,就可以大幅度提高情报分析的质量和速度,使得昂贵的侦察卫星不至于成为摆设。对综合性更强的战役态势分析来说,就需要更强的空间、时间、行动和条件约束的综合理解能力,很大程度上取决于指挥员的全局直觉判断能力。如果能够利用认知智能技术上的进步,利用计算机辅助指挥员去理解态势,无疑是很有帮助的,会大大提高对整个战场态势的认知速度,取得指挥控制上的敏捷性优势,掌握战场上的主动权。

第三,会使指挥信息系统克服智能辅助上瓶颈。指挥信息系统是作战能力的倍增器,但由于无法解决智能辅助问题一直无法升级换代。例如人机接口上的语音识别、草图交互等。在辅助决策、仿真评估上,则难题在作战方案的智能对接。基于深度学习的感知智能技术进步,估计将很快解决智能接口问题;但在辅助决策所需要的认知智能方面,差距还非常大。这是因为计算机在辅助决策时,无法预估对手会采取什么样的反应,而且战争复杂性导致的不确定性存在,使得后续行动也无法事先确定。所以,这就要求系统必须有智能化的认知理解能力,能够看懂态势并能根据实际作出判断和处置。

第四,会助推兵棋推演实现真正的人机对抗。兵棋不是“棋”,而是逼真的战争模拟系统,但它现在还很难完全自动地模拟出对手的复杂行为,还需要由专门训练的人扮演敌军。但是,这种被红军思维潜移默化影响多年的蓝军,很难避免“红军”的思维特点,使得“红蓝对抗”变成了“红红对抗”,推演效果大打折扣。认知智能的进步,使得计算机可以逼真地扮演对手,即“机器蓝军”,就像李世石与AlphaGo对抗一样,这样的推演结果才会更加可信,演习效果也可大大提高。这一点,无论在高层的战略、战役模拟,还是在低层的战斗模拟,都非常需要。这种对战争对手、社会和环境逼真模拟,非要认知智能技术的进步不可。

第五,会拓展认识信息化战争机理的新途径。这是最值得重视的方面。在AlphaGo人机大战之前,我们谁也没有想到这一点,但整个对弈过程给了我极大的启示。AlphaGo不仅在人类的知识体系里面“思考”,而且还展现了找到人类知识体系之外规律的迹象,这不能不说是一个惊喜。这告诉我们,在很多现在还找不到相应科学知识加以解释的经验学科方面,是不是通过深度学习方法和大数据的结合,能够帮助我们去理解和总结相应的知识呢?比如依赖千百年经验的中医学科,以及同样依赖经验的军事学科和社会学科等。如果果真如此,那带给我们的就不仅仅是人工智能技术的进步,而是在认识论、方法论上的进步了!

但是必须注意,AlphaGo博弈与战争的对抗差别极大。AlphaGo是在围棋固定规则下的完全信息博弈,而且具有大量人类对弈的样本可以利用,因而通过深度学习才有涌现出围棋智能的可能。而战争则是不完全信息乃至虚假信息下的对抗,规则和目标也并不固定,尤其是缺乏可供学习的参考样本。这给深度学习带来极大的困难。

因此,就必须结合更多的智能技术,例如将“沃森”的基于自然语言的知识获取和统计推理技术、基于贝叶斯方法的复杂概念建模技术,也包括“深蓝”的基于规则驱动的暴力搜索技术等。样本数据的获取也可以通过对战争历史、对抗推演、靶场试验、局部自动交互仿真等多种方式获得。只有这样,才有可能创新出对战争对抗规律理解的深度学习方法方法。

3、我们应该如何应对?

虽然AlphaGo的进步是非常初步的,但它却像一个神启,告诉了我们未来战争会是怎样,尽管那还非常遥远。但一旦实现,那就是一个新的时代,即所谓“智能化战争”的时代,必将取代现在的信息化战争时代。因此,我们不能袖手旁观。

第一,更新时代观念。这是永不过时的命题,因为时代总是在发展,有时快,有时慢,但绝不会停止。现在我们必须意识到,战场上对抗不仅仅行动要快,即所谓“快鱼吃慢鱼”;而且还要意识到,由于机器智能的突破,会带来认知速度、学习速度的比拼,也就是认知要快,“巧鱼吃笨鱼”,未来认知速度将成为决定胜负的关键。这是不同时代的技术带来的时代差,同时代尚可“以弱胜强”,但若处于不同时代则根本没有这个可能。而提高认知速度最可行的途径,就是首先实现人的智能与机器智能的结合,卡斯帕罗夫和李世石战败后都认为未来必须如此。

第二,突破关键技术。关键在于创新和一定规模的探索。我国的深度学习、机器智能技术基础研究应该说并不比其他国家慢,这点从发表的论文中就可以看出。但是,我们现在缺的是将这些理论进行转化的关键技术,可以展现实际应用效果的牵引性示范项目,以及创新团队的领军人才。我们必须将人工智能技术作为战略核心技术加以关注和支持,并加大投入,培育队伍,才不会让我们在未来的竞争中再次落后。谷歌公司2012年深度学习项目仅有不到100个,而在2015年就超过了2700多个,可见它的重视程度。

第三,防止技术突袭。必须防止出现颠覆性的技术突袭。美国已经意识到了这一点,并且已经展开了大规模的研究布局,意图像抢占互联网霸权那样,再次抢占认知智能领域的霸权。它们的脑计划等就说明了这一点。DARPA认为,未来智能项目重在人机结合,所以起名“半人马项目”,以应对第三次抵消战略的需要。其重点目标在无人机群、智能雷达、网络作战,以及应对情报的数据洪流方面。国防部以及美军各军兵种,都将人工智能或类似相关研究作为了未来突破的重点,以期未来有所突破。因此,我们必须加以重视,防止出现对我们非常不利的技术突袭。AlphaGo可以说就是一个对我们的重要技术预警信号。

AlphaGo的胜利,使得我们已经听见了智能化战争时代的敲门声。虽然还很遥远,也还有那么多的不确定性,但我们也必须赶快起来打开门户,去迎接智能化战争的到来。新时代的曙光已经初现,太阳终究必将升起,它不会理会你是否已经起床,是否已经做好准备,这是战争变革的必然规律。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2016-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CVer

聊聊找AI算法岗工作

首先,本文不是为了增加大家的焦虑感,而是站在一名学生的角度聊聊找AI算法岗位的那些事儿(不喜请喷)。

8360
来自专栏机器人网

横扫棋坛后,AI机器的下个目标是征服翻译界

如果你的朋友圈有一位人工智能行业的创业者,你可能会有些焦虑,因为他可能会隔三差五地转个文章告诉你哪些行业要灭绝了。礼拜二,阿尔法狗「胜天半子」的时候大家也都很慌...

3676
来自专栏量子位

AI时代要来了,怎样让我们的下一代做好准备?

唐旭 编译自 《哈佛商业评论》 量子位 报道 | 公众号 QbitAI ? AI正在各个行业内掀起一场革命,但很多人还没有想好该如何迎接它。 近日,CMU计算机...

3375
来自专栏量子位

AI全面超越人类还需多少年?352名专家预测(附论文)

安妮 编译整理自Inverse 量子位出品 | 公众号 QbitAI ? 展望未来,AI可以在10年后模仿出斯威夫特的歌曲,37年后可以代替人类进行手术,86年...

37510
来自专栏新智元

乂学栗浩洋:教育版AlphaGo打破垄断,撬动2000亿在线教育市场

新智元 AI 技术峰会 演讲人:栗浩洋(乂学教育创始人) 【新智元导读】据艾瑞咨询的报告,2018年中国在线教育市场规模达2727.1 亿元,AI+教育...

3134
来自专栏大数据文摘

DOTA2获胜的AI比AlphaGo厉害?还是媒体和马斯克在联合炒作?

1443
来自专栏新智元

BigThink强推:AI的十本必读佳作

1790
来自专栏挖数

AI革命,通往超级人工智能之路

本文翻译自Tim Urban的《The AI Revolution: The Road to Superintelligence》,截止目前该文章在Facebo...

1K11
来自专栏CVer

大牛分享:@爱可可成长记

从一个人的狂欢到一群人的狂欢,到除了我以外其他人的狂欢,我其实是越来越冷静了。——陈光

1636
来自专栏数据派THU

基于问题导向与成果产出的教学模式:《大数据与城市规划》特色课程

[ 编者按 ]2015年12月,清华大学推出“大数据能力提升项目”,旨在促进大数据人才培养,服务国家大数据发展战略。项目由清华-青岛数据科学研究院(以下简称:数...

1613

扫码关注云+社区

领取腾讯云代金券