谷歌旗下人工智能公司DeepMind将围棋AI转战国际象棋和日本将棋领域——无须人类智慧加持,已胜券在握。
AlphaZero是由谷歌旗下DeepMind研发的通用棋类AI,以不到四小时的自学击败了世界最强的国际象棋程序。
重新改进的人工智能程序AlphaZero曾多次击败世界顶级围棋选手,并扩大到学习其他棋类项目。它从零开始学习国际象棋,仅用4小时,就在100盘比赛中击败了世界顶级国际象棋程序 Stockfish 8。
据在康奈尔大学图书馆的arXiv上发表的一篇未经同行评审的研究论文称,在这100场比赛中,AlphaZero或赢或平,没输过一场。
该论文写道:“从随机对弈开始,在除了给定的游戏规则外没有任何领域知识的情况下,AlphaZero在24小时内分别击败了世界顶级的国际象棋和日本将棋(日本类似与象棋的棋盘游戏)程序——同围棋一样,达到了超人类水平。”该论文作者之一为DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis),曾是一位国际象棋神童,13岁便达到了大师级水平。
“这是一项非凡的成就,在AlphaGo之后我们就应该预料到这一天。”前世界国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov)接受Chess.com采访时说道。“我们总是认为国际象棋需要大量经验,而没有人类智慧的加持,一部机器从零开始绝不可能达到那么高的水准。”
自IBM深蓝(Deep Blue)超级计算机于1997年5月12日击败卡斯帕罗夫以来,一些计算机程序已陆续击败不少世界顶级国际象棋选手。
DeepMind 表示,AlphaZero与其竞争者的不同之处在于,它通过强化学习算法自我对弈,其机器学习过程中除了基本的国际象棋规则之外没有人类知识的介入。
DeepMind表示,正是基于以上方法,AlphaZero能够采取“更接近人类的方式”搜索落子位置。在国际象棋对弈中,AlphaZero每秒仅需搜索8万个局面,而Stockfish 8每秒则需搜索7000万个局面。
以白棋的先行优势赢了25场后,AlphaZero还以黑棋赢得3场比赛,另外的72场则与Stockfish 8打成平手。AlphaZero仅用2小时自我训练便以90胜,8负和2平的成绩击败了日本将棋最强程序Elmo。
这一通用型AI只需8小时的自我训练,便以60胜,40负的成绩击败了其前身——被称作“超人类”的AlphaGo。
许多专家对这些战绩感到震惊,认为AlphaZero可能应用于更广泛的领域,扩展人类智慧。英国巴斯大学计算机科学家、人工智能研究员乔安娜·布赖森(Joanna Bryson)则提醒道,AlphaZero仍旧只是“离散性的任务”。
编译:黄敏华 审校:王嘉腾
来源:卫报
领取专属 10元无门槛券
私享最新 技术干货