为什么人工智能在围棋上能几乎击败全人类?

  • 回答 (7)
  • 关注 (0)
  • 查看 (143)

棋类游戏一直被视为顶级人类智力试金石,人工智能挑战棋类大师的好戏也接连上演,但按照现在人工智能的发展,人工智能在围棋上几乎击败全人类,是怎样做到的呢?

酒当歌酒当歌提问于
初冬微笑已冻僵回答于

人工智能围棋赛手运用到的深度神经网络是 Policy Network(策略网络)以及 Value Network(值网络)。策略网络和值网络任务在于合作挑选出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。策略网络负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。这样 AI 就不用给每一步以同样的重视程度,可以重点分析那些有戏的棋着。值网络负责减少搜索的深度——AI 会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。更通俗的解释是,策略网络着眼于当下,选择下一步走法。值网络思考得更加长远,预测棋局的走向。DeepMind 用人类围棋高手的两千万步围棋走法训练 AI,这种方法称为监督学习(supervised learning),然后让 AI 和自己对弈,这个流程称之为强化学习(reinforcement learning)。征服围棋最重要的意义在于,这些人工智能赛手不仅是遵循人工规则的“专家”系统,它还通过深度学习技术自行掌握了如何赢得围棋比赛。

回答过的其他问题

深度学习的原理和具体实现是什么?

这个。。。说不清楚,不过你可以学习一下腾讯云的这个TensorFlow 系列实验,TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。它由 Google 的团队开发出来,用于机器学习和深度神经网络方面的研究。本系列包含三个阶段,...... 展开详请

云服务器送虚拟主机吗?

不送! 自己安装环境,想要多少虚拟主机就有多少! 可以选择这里的镜像直接来配置! https://market.cloud.tencent.com/list?cid=58... 展开详请

是怎么回事备按下来了 区域名还是没办法使用?

耐心等待信息同步,腾讯云从工信部获取数据需要时间,有数据了再到解封也需要时间!

如何使用JavaScript以编程方式选择<img>元素?

我选择元素的个人选择是jQuery:

那么,要获得您选择的元素是:

$(“IMG#YOURIMAGEHERE”)。

如何在React路由器中处理来自外部auth应用程序的post响应?

我能够找出这个问题的原因。oauth2授权调用,将response_mode设置为“form_post”,而不是“form_get”。(oauth2 / authorize?client_id = xxx&redirect_uri = https:// localhost:30...... 展开详请

如何在pandas的不同列中分割多行?

尝试使用str访问器,split使用正则表达式查找空格并打开paranthesis或关闭paranthesis: df.title.str.split('\s\(|\)',expand=True) .drop(2, axis=1) .set_axis(['movies'...... 展开详请

扫描关注云+社区