人工智能进化论课程导论

欢迎来到人工智能的“进化论”课程

从进化论的角度来观察人工智能的发展,将会给大家带来全新视角来更加容易的理解人工智能未来发展趋势。这个观点是产生是我受到了AlphaGo和AlphaGozero的启发,AlphaGo谷歌deepmind团队开发的人工智能程序,我们知道去年10月AlphaGo运用监督学习算法,用上千盘人类棋手的棋谱进行训练并战胜了 世界围棋冠军李世石。而zero走的是不同的路径,仅仅输入基础规则,完全不依赖人类棋手的经验,从它从一张白纸开始胡乱下棋,在不断自我对弈过程中学习。它很快超过了人类水平,并且对战前代AlphaGo取得了100:0的不败战绩。在这案例上面我们看到了机器学习展现出的巨大潜力,不断自我升级出来AlphaGozero超过人类训练和调教的AlphaGo,那是不是可以认为机器已经 具有更强的学习能力了呢?在这里先不下结论,在后面会专门内容来讨论这个问题。

再说回来Zero 用了3天时间,通过数百万盘自我对弈提升战斗力,就像是它在计算机里面完成了人类千年的围棋进化历史,并探索出了不少人类棋手前所未闻招法。zero在更短的时间内学习训练,轻松战胜了前辈AlphaGo,这个训练对弈棋局数量级的远远超过人类生理极限的,这种数量级差异 也带来了结果的巨大差异。可以预见以后的棋手都会把向AI学习作为一种基本训练方法,融合到自己的棋局里面, 借此来的提升棋力。这就是AI改变了一个行业的学习方式的例子,而人类棋手也通过人工智能提升了自己的视野。

如果把AlphaGozero看成一种生物的话,这个学习的过程就是自我进化的演进历程,只是进化和迭代的过程都在硬件里面以电子的速度进行。AlphaGo Zero为什么可以自学成才,是应用了强化学习的新模式。系统从一个对围棋一无所知的神经网络加上一个强力搜索算法,二者结合,进行自我对弈。在对弈过程中,神经网络不断调整、升级,预测每一步落子和最终的胜利者。升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero再进行自我迭代,往复循环。每过一轮循环,系统的表现就提高了一点,自我对弈的质量也提高了一点。神经网络越来越准确,AlphaGo Zero的版本也越来越强。这个过程充分体现了进化论“物竞天择,适者生存”的原理。

最令人震惊的的是这个模型训练和深度学习的机制,是具有通用型的,也就是说不仅仅可以用于机器学习下围棋,也可以迁移应用于解决其他复杂问题。想象一下,机器学习仅用几天的时间就超越人类千年的积累,带来一个问题:人类积累下来的经验和技能在人工智能时代的究竟有多大的价值?

了解更多课程内容欢迎到微信搜索知识星球,在里面搜索订阅“人工智能进化论”课程。

人类文明所有的设计和创造物,这一切的源头就是人类的想象。那些能够被人类想象出来的东西,最终都会被实现。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180706A1Y13300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券