人工智能进化论课程导论

文章来源：企鹅号 - 人工智能进化论

欢迎来到人工智能的“进化论”课程

从进化论的角度来观察人工智能的发展，将会给大家带来全新视角来更加容易的理解人工智能未来发展趋势。这个观点是产生是我受到了AlphaGo和AlphaGozero的启发，AlphaGo谷歌deepmind团队开发的人工智能程序，我们知道去年10月AlphaGo运用监督学习算法，用上千盘人类棋手的棋谱进行训练并战胜了世界围棋冠军李世石。而zero走的是不同的路径，仅仅输入基础规则，完全不依赖人类棋手的经验，从它从一张白纸开始胡乱下棋，在不断自我对弈过程中学习。它很快超过了人类水平，并且对战前代AlphaGo取得了100：0的不败战绩。在这案例上面我们看到了机器学习展现出的巨大潜力，不断自我升级出来AlphaGozero超过人类训练和调教的AlphaGo，那是不是可以认为机器已经具有更强的学习能力了呢？在这里先不下结论，在后面会专门内容来讨论这个问题。

再说回来Zero 用了3天时间，通过数百万盘自我对弈提升战斗力，就像是它在计算机里面完成了人类千年的围棋进化历史，并探索出了不少人类棋手前所未闻招法。zero在更短的时间内学习训练，轻松战胜了前辈AlphaGo，这个训练对弈棋局数量级的远远超过人类生理极限的，这种数量级差异也带来了结果的巨大差异。可以预见以后的棋手都会把向AI学习作为一种基本训练方法，融合到自己的棋局里面，借此来的提升棋力。这就是AI改变了一个行业的学习方式的例子，而人类棋手也通过人工智能提升了自己的视野。

如果把AlphaGozero看成一种生物的话，这个学习的过程就是自我进化的演进历程，只是进化和迭代的过程都在硬件里面以电子的速度进行。AlphaGo Zero为什么可以自学成才，是应用了强化学习的新模式。系统从一个对围棋一无所知的神经网络加上一个强力搜索算法，二者结合，进行自我对弈。在对弈过程中，神经网络不断调整、升级，预测每一步落子和最终的胜利者。升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero再进行自我迭代，往复循环。每过一轮循环，系统的表现就提高了一点，自我对弈的质量也提高了一点。神经网络越来越准确，AlphaGo Zero的版本也越来越强。这个过程充分体现了进化论“物竞天择，适者生存”的原理。

最令人震惊的的是这个模型训练和深度学习的机制，是具有通用型的，也就是说不仅仅可以用于机器学习下围棋，也可以迁移应用于解决其他复杂问题。想象一下，机器学习仅用几天的时间就超越人类千年的积累，带来一个问题：人类积累下来的经验和技能在人工智能时代的究竟有多大的价值？

了解更多课程内容欢迎到微信搜索知识星球，在里面搜索订阅“人工智能进化论”课程。

人类文明所有的设计和创造物，这一切的源头就是人类的想象。那些能够被人类想象出来的东西，最终都会被实现。

发表于: 2018-07-062018-07-06 23:25:45
原文链接：https://kuaibao.qq.com/s/20180706A1Y13300?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

人工智能进化论课程导论

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐