一个Oracle软工眼中的AlphaGo

有个90后叫"Andrey Kurenkov", 目前是Oracle 圣何塞的一名软件工程师, 这个小哥,年纪青青, 已经写了两部史书了。

“A 'Brief' History of Neural Nets and Deep Learning” 共4篇

“A 'Brief' History of Game AI Up To AlphaGo” 共3篇

Andrey毕业于著名的Georgia Institute of Technology, GIT, 获得过校长奖学金。 Python玩的出神入化的, 他之所以走上写简史的路,因为这个小哥缺钱, 就去当了TA, 然后要给学生介绍一些人工智能(AI), 然后就一发而不可收拾了。 所以说, 缺钱感才是工程氏的望岛。

下面引述一下他的“AlphaGo简史”, 希望大家有时间去读一下这个TA的简史!

上部

http://www.andreykurenkov.com/writing/a-brief-history-of-game-ai/

话说, 新中国成立那年(1949), 大神香浓(Shannon )召唤下Minimax的出世。 并且搞了个Chess的程序。

3年后,1952年, 另外一个大神图灵(Turing)解释了Chess程序的构思。

4年后,1956年, IBM的Arthur Samuel搞定西洋跳棋(Checker), 依然基于Minimax算法。

再1年后, 1957年Alex Bernstein提出启发式heuristics Minimax算法。

上部完!

中部

http://www.andreykurenkov.com/writing/a-brief-history-of-game-ai-part-2/

再1年后, 1958年, NSS (Newell, Shaw, and Simon) 提出 alpha-beta pruning

第一次战胜人类

Herbert Simon (左) 和 Allen Newell (右)

大概30年后, 1989年,机器学习的有监督学习(supervised learning)加入战局

大概3年后, 1992年, 强化学习(reinforcement learning)加入战局, 第一个应用的IBM的Gerald Tesauro。

大概5年后, 深蓝(deep blue)横空出世,采用了并行的alpha-beta prunning。至此, 机器在大部分棋类(除了围棋go)游戏胜过人类(human stops winning)。

中部完!

下部

http://www.andreykurenkov.com/writing/a-brief-history-of-game-ai/

90年代, Monte Carlo algorithms和simulated annealing等优化算法有了突破。

1993年, Bernd Brügmann提出 “Monte Carlo Go” ,开始正式挑战围棋程序。

Monte-Carlo Tree Search (MCTS) 被Rémi Coulom提出

2006年,CrazyStone 和 MoGo 应用MCTS获得极大成功。 但是依然不能战胜人类顶级高手。

2012年, CNN深度学习网络获得极大成功。

2014年, 强化学习的Q-learning模型获得极大成功(DeepMind的 Atari player ),Google立即花了$400 million收购Deepmind

2016年, alphago结合了MCTS, CNN, Reinforcement Learning, 横空出世。 迅速战胜了人类高手。

在GPU配置下, AlphaGo在算法大集成下, 战胜人类最高水平李世石Lee Sedol

下部完。

小结, 本文根据90后软工"Andrey Kurenkov"的精彩描述, 提炼了时间点和技术。 所以要彻底明白AlphaGo就必须了解这些所有的技术。

原文发布于微信公众号 - AI2ML人工智能to机器学习(mloptimization)

原文发表时间:2016-12-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【重磅】中国研究再登Cell封面,AI影像诊断系统精准度堪比顶尖医师

编辑:刘小芹、张乾 【新智元导读】中国团队的研究成果发表在今天出版的《细胞》封面上,这是继克隆猴之后不到一个月内,中国科研成果再次发表在顶级生物学刊物上。本次研...

35080
来自专栏架构师之路

抢红包统计学(技术贴,知道为啥自己越抢越穷了吧)

抢红包统计学(技术贴,知道为啥自己越抢越穷了吧) 一、引言 过年前微信群里面流行起来一种“红包接力”的玩法,大概的规则是:群里面先由一人发一个红包,然后大家开始...

40750
来自专栏人工智能头条

高级搜索树+深度增强学习,Google DeepMind AI算法击败欧洲围棋冠军

19650
来自专栏美图数据技术团队

浅谈博弈论

感谢阅读「美图数据技术团队」的第 18 篇原创文章,关注我们持续获取美图最新数据技术动态。

38610
来自专栏龙行天下CSIEM

科学瞎想系列之七十九 永磁电机(2)

【图片部分来自网络如有侵权敬请邮箱联系。欢迎原文转发到朋友圈,未经许可的媒体平台谢绝转载,如需转载或合作请邮件联系。联系邮箱laolicsiem@126.com...

29920
来自专栏龙行天下CSIEM

科学瞎想系列之十八 能源危机的化解

上回说到,能源危机其实不是能量没了,只是越来越不好用了,那么如何才能化解这个危机呢?推广可再生能源是一个不错的点子。 有人会问了,你不是说能量...

30170
来自专栏WOLFRAM

Mathematica 谜中智 | 赏九美图 戏九连环

27250
来自专栏华章科技

这是有史以来第一部由人工智能做编剧的电影短片。。。

就在前几天的伦敦科幻电影节的48小时短片制作挑战赛上,导演 Oscar Sharp (奥斯卡·夏普,下文称夏普),和来自纽约大学人工智能领域的研究者 Ross ...

8550
来自专栏绿巨人专栏

博弈论(Game Theory) - 04 - 纳什均衡

447100
来自专栏悦思悦读

用一个高考数据的例子,说明数据的误导

又是一年高考 高考成绩刚出,正在紧张的志愿填报阶段。朋友圈里每天被高考刷屏。消息大部分可归为两类:i) 推荐学校,和ii)感叹阶级固化“寒门再难出贵子”。 后一...

33880

扫码关注云+社区

领取腾讯云代金券