“全能棋王”AlphaZero的启示 直觉如何战胜逻辑

来源:新浪科技  作者:DeepTech

现代文明和科技已经使得我们的直觉不断退化。绝大多数人都没有意识到直觉的价值甚至没有意识到它的存在。作为复杂计算的基础,直觉是一种很容易被忽视的非常规方法。这种非常规性使得许多研究人员忽视它的潜力。

本文引用地址:http://www.eepw.com.cn/article/201712/373152.htm

我在人工智能领域所做的工作围绕“先进的认知机器将使用直觉作为其智力基础”这一想法。我们人类的思想为一般化的智力提供了充足的证据。人类本质上是直觉机器,而我们理性(和自觉)的自我只是基于直觉的机器之上的一个模拟。这与笛卡尔的名言“我思故我在”形成鲜明的对比,意味着我们的理性思维就是把我们与其他所有生物区分开的东西。

我们因此在认知上有了偏见,要求技术和方法由逻辑机器驱动。这就是 Good Old Fashioned AI (GOFAI) 在过去几十年间失败的原因,它从一开始就试图通过逻辑范式来解决智力问题。

一个关于直觉的机器的反直觉的预想就是“逻辑思维如何从直觉机器中产生呢?”自 2012 年以来,我们已经见证了深度学习技术令以难以置信的进步。深度学习网络就是直觉机器。深度学习网络通过归纳来进行推理或者作出预测。深度学习系统已经能够执行通常保留给生物大脑的任务了。已知对于传统计算来说难以进行的任务,例如面部和语音识别,可以由这些机器以超越人类的水平执行。

然而,深度学习网络无法执行长除法等逻辑任务。人们不应该指望能够教导一个动物(比如你的宠物狗)加减,更不用说乘法。然而,人类的大脑却可以执行各类这样的逻辑问题。我们不得不问,洞穴人能做乘法吗?我们是天生就具备先进的逻辑认知能力,还是说那是我们作为先进文明的结果而学到的能力?

要实现更一般化的人工智能需要跨越的巨大鸿沟就是所谓的“语义鸿沟”。我们要如何将深度学习(低阶语义)系统与逻辑(高阶语义)系统的能力融合在一起?

人类思维能够发挥逻辑推理的伟大功绩。如果我们的思维机器都是基于直觉的,那么它是如何做到这一点的呢?我要在这里假设我们没有任何天生的逻辑装置。在我们已经存在于这个星球上的短时间内,现代智人不大可能发展出这种认知机制。因此,为了消除语义鸿沟,我们需要使用只基于直觉的机制来弥合。这意味着我们不需要将逻辑组件与直觉组件进行融合。我们所需要一切的就只是直觉组件。

因此我们需要充分的证据来证明,复杂的逻辑思想可以通过直觉机器来完成。

这才是 AlphaZero 革命性的启示。AlphaZero 是 DeepMinds Go play 程序的最新版本。我之前介绍过 AlphaGoZero 如何可以从零开始掌握围棋的玩法(不需要人类的经验)。西方人从来没有玩过围棋的游戏,根本就不理解它。所以 DeepMind 的 AlphaGoZero 成就的相关性已经被消除了。我们不明白这个成就的重要性。然而,围棋一直被认为是一个直觉游戏。所以一个基于直觉的机器掌握了这项游戏并不令人惊讶。

什么?DeepMind 的新化身(AlphaZero)却能做的就是玩国际象棋?这对很多人来说仍没有什么令人惊讶的,自 1996 年 IBM 的 DeepBlue 击败卡斯帕罗夫以来,这个游戏就被“解决”了。对于外行来说,AlphaZero 只花了几个小时就能从头开始掌握国际象棋游戏也没什么值得注意的。甚至 AlphaZero 在 100 场比赛中能够摧毁最好的国际象棋程序 Stockfish 也并不值得注意。

真正了不起的是 AlphaZero 在消解更合乎逻辑的对手方面所起的作用。为了让你理解,我会引用一些象棋社区的评价。

它接近“类型 B”,按照克劳德·香农和艾伦·图灵的梦想,用类似于人类的方法来下棋,而不是蛮横的力量。

—?Gary Kasparov。

我总是在想,如果有一个超级先进的物种降落在地球上并向我们展示他们如何下棋,那将是怎样的情况。现在我觉得我知道了。

—?Peter Heine Nielsen

它的棋路不像人类,但也不像程序。它以第三种方式,可以说是外星人的方式下棋。

?—?Demis Hassabis(DeepMind 创始人,国际象棋爱好者)

对于那些了解国际象棋的玩家来说,最好的办法就是观看 AlphaZero 和 Stockfish 的实战。你会看到的是一个基于直觉的系统如何拆解基于逻辑的对手。以下是游戏及专家评论:

AlphaZero 国际象棋的走法非常不同。为了获得优势超过对手的位置,它愿意牺牲一些棋子。它正在发挥一种国际象棋柔道,利用对手的对短期利益的热切渴望来对抗它。它将对手置于国际象棋中称为“被迫强制”的地位,无论如何走动都只会导致更糟糕的结果。

国际象棋的游戏似乎更具整体性,所有棋子都以高度协调的方式移动。AlphaGo zero 所进行的游戏最大限度地发挥了它的创造力,而它的逻辑对手无法超脱短期收益。它不仅在用一种不可想象的方式来玩国际象棋,而且这种方式将被置于令所有人惊叹的位置上。

关于 AlphaZero 的论文在最近结束的 NIPS 2017 大会上发表。那是一篇很短的论文,主体部分只有 7 页长。它提供了广泛的关于如何评估棋盘上的落子位置和决定下一步走法的有趣的细节。

和 Stockfish 每秒搜索 7 千万位置相比,AlphaZero 每秒只搜索 8 万个位置。

直觉机器使用的评估比逻辑对手少 1,000 倍。

你在这里与 AlphaZero 共同见证的是对我关于直觉机器和他们执行逻辑推理的能力的原始论证的验证。这是被链接的语义鸿沟。这是一个极其艰巨的通用人工智能的里程碑正在以创纪录的速度被超越。我想 AI 界的任何人都期望这样的进展能够迅速地实现。现在这样的事情已经发生了,人工智能的风景将被永远改变。

本文来自企鹅号 - 新浪体育媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

阿尔法狗击败人类的背后:AI的发展仍存在哪些桎梏,我们又该如何应对?

1735
来自专栏AI科技评论

学界丨OpenAI发布“宇宙”平台,用1000+训练环境赋予AI以“类人智力”

在人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候,Open AI 宣布开源了其新平台“宇宙”(Universe)。这家由伊隆·马斯克资助的非赢利性AI开源...

3827
来自专栏用户3246163的专栏

[脑书笔记]《刻意练习》(中):在工作和生活中应用刻意练习!

美国在越战初期的空战水平是击落9架敌机,要损失10架战机;但是在越战后期可以达到结果12.5架敌机,才损失1架战机。帮助美军完成这个巨大改变的就是“王牌飞行计划...

1134
来自专栏大数据文摘

【干货】搜狗公司CEO王小川:AlphaGo的幕后与思考

2109
来自专栏大数据文摘

[可视化]全球地震数据动态展现

2208
来自专栏纯洁的微笑

人工智能发展史

我一直很好奇人工智能是如何提出来的,它背后有什么样的故事,在人工智能发展的这60年的时间中,又经历了什么?为什么现在才是人工智能的爆发点,未来人工智能又将走向何...

42711
来自专栏新智元

王小川:AlphaGo的幕后与思考

导读:正如清华人一如既往的严谨、求实,“清醒而敏锐,冷静而深刻”是6月6日举行的“清华人工智能论坛”带给听众的普遍感受。张钹院士高屋建瓴,针对当下浮躁的“人工智...

3795
来自专栏大数据文摘

[译]深度学习:模仿人脑还是完善应用

2248
来自专栏大数据文摘

DOTA2获胜的AI比AlphaGo厉害?还是媒体和马斯克在联合炒作?

1433
来自专栏PPV课数据科学社区

人工智能与医学(1):基于大数据的智能医学知识学习

作者:枫叶松木木 本人年轻时爱下围棋,记得上中学、大学时常跟好朋友们手谈。后来,越来越忙了,一是没有时间了,二是手谈的朋友们也很少相聚了,就很少下围棋了。于是,...

4457

扫码关注云+社区

领取腾讯云代金券