“忒修斯Theusus”早期机器学习演示——克劳德·香农1950年的模仿游戏(6k字)

秦陇纪

发布于 2019-09-27 11:21:04

2.1K0

发布于 2019-09-27 11:21:04

文章被收录于专栏：科学Sciences

科学史上，克劳德·香侬是足以和牛顿、莱布尼茨、爱因斯坦、图灵、冯诺依曼等相提并论的天才人物，是推动人类文明的前行者。从古代鲁尔机器之梦，到图灵提出模仿游戏，人类追寻智能本质已好几百年。在图灵测试主张模仿智能的功能表现后，香侬制作出了演示机器鼠学习走迷宫的模仿游戏，并于1952年在贝尔实验室录像，本文回顾这段用机器模仿智能的历史。

一、图灵的机器能思考吗

1950年，图灵发表里程碑论文《计算机器与智能》(又名《机器能思考吗?》)，第一次提出“机器思维”和“图灵测试”(TurningTest)的概念。图灵在《计算机器与智能》开篇就写到要研究“机器能思考吗”这一问题，这样描述他的设想：“人的大脑好似一台巨型的电子计算机，初生婴儿的大脑皮层像‘尚未组织好的’机器，可以经过训练，使之成为‘组织好了的’类似于万能机(即万能图灵机)式的机器。”针对这一设想，他提出了“图灵测试”的概念。图灵测试是一个人机测试，计算机和人类分别回答问题，如果提问者分辨不清哪个是真人，那么则认为该计算机具有智能。这就是人工智能的最初设想。他认为：假如通过电传终端与另一边进行对话，人们无法区分那边是机器还是人类?那么就该承认这机器具有智能。

“图灵测试”主张在认知科学上称为功能主义，也就是说在功能表现上模仿出人类智能，而不管是不是真正的智能，这是一种模仿。这种“模仿游戏”在1950年代，成为人工智能的主流研究范式，影响众多科学家做出具体的探索。香侬的“忒修斯Theusus”早期机器学习演示，就是在功能表现上模仿学习过程。考虑到观察、测量的结果是等效的，对智能进行模仿的方法，也是科学方法。

二、香侬的人工智能提案

1955年8月31日，贝尔电话实验室的克劳德·艾尔伍德·香农(Claude Elwood Shanon)和达特茅斯学院的J.麦卡锡(J. McCarthy)，哈佛大学的M.L.明斯基(M. L. Minsky)，I.B.M公司的N.罗切斯特(N. Rochester)四人一起，起草了《人工智能达特茅斯夏季研究项目提案》，并于1956年在达特茅斯如期召开了该研究会。这项工作的一些成果包含在即将出版的香农(Shannon)和麦卡锡(McCarthy)编辑的“年鉴研究(Annals Study)”中。其中提案创始人香侬被写在了第一位，如下。

该提案的创始人是：

1. C.E.香农(C.E.Shannon)，数学家，贝尔电话实验室。香农(Shannon)开发了信息统计理论，命题演算在开关电路中的应用，并且有关于开关电路的有效合成，学习机器的设计，密码学和图灵机理论的结果。他和J.麦卡锡(J. McCarthy)共同编辑了“自动机理论”的数学年鉴研究。[1]

在这份《人工智能达特茅斯夏季研究项目提案》中，香侬的提案如下。

C.E.香农(C.E. Shannon)的研究提案

我想将我的研究投入到下面列出的一个或两个主题中。虽然我希望这样做，但出于个人考虑，我可能无法参加完整的两个月。尽管如此，我打算在任何时间都在那里。

1.将信息论概念应用于计算机器和脑模型。信息理论中的基本问题是在嘈杂的信道上可靠地传输信息。计算机器中的类似问题是使用不可靠元件的可靠计算。这个问题已经由冯诺依曼研究的谢弗行程元件(Sheffer stroke elements)，香农(Shannon)和摩尔(Moore)研究了继电器(relays)；但仍有许多悬而未决的问题。几个要素的问题，类似于信道容量的概念的发展，对所需冗余的上限和下限的更尖锐的分析等都是重要的问题。另一个问题涉及信息网络理论，其中信息在许多闭环中流动(与通信理论中通常考虑的简单单向信道形成对比)。延迟问题在闭环情况下变得非常重要，似乎有必要采用一种全新的方法。当已知消息集合的过去历史的一部分时，这可能涉及诸如部分熵(partial entropies)之类的概念。

2.匹配环境——自动机的大脑模型方法。通常，机器或动物只能适用于在有限的一类环境中操作。即使是复杂的人类大脑也首先适应其环境的简单方面，并逐渐建立起更复杂的特征。我建议通过一系列匹配(理论上)环境的并行开发来研究脑模型的合成。这里的重点是澄清环境模型并将其表示为数学结构。探索定理、写音乐或下棋。我在这里建议从简单开始，当环境不是敌对(只是漠不关心)或复杂时，并通过一系列简单阶段向这些高级活动方向努力。[2]

三、香侬的机器学习演示

香侬的“忒修斯Theusus”早期机器学习演示，可以看1950年AT&T贝尔实验室档案和历史中心7分23秒的视频《“忒修斯Theusus”早期机器学习演示》，See 18 mins 51 secs in for 27seconds.暨Demonstration of EarlyMachine Learning with “Theseus” By: Claude Shanon “Father of Information Theory”AT&T Bell Labs. Shannon built his maze-solving mouse, Theseus, in 1950.，作者：克劳德·香农，AT＆T贝尔实验室“信息论之父”。(http://cyberneticzoo.com/mazesolvers/1952-%E2%80%93-theseus-maze-solving-mouse-%E2%80%93-claude-shannon-american/)[4]视频用户上传2016年04月30日发布《克劳德·香农与早期机器学习》(https://v.qq.com/x/page/h0197a4p3s9.html)[5]

香农(Shannon)在1950年制造了他的迷宫鼠标Theusus。

1952 – “Theseus” Maze-Solving Mouse– Claude Shannon (American)

内部零件显示：N-S, E-W滑架，继电器，Uni-selector，电动机以及其他电气组件。Internals showing N-S, E-Wcarriage, Relays, Uni-selector, motors, amongst other electrical components.

1952年，克劳德·香农在一次会议上展示了他制造的一只老鼠，不是鼠标，而是一只可以走迷宫的机械鼠。

这只老鼠有三个轮子，一根磁铁，以及铜线做成的胡须。通过胡须，老鼠可以感知是不是碰到了走不通的迷宫墙。迷宫地板背面有一个机械手臂，上面也有一个电磁铁，这样就可以移动机械手臂，带动机械鼠在迷宫里走动。

如果老鼠发现正对的墙走不通，就会退回格子中间，旋转90度，去尝试下一个方向，然后继续行走。直到走到终点，由一枚金属币标识，老鼠停止。

这是老鼠走过的一条痕迹，记录了老鼠的探索过程。

神奇的是如果把老鼠重新放回到起点，它会直接沿着正确的路走到终点。如果我们调整了中间的线路隔板情况，老鼠还是重新探索路线，正确走到终点。

这只智能的老鼠是怎么实现的呢？原来，老鼠的脑子不是长在身上，而是长在迷宫板子的下面。香农在演示时掀开了迷宫的底板，展示了机械手臂，还有电路设计。

在整个电路中，香农用50个继电器控制机械手臂的移动，又用75个继电器来记录老鼠探索的每面墙是否能走通。继电器是个什么东西？现在的计算机早就不用这种零件了，而是采用晶体管，或者说由晶体管组成的集成电路，如内存条、CPU 等。继电器的原理是这样的，通过一个线圈接通与否实现一个电磁铁，通过电磁铁来吸引一块铁片，来控制一个线路的开关。如图所示，通过橙色的电磁铁，就能控制灯泡的线路是否接通了。

通过一个继电器，我们就可以控制电路的开关，而电路的开关，就可以表示0和1两个状态。我去年在看《硅谷百年史》时，曾经好奇谁将开关电路和二进制等价起来的。结果发现香农在1938年写的硕士论文，就是讲继电器开关电路和布尔代数的等价关系，布尔代数即与或非，又是和二进制可以等价的。所以他在迷宫老鼠中用继电器作为状态记录，也就毫不奇怪了。

香农给老鼠起名叫“忒休斯”。希腊神话中，忒休斯破解了迷宫，杀死了怪兽。我们思考一个问题，这只老鼠有智能吗？这要看你对智能怎么定义了。香侬这个实验中理解的智能，就是具有学习能力。这只老鼠显然是学习了迷宫路径，能够重复正确的路径。那它的智能是怎么来的呢？靠的是通过继电器记录了路径状态，也就是说，老鼠通过掌握了更多的数据，从而实现了这种智能。这里甚至没有牵涉对数据的处理，仅仅是记忆这些数据，就可以拥有智能了。

四、机器学习演示的智能

香农1948年关于信息的观点，即信息是一种消除随机不确定性的东西。香侬的信息论阐释出了通信过程中信息的测量，是通过熵的确定性——概率越大则能传播的信息就越少。Reprinted with corrections from TheBell System Technical Journal, Vol. 27, pp. 379–423, 623–656, July, October,1948. A Mathematical Theory of CommunicationBy C. E. SHANNON

“忒修斯Theusus”早期机器学习演示(视频)中的智能，靠的是通过继电器记录了路径状态。假手“Theseus” Maze-SolvingMouse老鼠走过的一条痕迹，记录了老鼠的探索过程。记忆这些状态数据，从外部功能上表现出智能，这也是对智能的模仿。同时，这些状态数据消除了道路的不确定性。

数据不是因果关系，而是相关关系。数据可以消除不确定性，这是香侬机器学习的本质。现在所谓的人工智能，并不是真正的智能，只是在海量数据中做减法。这样的智能，还远远称不上智能。人的智能其实是一样的。人做判断的时候，靠经验和知识从所以可能的选择里面筛选一个。经验越丰富，知识越扎实，判断就越准确。原我们的科研人员，能够踏实起来，模仿也好，实现也罢，要做非常具体的实验，而不是到处宣讲自己空想的语文描述。

推进人类文明发展的引擎

《信息简史》詹姆斯•格雷克著；高博译

在《信息简史》里读信息本质的回归史，重新认识你所在的行业(http://www.ituring.com.cn/article/110865#)百万级销量科普畅销书作家詹姆斯•格雷克七年磨一剑，带来一段人类与信息遭遇的波澜壮阔的历史，告诉我们如何在信息时代的信息爆炸中生存。格雷克不仅在书中细致还原了历史细节，通俗解释了各种理论，还生动刻画了几位不为大众所知的人物：可编程计算机先驱、超越时代的查尔斯•巴贝奇，第一位程序员、诗人拜伦之女爱达•拜伦，计算机科学之父、天妒英才的阿兰•图灵，以及全书的主人公、信息论之父克劳德•香农。

推进人类文明发展的引擎在哪里(666字)

最简单的教育是把知识、技能、思想等一切人事物，变成文字来教学和考核；最舍本逐末的教育莫过于深陷媒介形式，只为文化知识。世界是复杂的，语言文字并非现实世界，只能传递信息。语文思维教育过来的学生，只会识字读书背答案、只会语言文字思考表达。看惯了科学和技术提法的很多领导、伪专家、不懂科研的门外汉，提出要发展基础科学，基础科学和应用科学都要有一定占比，把科学和技术割裂起来理解并执行，就是因为他们不懂科学。

科学传入我国一百多年，没有被国人普遍接受和普及。科学目标是找到自然社会规律，科学方法是测量和实验，科学精神是质疑和假设，科学理论的本质是科学家用数学工具对自然社会做从出定性定量解释。科学知识有别于文化知识。科学研究必须做实验测量，离不开各种技术手段；形成科学规律，必须用严格的数学形式化方法做表达。科学的内涵是实验证明，某条规律可以被人类观察到并能测量，其实验方法(包括理论验证方法)是可以被证明为真实或虚伪的。这个过程中，阐释方法的科学性和实验证明的技术性是统一的。如果教材、学校、教育者始终是语文化教学、运作，那师生永远只能采用语言文字书面表达方式把一切自然社会弄成纸面文字。数学和技术，一个是思维上的高级工具，一个是动手能力现实中物理世界的高级工具。止步于语言文字，则永远二流。

再过百年推进人类文明的引擎自哪里？！秦陇纪希望有多极引擎共同驱动，中国、美国、欧洲必定是多级引擎之一。生存和发展并非先后确定，而是相辅相成。希望生存档次的事务和问题，吃住行教医等涉及人生生老病死的环节，远远少于发展事务，留出更多时间和空间用来发展。

科学是璀璨的人类文明之一，但有其范围并非万能。科学Sciences公号不持有任何倾向性，只提供大家的学术观点。《科学Sciences》倡导"理性之思想，自主之精神"，专注于学者、学界、学术的发展进步，不定期向您推荐人类优秀学者及其文章。欢迎科学、工程、技术、教育、传媒等业界专家投稿、分享、赞赏、支持科普、加入数据简化社区！~~

-----------------------------

社区：“数据简化DataSimp、科学Sciences、知识简化”新媒体聚集专业领域一线研究员；研究技术时也传播知识、专业视角解释和普及科学现象和原理，展现自然社会生活之科学面。PhDS01秦陇纪发起，期待您参与各领域；科学技术论文投稿邮箱DataSimp@126.com。只会敲门呐喊，不能推动领域；只有空想设计，无法实现生产，就虚度一生。工程技术能力至关重要，秦陇纪与君共勉之。欢迎科学、工程、技术、教育、传媒等业界专家投稿、加入数据简化社区！欢迎大家分享、赞赏、支持科普~~

-----------------------------

(注：有关素材[1-x]图文版权归原作者所有。)

素材(1.5k字)

1. J.McCarthy, Dartmouth College; M. L. Minsky, Harvard University; N. Rochester,I.B.M. Corporation; C.E. Shannon, Bell Telephone Laboratories. A PROPOSAL FORTHE DARTMOUTH SUMMER RESEARCH PROJECT ON ARTIFICIAL INTELLIGENCE. [EB/OL],stanford, http://jmc.stanford.edu/articles/dartmouth.html l, August 31, 1955, visit date: 2019-06-07

2. J.McCarthy, Dartmouth College; M. L. Minsky, Harvard University; N. Rochester,I.B.M. Corporation; C.E. Shannon, Bell Telephone Laboratories. A PROPOSAL FORTHE DARTMOUTH SUMMER RESEARCH PROJECT ON ARTIFICIAL INTELLIGENCE. [EB/OL], stanford,http://www-formal.stanford.edu/jmc/history/dartmouth/dartmouth.html, August 31,1955, visit date: 2019-06-07

3. 秦陇纪. 人工智能起源与发展正史. [EB/OL], 科学Sciences. http://weixin.qq.com/, 2019-06-06, visit date: 2019-06-07

4. 2010年AT&T贝尔实验室档案和历史中心, 1952 – “Theseus” Maze-Solving Mouse – Claude Shannon(American) --- Demonstration of Early Machine Learning with “Theseus” By:Claude Shanon “Father of Information Theory” AT&T Bell Labs. (7’23’’) http://cyberneticzoo.com/mazesolvers/1952-%E2%80%93-theseus-maze-solving-mouse-%E2%80%93-claude-shannon-american/,Shannon built his maze-solving mouse, Theseus, in 1950, visit date: 2019-0925Wed

5. 视频用户上传. 《克劳德·香农与早期机器学习》. [EB/OL],腾讯视频, https://v.qq.com/x/page/h0197a4p3s9.html,转载于2016年04月30日发布, visit date: 2019-0925Wed

6. 首发于瓦利哥的机器岁月. 桑文锋(SensorsData.cn神策数据创始人&CEO).从香农的老鼠到大数据. [EB/OL], zhihu, https://zhuanlan.zhihu.com/p/26784043,visit date: 2019-09-25Wed

x. 秦陇纪. 人工智能起源与发展正史; 西方哲学与人工智能、计算机; 数据科学与大数据技术专业概论; 人工智能研究现状及教育应用; 数据资源概论; 文本数据溯源与简化; 大数据简化技术体系; 数据简化社区概述. [EB/OL], 数据简化DataSimp(微信公众号),https://dsc.datasimp.org/, http://www.datasimp.org, 2017-06-06, visit date:2019-06-25Wed

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2019-09-26，如有侵权请联系 cloudcommunity@tencent.com 删除

http