复旦教授徐英瑾:人工智能研究为何需要哲学参与? (下)

《复旦教授徐英瑾:人工智能研究为何需要哲学参与? (上)》

三、从哲学的角度反思现在 自然语言处理与机器翻译

我们再看比较新的话题,从哲学的角度反思现在的自然语言处理与机器翻译,严格的说,自然语言处理是大概念,机器翻译是一个小概念。机器翻译是属于自然语言处理的,但有时候会把它分开来说。

现在机器翻译历史上有不同的路数,有基于神经元网络,基于统计的,基于符号的,基于中间语的,还有很多、很多路数。但是深度学习牛掰起来以后,大家都用深度学习来做,很大程度上,深度学习做机器翻译也将流行,也结合了一些大数据的方法。

“深度学习”技术,主要是作为一种“工程学技巧”进入我们的视野的。实际上,我们目前尚无法在科学层面上清楚地说明:“深度学习”技术为何能够提高相关程序之应用表现——遑论在哲学层面上为这种“进步”的“可持续性”提供辩护。

传统的神经元网络和深度学习相比,它的特点是中间处理层层数比较少,而现在的深度学习靠硬件的进步,可以把中间的处理层做成几十层上百层,这是以前不可想象的。做多以后,在很大程度上分析问题的层次感就多了,因为它层数越多就可以用不同的角度和层数分析问题,因此,很大程度上处理问题的手段就更加细腻了。的确体现出一种明显的工程学的进步。

很大的问题是,这种进步是否可持续?我自己站在哲学领域是持保留意见,我认为可以搞搞,但是认为这件事最后能做成像霍金所说的毁灭人类的超级人工智能是胡扯。我们可以借一些例子来讨论、讨论。

传统的人工神经元网络有输入层、中间层和输出层,通过数据的处理得到一个输出,通过反馈算法等等东西来弄,它的最重要的是要调整计算单元之间的权重,通过这种权重的调整,慢慢的让它的适应一类任务。传统的神经元网络最大的特点是,它能够执行的任务是比较单一的,也就是说它完成一个任务以后做了什么,就永远的恒定在这个表现的水准上做这个事。

如果你让他在大量帧数的画面里,在所有有刘德华的脸出现的图片里面做标记,他开始标记的水平比较差,但是他标记的至少比另外一台机器好,另外一台机器把关之琳的脸也标成刘德华,你的机器至少在正确的道路上,随着时间推移,通过训练慢慢能做了。然后刘德华演一部新电影,这电影刚刚上映,显然不是在训练样本里面,让他辨认里面是谁,分得很清楚,刘德华、吴彦祖、关之琳,分得很清楚,训练成功。

现在给它一个新任务,现在不是认人脸,是认一个完全不同的东西,练什么东西呢?假设是一部武打电影,里面也有刘德华参与,但是不要认刘德华,把所有打螳螂拳或者咏春拳的画面选出来,我没学过,如果你要做这件事,这个机器要重新来进行调整。

但是人类可以做一个推理,比如人类如果已经知道了甄子丹经常演叶问,而叶问是打咏春拳的,而人类已经学会了识别甄子丹,如果一部电影我给你一个任务,到底哪些画面是在打咏春拳?你不用看什么拳,你盯着叶师傅,盯着甄子丹就可以。

这里面有三段论推理,非常方便的从一个知识领域到另外一个知识领域。怎么识别甄子丹是一个领域,谁在打拳、谁在打叶问的咏春拳,这是另外一个知识领域。当中有一个桥,就是叶问老师是由甄子丹扮演的,而甄子丹扮演的叶问老师是打这个拳的,你有这个桥,两个知识就可以合二为一。

现在的问题也就是说,这对于符号AI来说很容易的事,对神经元网络是很难的。现在很多人说要把符号AI和神经元网络结合在一起,但是这个结合点怎么找?实际上困难很大。深度学习只是它的的升级版,它是非常高级的升级版。大家觉得AlphaGo打败李世石是非常了不起的事,实际上这是迟早发生的事,因为它只能局限在围棋这一个网络。同样一个深度学习系统同时做两件事,才算牛掰。

美国的生物统计学家Jeff Leek最近撰文指出,除非你具有海量的训练用数据,否则深度学习技术就会成为“屠龙之术”。有些人认为他的观点是不对的,但是我还是倾向于认为深度学习和神经元网络需要大量的训练样本,把某种模式重复性的呈现出来,让他抓到规律,整台系统才能慢慢调到很好的水平。请问前面的数据是不是在任何一种场合都能够获得呢?这显然不是那么容易的。

哲学家柏拉图会怎么评价目下的机器翻译?

伯拉图有一个东西叫《美诺篇》,主要是以对话形式来写他的哲学著作。《美诺篇》里面有一个重要的桥段,一个从未学过几何学的小奴隶在哲学家苏格拉底的指导下学会了几何证明。旁边的人反复问,你真的没有学过几何学吗?怎么证明那么好?小奴隶说,真没学过。旁边人证明,这小子字都不识,希腊文字母表都背不下来。

由此引发的问题是:小奴隶的“心智机器”,究竟是如何可能在“学习样本缺乏”的情况下获取有关于几何学证明的技能的呢?而后世的语言学家乔姆斯基则沿着柏拉图的思路,问出了一个类似的问题:0-3岁的婴幼儿是如何在语料刺激相对贫乏的情况下,学会复杂的人类语法的?——换言之,按照柏拉图—乔姆斯基的看法,任何一种对于人类语言能力的建模方案,如果无法具备对于“刺激的贫乏性”(the poverty of stimuli)的容忍性的话,那么相关的建模成果就不能被说成是具备对于人类语言的理解能力的。

乔姆斯基的解释是人有先天语法结构的能力。人家问乔姆斯基,这个东西怎么来的?他说,这是进化当中的基因突变导致的。我最近美国开议事大会,碰到乔姆斯基,他一方面承认这肯定是进化基因突变的,但是另一方面又否认我们可能用经验手段去严格的研究语言进化的某个历史瞬间到底发生了什么,因为他认为我们缺乏追溯几十万年的语言基因突变的经验能力。

我并不完全赞成他的观点,但是有一点我赞成他,他正确的提出一个问题,这个问题就是机器学习主流没有办法解决的问题。小朋友是怎么做到这么小就可以掌握语法?

若按照按照乔姆斯基的标准或者伯拉图、苏格拉底的标准,,我们是否可以认为目前基于深度学习的机器翻译技术是能够理解人类语言的呢?答案是否定的。

实际上,已经有专家指出,目前的深度学习机制所需要的训练样本的数量应当是“谷歌级别”的——换言之,小样本的输入往往会导致参数复杂的系统产生“过度拟合”(overfitting)的问题。也就是说,系统一旦适应了初始的小规模训练样本中的某些特设性特征,就无法灵活地处理与训练数据不同的新数据。

一句话,凑数凑得太假了,以至于难以应对世界的真正的复杂性!

举个例子,一个人说她自己很适合谈恋爱,很适合和异性交往。她谈第一次恋爱,两个人如胶似漆,而且她的恋爱对象是非常奇葩的男人,非常宅,邋遢,很奇怪,别的男人对他也有意见,但是这个女人和他一拍即合。这就是过拟合。

你作为她的闺秘会担心一件事,她和这个男人分手以后,能不能适应正常的男人?按照统计学来看,第一次恋爱成功的概率是很低,如果你第一次就过拟合了,你以后怎么玩这个游戏?这很麻烦,这是恋爱中过拟合的问题,和谁都特别熟,黏住谁就是谁,分不开,他什么毛病也传给你,以至于你不能和第二个人谈恋爱。

另外一种是不拟合,就是和谁都不来电。按照机器训练来说就是怎么训练都训练不出来。一种太容易训练出来,太容易训练出来的问题是我现在用这组数据很容易把你训练出来,以后真实世界中真实数据和实验室不一样,你能不能应付?

就语言论语言,新数据与训练数据不同恐怕会是某种常态,因为能够根据既有的语法构造出无穷多的新表达式,本就是一切自然语言习得者所都具备的潜能。如果我愿意,我可以用大家听得懂的汉语跟大家描述各种各样的奇葩状态。这是语言的特点。也就是说既有的语法允许我们构造出无穷多的新表达式。

能够用既有的语法构造更多的新表达式,是任何一个语言习得者的能力,能够听懂别人用你的母语所表达的任何一种奇葩的表达式,也是一个合格语言习得者的能力,这个能力是何等的平常,但是对于机器来说是多么的稀奇。

换言之,无论基于深度学习技术的机器翻译系统已经通过多大的训练量完成了与既有数据的“拟合”,只要新输入的数据与旧数据之间的表面差距足够大,“过度拟合”的幽灵就都一直会在附近徘徊。

所以从过去当中永远没有办法必然的推出关于未来的知识或者关于未来我们不能有真正的知识,这是休谟哲学的相论点,他没有用什么拟合、不拟合的数据,因为他当时不知道深度学习。但是你会发现,过很多年,休谟的哲学问题没有解决。

从本人的哲学立场来看,未来人工智能需要做的事情:

1. 首先要在大的目标上指出通用人工智能是一个大的目的。

很多人给我说通用人工智能做不出来,我的书指出了,所有指出通用人工智能做不出来的论证是不成立的。第二个如果你相信某些人所说的,人工智能将对人类生产生活产生颠覆性的影响,而不是过去的自动化的零敲碎打的影响,只有通用人工智能才能对未来的生活进行颠覆性的影响。因为专用人工智能不可能真正取代人的工作,只有通用人工智能能做到。

比如家政服务员,让机器人做,你知道家务有多麻烦吗,家务有多难做吗?我始终觉得做家务比做哲学烧脑,我一直觉得做家务合格的机器人比做哲学还是要更慢一点,你十个人都喊着文本都是一个文本,十个人不同家庭的打扫情况就是不同。

这个人家里书很多,但他不希望你理得很整齐,另外一个人家里有很多书,但是希望你理得很整齐。这个小朋友3岁,喜欢书。这个地方有小朋友13岁,很不喜欢看书。这些问题都复杂,人都要被他弄崩溃,机器怎么搞得清楚?

2. 认知语言学的算法化。

3. 基于意义的普遍推理引擎,而不能把推理看成形式、逻辑的事情,而要认为这和意义有关。

4. 节俭性算法与该推理引擎的结合,我们的计算要从小数据出发,要体现节俭性,不能依赖大数据。

5. 结合认知心理学研究加入人工情绪等新要素。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT派

在人工智能的浪尖上,如何抉择?

知友:李麟 人工智能可以说是一门高尖端学科,属于社会科学和自然科学的交叉,涉及了数学、心理学、神经生理学、信息论、计算机科学、哲学和认知科学、不定性论以及控制论...

4098
来自专栏企鹅号快讯

德州扑克被AI攻破?刚进行到围棋九路盘而已

德州扑克被AI攻克?才刚开始 作者:余小鲁 作者系理论物理博士,人工智能专家。新浪扑克学院特邀讲师 Sunday, 31 December 2017 余小鲁博士...

1979
来自专栏大数据文摘

AI大事件 | Uber展示无人驾驶可视化工具,AI初创公司Appier获得3300万美元C轮融资

1853
来自专栏机器之心

前沿 | 详解Microns项目:通过大脑逆向工程来创造通用人工智能

选自IEEE Spectrum 机器之心编译 参与:黄小天、晏奇、李亚洲 去年,美国高级情报研究计划署(Intelligence Advanced Resea...

3365
来自专栏机器之心

更偏好白人男性?Science新研究证明人工智能也能学会偏见

选自Science 机器之心编译 参与:吴攀、晏奇 至少从口号上来说,我们一直在追求「人人平等」,但我们也都清楚我们离这一目标还相去甚远,部分原因是因为世界并不...

3478
来自专栏大数据文摘

视觉研究的前世今生(下)

2054
来自专栏大数据挖掘DT机器学习

如何通过自学,成为数据挖掘“高手”?

问题: 求教各位对数据挖掘有一定了解的达人,如何从“零”开始学习数据挖掘?需要掌握哪些基本的技能?(比如是不是一定要会用R进行简单编程、掌握哪些基本的数学知识...

3285
来自专栏吉浦迅科技

(图解)人工智能的黄金年代:机器学习

Lady我在整理一些关于Deep learning方面的学习资料,看到好文章总是忍不住想跟各位分享。这次将系统地介绍深度学习的前世今生,文章很有趣,但也很长,将...

37715
来自专栏人工智能快报

NSF投资1700万美元开展神经和认知系统基础研究

美国国家科学基金会(NSF)宣布投资1700万美元开展18项神经与认知系统前沿研究项目,如表1所示。这些项目来自于NSF的“面向理解神经和认知系统的综合战略”项...

2698
来自专栏腾讯高校合作

【犀牛鸟学问】发现数据之美

1252

扫码关注云+社区