文章/答案/技术大牛

发布

爱犯错的智能体-视觉篇（三）：看不见的萨摩耶

文章来源：企鹅号 - 中国无人驾驶赛车大奖赛

机器会犯错，其错要么是因为数据集太少，无法涵盖数据形成的样本空间；要么是由于训练太过精细，导致没办法对新来的样本或数据形成有效预计，俗称为过拟合；要么是模型本身的能力低，结果对样本的刻画能力不足；要么是硬件条件受限，无法完全相关任务。不管哪种错，总是多少能找到原因的。

而智能体尤其是人类的犯错，却有很多缺乏明晰的解释。人类会在很多方面犯错，产生错误的判断，视觉上、听觉上、距离上、认知上、情绪上，甚至人类发育的基础，基因上，都有。为什么这样一种错误频出的智能体，却能凌驾于其他生命成为地球的主宰呢？这些犯错到底有什么用呢？

CAIC大奖赛特邀嘉宾张军平教授，将会从视觉、听觉、体感、语言等角度，为我们解读智能体都“犯”过哪些错。了解这些犯错，说不定能从中找出一些有用的线索，来重新思考人工智能的发展方向。

张军平，复旦大学计算机科学技术学院，教授、博士生导师，中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。

视觉篇(三) ：看不见的萨摩耶

家附近曾经有只白色的萨摩耶，大约十二岁，挺安静温顺的，基本不怎么吠叫。听说主人身体不好，有人瘫痪在家，于是就放任其在外乱逛。

它虽然个头不小，马路什么都过的好好的。可今年某天他过人行横道的时候，一辆左转的车辆速度和它过马路的速度一致，导致它进入了驾驶员的A柱盲区。

等萨摩耶反应过来时，车已经对着它冲了过来，左前轮压了一次，左后轮又压了一次……它躺在车后，无助地颤抖着、哀嚎着。两旁的行人呆呆地看着，我也是……车主坐在车里，没开窗没下车，不知道是何反应。

过了一会，狗用力翻身站了起来，摇摇晃晃走起来了，准备回家。大家松了一口气，有人笑着说狗没事了。车主也顺便一溜烟开车跑了。

可是，狗没走到200米，便慢了下来，实在是走不动了。它的左眼珠早已被汽车压得爆了出来，满嘴的鲜血……

于是，它便安静地躺在人行道上，还像平日逛街一样，一声不吭……希望它下辈子，不要走得这么悲惨。

作为智能体，人的视觉和现在的机器视觉是有区别的。其中一个非常特别的区别是，人会根据情况或上下文有意无意地忽略眼中看到的目标。

1999年两位权威心理学专家克里斯托弗·查布里斯（Christopher F.Chabris）和丹尼尔·西蒙斯（Daniel J.Simons）曾做过一次“看不见的大猩猩”的实验。

因为这个传说中心理学史上最强大的“大猩猩实验”，两人因此荣获了2004年的“搞笑诺贝尔奖”。播放的视频中，几个人一起打篮球，要求测试者统计投进篮框的球的数量。

当视频播放完，要测试者报告进球数，基本都答对了。但问他们有没有注意到视频中有只人扮的大猩猩从视频中走过，却有不少人没能回想起来。

类似的实验，英国赫特神德大学的心理学怪才、理查德·怀德曼教授(Richard Wiseman)也做过，叫变色纸牌游戏。

两个人在摄像机前表演玩牌的魔术。表演的过程中，身上的衣服、背景、桌布都被换掉了。但由于摄像机关注焦点的变化，观测者只注意了两位“魔术师”手中扑克牌的变化，而视频中已经换掉的材料却压根就没发现。

如果让计算机或利用人工智能算法来跟踪并区分变化内容，会很快发现其中的区别。因为计算机在检测目标时，会考虑像素位置上的强度变化。

所以，当视频中出现大猩猩，或者变换桌布、背景、衣服时，都意味着视频帧与帧之间出现了大面积的像素变化。

这种变化，很容易超过图像变化程度的阈值，导致被检测和发现。值得指出的是，检测这类变化也是现在做视频摘要、视频关键内容提取的基本手段之一。

反观人类，人却容易出现忽略目标的情况。其原因在于，当人关注某个目标时，目标将成像于视网膜的焦点即中央凹区域，而目标周围的内容则分布在中央凹的周边，由视杆细胞来负责感知。而视杆细胞主要负责运动，对具体细节不敏感，

所以，大猩猩在这一前提下就被大脑视觉中枢视为没有多大意义的像素点运动，甚至被篮球的运动所掩盖。换衣服、桌布等也是类似的原因。

除此以外，也许是因为人类其实是一种能偷懒就会偷懒的智能体。如果能够在不经过缜密思维就能保证大部分判断成功的话，人类会倾向于优先采用更简易的判断，而不是进行过多的细致分析。

就像平时走路一样，我们也没有像机器人一样去区分路面的高低差异、纹理差异、光强差异，但却能非常有效和快速的形成决策。即使存在例外，那也是极个别的情况。

这种现象，在日常生活中，是比较危险的。比如交通中，在一个平时很少有人经过的十字路口，驾驶员的关注焦点将是行驶的汽车，其关注点以避让汽车为主。

在成年人经常走过的人行横道附近，则驾驶员的关注视角会以成人为主。前者的情况会导致，某天突然出现非机动车或行人时，司机会注意不到，不容易形成应急反应；后者则可能会忽略对矮小目标的关注。

能避免吗？有心理学家指出，如果关注的焦点不变，这种定式思维会一直存在，且很难避免。结果，当驾驶员发现危险来临时，已经缺乏足够的反应时间，极易形成交通事故。

那如何解决呢？最简单的办法就是不要在经常经过的这些路口形成定式思维。但凡碰到这类路线时，不妨想想，这里可能有条看不见的萨摩耶。不妨多变化下关注的视野，如转下头、变换下关注的视野，最大程度地避免这类事故的发生。

人的视觉不仅有视而不见的特点，也有弥补先天不足的能力。我们的视神经感受周围环境后，还需要将信号送到大脑。

送的方式挺聪明，大脑将输送信号的神经元像头发一样扎成一股，左边一股，右边一股，在每个眼球视网膜中央凹偏外约20度处集中起来，向大脑输送信号。于是，这个位置就没有感光细胞，形成了生理性盲点，如图1所示。

图1：人眼构造，视神经传输位置没有感光细胞

图2：生理性盲点测试图

要检测盲点的具体位置，不妨试试图2这个经典的盲点测试图。首先，捂住左眼，用右眼盯着图上的圆点，将手机逐渐拉远或拉近，会发现在某个位置时十字会消失。这个位置，对应于你的右眼盲点。

类似的，捂住右眼，用左眼盯着右边的十字形，移动手机远近，会发现圆点在某个位置消失了。它对应于左眼的盲点位置。

虽然有盲点，所幸人是双目视觉，所以两只眼睛的盲区会通过双目视觉来相互弥补。结果，日常生活中，人是感觉不到盲点的存在。

不过，如果单眼存在眼疾，如患上白内障，那盲点的影响就比较大了，毕竟有个位置的信息是缺失的，这就需要通过多调整视角来消解这个困扰。

除了盲点外，还有种情况，人也会对目标视而不见。各位不妨试着拿起一支笔，竖直放在左眼前面。一开始，你会感受到笔对视野造成的遮挡。

再将眼睛盯着远处某目标，将笔缓慢远离眼睛，你将会发现这只笔并没有对你看远处的景像形成任何障碍，笔似乎凭空消失了。

显然，这并非是生理性盲点造成的。它和人的视网膜结构有关。换句话说，它可以从单眼与复眼的关系来解释。

众所周知，人有两只眼睛，而昆虫则是由非常多的小眼睛组成的，俗称复眼，如蜻蜓、苍蝇都有复眼。如果是昆虫的复眼，那么笔是不会对想观测的目标形成遮挡的。

因为昆虫的整体视觉是可以通过小眼睛的视角拼接而成，少数几只眼睛的被遮挡不影响全局。可是人是双目视觉，为什么也会有类似的情况呢？

实际上，人的视网膜上的感光细胞数量众多，每个细胞都分担了一部分的视觉检测。在处理笔遮挡的任务时，也会通过感光细胞间的相互填充，实现类似复眼的功能。

但要注意的是，人是不可能像昆虫那样演化出复眼的。因为复眼上的每只眼睛，管的视角和频率都很窄。

如果要在人的头部形成如同昆虫一样具有全角度检测能力的复眼，著名物理学家费恩曼曾经做过初略的计算，他的结论是复眼的大小可能会超过现在人类头部的尺寸，结果头很可能承受不了眼睛的重量。

当然，除了这些情况看不见外，人过于关注某些人或事情时会对周围情形视而不见，人不关注某些人或事情时也会视而不见，或熟视无睹。

这些依赖于情感和心灵的视而不见和熟视无睹，比起单从视觉上发生的，就要复杂多了，也是人工智能目前还完全找不到北的问题之一。

该栏目由系列文章组成，将长期连载，敬请期待。

文章来源：

张军平—CAA混合智能专委会

参考文献：

1、克里斯托弗 · 查布利斯/丹尼尔 · 西蒙斯[著]，段然[译]. 看不见的大猩猩. 北京大学出版社，2011年

2、费恩曼, 莱顿, 桑兹著. 郑永令, 华宏鸣, 吴子仪等译. 费恩曼物理学讲义(第1卷). 上海科学技术出版社, 2013年

注：所有用图均来自网络

发表于: 2018-11-142018-11-14 20:39:39
原文链接：https://kuaibao.qq.com/s/20181114A1TN4L00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

爱犯错的智能体-视觉篇（三）：看不见的萨摩耶

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐