专栏首页数据魔术师人工智能|爱犯错的智能体--视觉篇(一):视觉倒像

人工智能|爱犯错的智能体--视觉篇(一):视觉倒像

机器会犯错,其错要么是因为数据集太少,无法涵盖数据形成的样本空间;要么是由于训练太过精细,导致没办法对新来的样本或数据形成有效预计,俗称为过拟合;要么是模型本身的能力低,结果对样本的刻画能力不足;要么是硬件条件受限,无法完全相关任务。不管哪种错,总是多少能找到原因的。

而智能体尤其是人类的犯错,却有很多缺乏明晰的解释。人类会在很多方面犯错,产生错误的判断,视觉上、听觉上、距离上、认知上、情绪上,甚至人类发育的基础,基因上,都有。为什么这样一种错误频出的智能体,却能凌驾于其他生命成为地球的主宰呢?这些犯错到底有什么用呢?了解这些犯错,说不定能从中找出一些有用的线索,来重新思考人工智能的发展方向。

今天聊聊人类在视觉上的犯错表现。这种犯错常被称为光学错觉,英文叫Optical illusion。

先从光学成像说起吧,第一个还没得到完全认识、但却又是最基本的,是视觉倒像问题。小孔成像原理告诉我们,要观测的目标通过瞳孔的凸透镜原理映射至视网膜上,是一个标准的倒像。如果是机器,则可以通过光学变换还原成正常的影像。而智能体似乎并没有光学变换的能力,从视网膜往后联就是视神经元了。人类的视网膜上位于中间位置(俗称中央凹,fovea)的视锥神经和周边的视杆神经主要承担感受光强、颜色和运动状态的功能,似乎没有自动翻转的能力。

图1:眼睛的小孔成像原理

假如没有自动翻转成正常或倒着看世界会如何呢?金庸的书籍《射雕英雄传》谈到过。西毒欧阳锋为了学习从黄蓉那弄来的、假的《九阴真经》,将全身经脉逆转,结果走火入魔,变成手当足、脚当手来倒立走路。经过一段时间后,他似乎已经习惯这种颠倒的世界。

当然,这是小说中的虚构。但从历史来看,还真有科学家做过这样的尝试。1897年,美国心理学家George Stratton发表了“视网膜没有逆转视觉”的论文。在论文中,他详细介绍了关于视网膜倒像的实验。他给自己戴了一幅凸透镜,并把其中一只眼完全遮住。在前四天,本已被凸透镜纠正过来的正像,他看到的却始终是倒的。结果,以平时经验去拿东西都很失败和别扭。因为影像是倒过来的,而手势什么却还是按正常的方向去行动,想拿地上的物品手会往上伸,想拿架子上的手却往下放。不过到第五天后,他的视觉奇怪地、自发地变成正像了,好象视觉神经已经适应了,他肢体的动作也与再次世界协调了。但再取掉凸透镜后,他发现世界竟然都是巅倒的,之前的正像要再过一段时间才能恢复。换一只眼执行此实验,情况依旧。因此,他断定人的视网膜并没有把倒像颠倒过来,其功能是在视觉神经的后端实现的。即,视网膜感受的颠倒信号,是在通过视神经传导到大脑皮层的视觉中枢后,在视觉中枢实现自动翻转的。这也是目前学术界的共识。

图2 视觉倒像实验[Wiki]

其实还有个简单的办法可以检验视觉在视网膜位置是倒像的。你读到这里的时候,不妨把手放到下眼皮底下,用手把下眼皮慢慢往上推。你应该能看到一整块模糊掉的字和图往下走,而不是往上。视觉能力强的,说不定在下眼皮遮挡眼睛的过程中,看到上方会出现一块黑斑。这些恰恰就是因为光学视觉倒像造成的。

后期有很多科学家想重复他的实验,不过比较遗憾地是,没有人观察到过倒像还能适应后翻转的现象,更多地是表示能够适应巅倒过来的世界。

不过也有科学家在尝试中发现,如果戴那种会导致变形的眼镜时,类似哈哈镜那种,有些人的视觉会自动将一些没注意到的变形的位置纠正。而取下眼镜后,看到的世界反而变得扭曲了。这似乎表明大脑确实能自适应地纠正一些扭曲。

现实生活中,也有一些人会故意去阅读一些倒过来的书本,他们将其视为提高阅读速度和能力的一种秘技。还有科学家说,通过这种方式,可以刺激大脑形成新细胞,防止衰老。其实大家稍微练练,也不难做到。所以,以后看到倒着看报纸、读书的人或新闻照片时,不要马上就嘲笑喔,说不定他们真的能这样读的,哈哈。

图3 大师辜鸿铭”把报纸倒过来读”的轶事【摘自2018年1月《博爱》】

另外,作为感官元件,眼睛和其它感觉器官还有点不一样。它是在大脑发育过程中,从大脑细胞中分裂出来的。如果把从眼球到视觉中枢的连接看成是一个深度学习模型,也许可以将这种视频倒像的纠正,理解为大脑处理的端到端表现。

但倒像纠正具体是何时发生的,George Stratton没有给出研究结论。现有的文献也是说法不一。有说初生儿开始感知的世界是颠倒的,随着大脑发育的逐步完善而慢慢实现的。因为有报道说,有些两三岁的小孩可能喜欢会倒拿玩具,倒读连环画的,并猜测这可能和正视发育未完全有关。还有些人,据说天生就有空间定向现象(spatialorientation phenomenon),看的世界都是颠倒的。也有说倒视能力是与生俱来的,毕竟前者的例子还是很鲜见。

图4 患有“空间定向障碍”的塞尔维亚女子,眼中世界完全颠倒

不管怎么说,这个看似极其简单的问题,仍然没有找到统一圆满的答案,不论是它的成因还是发生时间上。

文章来源:张军平

参考文献:https://en.wikipedia.org/wiki/George_M._Stratton

注:所有用图均来自网络

本文分享自微信公众号 - 数据魔术师(data-magician)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 基于MPI的并行遗传算法

    在上一篇文章中我们大致了解到了MPI的基本概念以及其运行原理,并且学习了一些简单的MPI通信函数以及例子。在本篇中我们将会以实现遗传算法为例子,讲解一些...

    用户1621951
  • Python人工智能在贪吃蛇游戏中的运用与探索(中)

    上篇我们说到用「DQN」来实现贪吃蛇训练,也就是用**Q(s,a)**和搭建神经网络来实现。那么我们如何合理的处理数据?

    用户1621951
  • 区块链热潮席卷A股 而你还不知道它是啥?

    区块链概念行情火爆,概念股频掀涨停潮,这一场“新年狂欢”背后,究竟是机遇还是炒作?我们还无法得知,不妨先来了解这个神秘的区块链到底是什么。 ? ? 注:本内容来...

    用户1621951
  • 计算机和人类“看”法不同,但这重要么?

    当工程师第一次“教”计算机“看”这个动作时,他们理所当然地认为计算机可以像人类眼睛一样进行观看。

    大数据文摘
  • 资源|计算机视觉方法概述

    今天给大家推荐一份最新的计算机视觉方法概述,这份综述详细的讲述了当前计算机视觉领域中各种机器学习,深度学习和计算机视觉的相关概念和技术知识,值得一看!

    AI算法与图像处理
  • Nature子刊研究颠覆常识:视网膜计算使眼睛先于大脑产生视觉信息

    今天,我们可以看到计算机视觉(CV)系统在医疗保健,安全,运输,零售,银行,农业等领域的成功应用,已经深刻地改变了整个行业。

    新智元
  • 多模态机器翻译的视觉一致常规训练 (CS CompLang)

    原文题目: Visual Agreement Regularized Training for Multi-Modal Machine Translation

    shellmik
  • 微软亚研提出VL-BERT:通用的视觉-语言预训练模型

    作者:Weijie Su、Xizhou Zhu、Yue Cao、Bin Li、Lewei Lu、Furu Wei、Jifeng Dai

    机器之心
  • QQ国际版视觉探索-Insight . Create

    腾讯ISUX
  • 计算机视觉简介:历史、现状和发展趋势

    来源:中国科学院自动化所机器视觉课题组 【导读】本文由中国科学院自动化研究所模式识别国家重点实验室胡占义研究员撰写,对计算机视觉40多年的发展历程进行了简要总结...

    WZEARW

扫码关注云+社区

领取腾讯云代金券