专栏首页新智元Nature子刊研究颠覆常识:视网膜计算使眼睛先于大脑产生视觉信息

Nature子刊研究颠覆常识:视网膜计算使眼睛先于大脑产生视觉信息

来源:medicalxpress

编辑:元子、啸林

【新智元导读】眼睛中的神经细胞是如何感知运动信号的?它们又是怎样把感知信号转化成神经信号传递给大脑的?这个秘密一旦被揭露,或许能够让计算机视觉取得前所未有的飞跃。「新智元急聘主笔、高级主任编辑,添加HR微信(Dr-wly)或扫描文末二维码了解详情。」

今天,我们可以看到计算机视觉(CV)系统在医疗保健,安全,运输,零售,银行,农业等领域的成功应用,已经深刻地改变了整个行业。

刚刚过去的2019年(然而这个数字却突然变得好像很遥远),我们看到了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。

目前我们在计算机视觉方面的研究,依然是依托卷积神经、自监督学习等理论,这在去年CVPR、ICCV等计算机视觉顶会上的几篇论文中得到了非常好的体现。

EFFICIENTNET:对卷积神经网络的模型缩放的重新思考

Google Research Brain Team的研究人员介绍了一种更好的扩大卷积神经网络(CNN)的方法。按照惯例,随着可用资源的增多,首先要开发CNN,然后再根据输入图像的深度,宽度或分辨率进行放大。

作者表明,如果仅将这些参数之一放大,或者将所有参数任意放大,相对于所需的额外计算能力,这都会导致收益迅速减少。相反,他们证明了存在最佳的深度,宽度和分辨率比率,以使效率和准确性最大化。这称为复合缩放。

EfficientNet在8个数据集中的5个获得了更好的精度,平均参数减少了9.6倍。特别是,具有66M参数的EfficientNet在ImageNet上达到了84.4%的top-1精度和97-1%的top-5精度,比GPipe(557M参数)小8倍,快6倍,这是目前最好的成绩。

面向视觉导航的增强型跨模态匹配和自监督模拟学习

视觉语言导航要求机器使用口头指令和视觉感知来导航真实的3D环境。

对人眼来说,这是一项再简单不过的任务。但对人工智能而言,这是一项极具挑战性的任务,因为它需要将语言线索与给定的物理环境相匹配,并且需要解析与该环境有关的语义指令。

研究人员提出了一种新的强化跨模态匹配(RCM)方法,该方法通过强化学习(RL)在本地和全球范围内实施跨模态接地。

最终,RCM框架在以下方面优于R2R数据集上的最新视觉语言导航方法:

  • 将SPL分数从28%提高到35%;
  • 成功率提高了8.1%。
  • 此外,使用SIL模仿RCM代理先前在训练集上的最佳体验,会导致平均路径长度从15.22m下降到11.97m,而SPL度量的平均结果更好(38%)

计算机视觉最初的灵感来自于人类的视觉。在我们所有的感官中,视觉尤为重要,因为它使我们能够发现并避免危害。

例如,视觉可确保我们在高峰时段穿越繁忙的道路时能够快速,准确地确定汽车和自行车从何处驶近以及它们以多快的速度行驶。

当物体在我们的视野中移动时,眼睛中的神经细胞就会感知并发出运动方向的信号。然而,这些神经细胞如何对大脑皮层中的神经细胞产生影响,仍然是一个谜。

如果这个谜底无法揭开,恐怕很难让计算机视觉达到我们希望达到的境界。

揭秘视觉细胞如何让将运动信号形成大脑意识

最近,奥尔胡斯大学(Aarhus University)的研究人员绘制了将视觉运动的信息传递到大脑皮层的神经细胞的功能图。这将使我们对大脑中意识的感觉印象如何产生有了全新的认识。研究结果已在《自然通讯》上发表。

“我们已经描述了一种特殊的神经回路,该回路从眼睛的神经细胞到大脑皮层的神经细胞发送有关视觉运动的信息。这很重要,因此我们可以开始了解大脑中意识性感觉印象如何产生的机制。”一作作者Rune Nguyen Rasmussen解释说。

从长远来看,它可能会使研究人员理解和治疗大脑感觉功能失调的疾病,比如痴呆,或精神分裂症患者是如何出现幻觉的。

颠覆常识:以前认为在大脑皮层中产生的东西实际上已经在眼睛中出现了

“如果视觉没有感知运动的能力,就会导致严重的后果,如我们从那些丧失了感知物体运动能力的人身上所看到的。”

通过结合一系列先进的实验方法,并使用小鼠作为影响眼睛中特殊神经细胞的动物模型,研究人员能够了解眼睛神经细胞如何影响大脑皮层神经细胞。

在这项研究中,研究人员证明了眼睛中一组特殊的神经细胞可确保大脑皮层中的视觉神经细胞可以感知并响应高速的视觉运动。

最有趣的地方是,它意味着以前认为在大脑皮层中产生的东西实际上已经在视觉的最早阶段即眼睛中出现了

“我们研究后剩下的一个重要问题是该神经回路如何以及何时涉及行为的各个方面。因此,我们研究的下一步将是了解老鼠四处移动并需要在周围环境中导航时,这个神经回路是否参与了感知视觉运动。” 论文一作Rune Nguyen Rasmussen说。

本文一作Aarhus大学博士生,第一篇论文即上Nature子刊

本文一作是奥尔胡斯大学的博士研究生Rune Nguyen Rasmussen,他的研究重点是视觉皮层是如何把视觉信息流转换成神经元消息的。

发了第一篇实验室论文,Rasmussen高兴地发推庆祝:

我在Yonehara团队的第一篇实验室论文发表在了《自然通讯》上,我非常兴奋!在这项工作中,我们发现了一个从小鼠视网膜方向选择性细胞发出信号的分离的皮层流。

参考链接:

神经回路映射:现在我们更好地理解视觉

https://medicalxpress.com/news/2020-04-neural-circuits-vision.html

Nature Communications原文参见:

https://www.nature.com/articles/s41467-020-14643-z

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-04-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 必读!2018最具突破性计算机视觉论文Top 10

    自从卷积神经网络在特定的图像识别任务上开始超越人类以来,计算机视觉领域的研究一直在飞速发展。

    新智元
  • 深度 | 英特尔刚刚推出的深度学习处理器 Knights Mil 强在哪里

    【新智元导读】英特尔今天推出了深度学习处理器 Knights Mill,正式迈入了与英伟达GPU抗衡的战场。Knights Mill 能充当主处理器,可以直接接...

    新智元
  • 人脸识别技术禁令再来!美国又一城市禁止面部识别软件

    近日,马萨诸塞州的萨默维尔市议会通过了禁止在公共场所使用面部识别软件的投票。新政策生效后,该市各机构、分局或下属部门,均不得在公共场所使用面部识别技术。

    新智元
  • QQ国际版视觉探索-Insight . Create

    腾讯ISUX
  • 多模态机器翻译的视觉一致常规训练 (CS CompLang)

    原文题目: Visual Agreement Regularized Training for Multi-Modal Machine Translation

    shellmik
  • 资源|计算机视觉方法概述

    今天给大家推荐一份最新的计算机视觉方法概述,这份综述详细的讲述了当前计算机视觉领域中各种机器学习,深度学习和计算机视觉的相关概念和技术知识,值得一看!

    AI算法与图像处理
  • 计算机视觉简介:历史、现状和发展趋势

    来源:中国科学院自动化所机器视觉课题组 【导读】本文由中国科学院自动化研究所模式识别国家重点实验室胡占义研究员撰写,对计算机视觉40多年的发展历程进行了简要总结...

    WZEARW
  • 计算机和人类“看”法不同,但这重要么?

    当工程师第一次“教”计算机“看”这个动作时,他们理所当然地认为计算机可以像人类眼睛一样进行观看。

    大数据文摘
  • 微软亚研提出VL-BERT:通用的视觉-语言预训练模型

    作者:Weijie Su、Xizhou Zhu、Yue Cao、Bin Li、Lewei Lu、Furu Wei、Jifeng Dai

    机器之心
  • 2017CS231n学习笔记——计算机视觉的概述

    这门课程是由stanford大学计算机视觉李飞飞以及她的学生制作的,也叫做CS231n,是偏专业性的深度学习+计算机视觉课程。

    用户1154259

扫码关注云+社区

领取腾讯云代金券