前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hinton的GLOM模型与千脑理论有何本质不同?

Hinton的GLOM模型与千脑理论有何本质不同?

作者头像
AI科技评论
发布2021-05-19 10:08:19
9190
发布2021-05-19 10:08:19
举报
文章被收录于专栏:AI科技评论AI科技评论

编译 | 琰琰

校对 | 青暮

Geoffrey Hinton在最新发表的一篇论文“如何在神经网络中表示部分-整体层次结构”中提出了一种被称为GLOM的新理论。

关于GLOM模型与千脑理论( Thousand Brains Theory )之间有何差异近日成了学者们讨论的热点。千脑理论是由Numenta联合创始人、计算机科学家,神经生物学家Jeff Hawkins于2018年提出的一种理解大脑运行机制的新方法。

基于此,Numenta公司近日发表了一则官方博文,文章中研究人员Marcus Lewis 从高层次概述了GLOM模型与千脑理论的共同点和差异。详细内容可见以下视频:

1 什么是千脑理论?

千脑理论( Thousand Brains Theory )是一种感知移动(sensorimotor )理论,它通过模拟大脑皮层的脑回路,提出了一种理解大脑运作过程的新方法。

Vernon Mountcastle 最早提出,皮层柱(Cortical Column)在大脑皮层的每一个功能区域和层级都执行相同的计算。唯一不同的是输入的变化。基于Mountcastle的理论,千脑理论提出,大脑并非构造一个物体的模型,而是平行地构造数千个物体的模型。

皮层柱用不同的感官输入构造模型。比如手掌上的手指可以代表五个不同的输入感官,每一柱对它们所感知到的东西进行投票并得出一种单一解释,这种解释也就是它们协商一致的结果。

这一理论的关键在于,大脑皮层的每一根皮层柱通过移动来学习构造物体的模型。也就是,通过观察我们的感官输入在移动时发生的变化。例如,当我们的眼睛在扫视时,大脑中的皮层柱会不断地预测新的感觉。

该理论还提出,大脑皮层主要处理由每个皮层柱产生的参照系。基于参考系,每一柱可以将感官输入与物体的位置和结构进行关联,例如当你触摸杯子时,你接收到的每个感觉都是相对于它在杯子上的位置进行处理的结果(参考系允许这种情况的发生)。

2 它与GLOM模型有何相似之处?

GLOM模型是建立在Hinton早期的胶囊研究基础之上的。早在2017年,Numenta公司副总裁Subutai Ahmad就分享了他对Hinton胶囊理论与 HTM 感知移动理论之间的看法。

GLOM是一种计算机视觉模型,它提出了一种改善AI理解视觉场景的新方法。与千脑理论类似,它也由大量结构相似的柱子组成。GLOM模型提出,每一柱都由五个不同层次的物体表示组成,并在不同的抽象层次上与特定的位置相关联(例如,当你触摸杯子时,柱的底层会形成一个弯曲边缘的表示,顶层会形成一个杯柄的表示)。Hinton认为,随着时间的推移,每一层级的表示都应该确定下来,即通过投票产生出一致的表示。最终,为物体建模的每一柱都将在顶层解析出物体(如咖啡杯)的一致表示。

由于Hinton的研究符合认知科学,而“千脑理论”是研究大脑皮层的一种模型,因此,Hinton提出的结构同样支持“千脑理论”,这是合乎逻辑的。总结来看,它们之间的相似性包括以下几点:

  • 结构相似的柱和层
  • 每一柱都将感官输入与特定位置相关联
  • 多个柱学习相同物体的表示。
  • 每一柱都学习完整物体的表示。
  • 横向连接用于相邻柱之间物体表示的局部共享
  • 每一列都使用自下而上、自上而下以及横向连接来对所感知物体表示进行投票。

3 GLOM和千脑理论的三大区别

移动

千脑理论的一个关键概念是:大脑皮层通过移动来学习。当我们移动时,大脑皮层会学习到我们周围成千上万个物体的模型。GLOM主要处理“单一且固定的时变图像”,它将视觉视为一系列帧,那么静态图像就是一系列相同的“固定”帧。但我们知道视觉不是静止的,它是一个互动的过程。我们的眼睛每秒可以快速扫视三次,每次扫视大脑的视觉输入都会发生变化。另外,当我们移动时,视觉输入也会随之改变。

可以讲,Hinton的论文并没有涉及感知移动问题,而这是千脑理论的核心组成部分。为了更好地训练GLOM模型识别物体,并解释大脑处理视觉的过程,Hinton可能需要结合移动来分析。

层次

千脑理论提出了一个全新的层次结构概念,而GLOM模型的每一个柱都有传统的特征检测器层次结构。在GLOM中,单个柱能够跨越整个层次结构,因为它的每个层次都表示一个抽象的级别(即层次结构级别);为了学习物体的模型,它通过自下而上和自上而下两种方法传递信息。与之相反,千脑理论中的每一柱都处于一个层次。皮质柱在层次结构、大脑不同区域和感知方式上共同发挥作用。

映射到新皮质

GLOM模型和千脑理论的最大区别在于:GLOM是受大脑启发的,但它并不映射到特定的大脑皮层或者实验性的神经科学。Hinton将其定义为一个计算机视觉问题,他用认知科学来解决“如何使计算机智能化”的问题,他指出,GLOM是受生物学启发而来,但作为一个生物模型,它已经达到了让人难以置信的地步。在这里,Hinton提供了一些GLOM部分的数学描述(非生物回路)。

相比之下,Numenta则将研究界定为一个智力问题,并试图解释“人类为什么是聪明的?”,研究人员的目标是了解大脑的功能和运作过程,并将这些核心原理应用到当今的机器学习系统中。与GLOM不同的是,千脑理论在生物学上是合理的,同时也是受限制的。因为它需要模拟大脑皮层中所有构成智力基础的脑回路的生理结构和细节。

GLOM提供了一种在神经网络中处理和表示视觉信息的创新方法。二者乍一看有相似之处,但归根结底,GLOM与Numenta的“千脑理论”仍有本质上的不同。大脑是目前唯一真正智能的计算机,具有无与伦比的学习和适应能力。要创造真正的智能系统,需要先了解大脑是如何工作的。

原文链接:

https://medium.com/@Numenta/comparing-hintons-glom-model-to-numenta-s-thousand-brains-theory-88ed999ab13d

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-05-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 什么是千脑理论?
  • 2 它与GLOM模型有何相似之处?
  • 3 GLOM和千脑理论的三大区别
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档