深层卷积人工神经网络(Deep Convolutional ANN)是近年来视觉处理领域的宠儿,它们起源于简单的浅层网络(如八层结构的AlexNet),进化出多层级、多分支的复杂结构(如NASNet、ResNet)。
这些深层的前馈神经网络虽然在物体识别测试中表现卓越,但都存在局限。
这些深层ANN继续进化,是否会变得越来越不像真实的大脑?
为了回答这个问题,MIT的DiCarlo实验室推出线上测试平台Brain-Score,评估ANN与大脑在物体识别过程中的相似程度,同时与多方合作,开发浅层网络CORnet系列。
其中,最优秀的是CORnet-S选手,它的构造与大脑的解剖结构更加对应,且在机器学习评估中表现优异,是迄今为止灵长类视觉腹侧通路的最佳模型,为视觉处理领域ANN的开发与对大脑功能的深入理解提供了新思路。
CORnet-S由4个层级组成,分别对应大脑视觉腹侧通路中的V1、V2、V4与IT区域,在第4层之后增加一个线性分类解码器,对应从IT区域信号输出到行为选择的处理过程。
CORnet-S的每个层级都是一个简单的经典卷积神经网络,由卷积、激活、非线性化、归一化、池化等步骤组成,其中V2、V4、IT区域的回路结构一致,但神经数目不同。
CORnet-S增加了层级内部循环的特征,其中V2与IT区域重复2次,V4区域重复4次,并且增加了跳跃连接。
△来源:arXiv:1909.06161 [cs.CV]
层级内部循环,即将该层级的输出作为输入重新进入该层级,多次重复后得到最终的输出,模拟脑区内部循环。
Brain-Score平台从以下几个方面评估ANN性能:
在Brain-Score平台上可以看到,相比其他的视觉处理人工神经网络,CORnet-S得分最高,在ImageNet测试中也名列前茅,是浅层网络中表现最好的。综合考虑ANN的前馈简易度因素,CORnet-S也十分具有优势。
研究者进一步探索发现,循环是CORnet-S在评估中表现优异的关键因素,区域内循环次数、瓶颈层设定与跳跃连接是关键参数。另外,相比前馈网络,CORnet-S与猴脑内物体识别时间的相关程度更高(r=0.19, p<1e-8),可以部分抓取IT区域的神经元动态,而这一点是前馈神经网络无法做到的。
CORnet-S的发展不仅打破了传统的深层网络开发思路,也为神经生物学家深入理解大脑结构与功能提供了新的可能性。值得注意的是,目前CORnet-S的设定中不包含层级间循环与反馈,且不包括对应大脑结构中视网膜与外侧膝状体(IGN)的区域,这些现存的缺陷都为它未来的发展提供了想象空间。
论文连接: https://arxiv.org/abs/1909.06161
CORnet家族开源地址: https://github.com/dicarlolab/cornet