前沿 | 新框架SyConn利用卷积神经网络和随机森林阅读神经成像:可识别线粒体和突触等

机器之心原创

作者:Yujia

参与:Joni、Rick R、吴攀

人脑是一个智能而复杂的机器。这种类比在某些方面是准确的,并且在大脑研究领域中提供了一种方法。我们都知道,人脑可以分为四个部分:额叶、顶叶、颞叶和枕叶。这种划分的其中一个标准是功能性(functionality),或者说该区域负责行使哪种功能。例如,颞叶通常与听觉处理和嗅觉有关,而枕叶通常与视觉信息处理有关。

然而,大脑中的大多数神经行为非常复杂,不同程度上涉及了人脑的多个区域。其功能性也并不局限于对特定大脑区域的划分。歧义无所不在。因此,当发生脑部疾病并出现功能性障碍时,从宏观层面来调查其中的深层原因是相当困难的。回到机器的那个类比,科学家现在想弄清楚他们是否可以从微观层面来消除这种「歧义」,即通过大脑基本单元之间的连接——神经元。一个连接组(connectome)就是一张大脑中神经连接的全景图,显示了神经元的连接以及行驶不同功能的方式。

体积成像电子显微镜(Volume Electron Microscopy)

体积电子显微镜(Volume EM)是一种常用的神经回路重建技术。其中,对大脑体积的三维 EM 成像技术可以用来重建神经元形态及其连接关系的细节信息。volume EM 之间的开发差异始于对中枢神经系统(CNS)检查的需要。正如导言所述,许多神经退化性疾病无法通过自上而下的方式来追究病因。因此,有必要使用足够大的分辨率来对轴突、树突和单个突触的活动进行分析。

荧光标记法通常适用于组织检查,相比之下,标准的 EM 染料并不受限于对稀疏标记或超分辨率光学成像的要求。这些染料可能会对所有的细胞膜和突触进行相对无偏见的染色。因此,Volume EM 可以用来塑造某个神经元前后突触结构的完整连接关系。此标准操作也可以拓展到脑体积中的所有神经元上,使我们能够建立一张全面的脑神经接线图或一个大脑连接组。

近年来,随着数据处理技术的进步,定量方法变得越来越重要。通过来自大数据集的解剖学电路重建技术(Anatomical Circuit Reconstruction),Volume EM 可以为神经计算提供之前所无法获得的见解。Volume EM 的技术进步以及计算能力的增强已经令使用足够大的数据集来重建完整的神经微电路成为可能。这些新的发现为一些研究项目提供了支持和示范——解剖电路重建技术如何才能为神经计算提供之前所无法获得的见解。

突触连接推理流程(Synaptic Connectivity Inference Pipeline, SYCONN)

脊椎动物和无脊椎动物的神经系统中都密密麻麻地交织着神经元,它们的轴突、树突和突触相互连接或彼此重叠。因此,试图破解成千上万个神经元之间的连接细节不是一件容易的事。从 Volume EM 的大数据集中重建的这种连接组是一个高维网络,这意味着对它的分析需要花费大量的时间和精力。虽然技术的进步使我们可以获得足够多具有良好分辨率的数据,但是分析过程仍然是一个问题。如图 1 所示,要想重建全部细节,人工分析需要花费数百万个小时的时间。

图 1:对不同数据集进行人工分析的预算时间。j0126(斑胸草雀,21,850 个神经元片段)、 斑马鱼幼体的大脑(100,000 个神经元)和小鼠脑(灰质,71,000,000 个神经元)。顶部颜色栏显示,除了最初手工重建的部分(红色),SyConn 将剩下的所有步骤(绿色部分)自动化。图表纵队显示了从 Volume EM 数据集中生成一个连接矩阵所需的步骤。

因此有必要开发一种能够自动分析所有可用数据的方法,使连接组的构建更具有可行性。在这篇论文中,研究人员介绍了一种自动化突触连接的推论流程(SyConn),该模型需要使用所生成的神经突起骨架以及分类器训练数据作为输入,并提供了一张有着丰富注解信息的接线图或是某个连接组的组件。在该推理流程模型中,第一步是对神经突起骨架进行体积重建。然后是对图像数据中的突触及其它超微结构对象(比如囊泡、线粒体)进行转换。对超微结构的检测可进一步增强神经突起的重建效果。

SyConn 框架采用深度卷积神经网络和随机森林分类器(Random Forest Classifier, RFC)来自动识别线粒体、突触及其它细胞类型,从而产生拥有丰富注解信息的突触连接矩阵。ElektroNN 是一个可有效利用图形处理单元(GPU)进行计算的高层次卷积神经网络(CNN)库,它被专门用来整合进 SyConn。通过消除冗余的计算和稀疏的训练标记,ElektroNN 在模型训练时间以及大数据集推理速度方面得到优化。

图 2:一个前突触神经元与一个后突触神经元的连接图。囊泡朝着突触间隙运输神经递质,后者携带有生化信息。其中还有大量的能量生产者——线粒体。

为了进行骨架到体积重建的转换,可以训练一个递归的三维卷积神经网络模型来检测神经突起之间的障碍区(膜和细胞外空间,ECS)。然后 ECS 可用于制备样本以用于分割(segmentation)。研究人员选择对囊泡云(vesicle clouds)和线粒体(mitochondria)一起进行检测,以此作为两个神经元是否相互连接的标准,而非二者之间的接触面积。由于这些超微结构对象是神经元之间重要的信息传输因子,因而它们在前 & 后突触神经元中的数量颇丰。因此,对囊泡云和线粒体的同时出现进行检测是一个很好的连接迹象。从技术上讲,一个多类卷积神经网络就是被训练用于处理这一步骤的。

一定要注意的是,这些报导出来的最好的训练成绩依赖于测试集的大小。多类卷积神经网络在小规模测试集上表现良好,大概是因为这种体量的连接数仍然是可应对的。虽然实验中显示出的性能前景光明,但我们并不知道该性能是否可以泛化到更大的数据集上,毕竟大数据集有着很大的多样性。

图 3:与其它前沿方法的比较。F1 分数反映了查准率和查全率的调和平均数。可以看出,SyConn 优于其它方法。

基于先前检测到的超微结构对象,SyConn 可以通过将它们的相对位置分配到神经突起的不同部分来进一步细化重建模型。这个过程可以辅助对亚细胞部分和神经细胞类型的分类。在这篇论文中,研究人员纳入了一个随机森林分类器来对树突棘头、树突棘颈或树突棘轴进行分类。增强细胞重建在细胞类型识别方面十分必要,该识别程序在构建连接矩阵和随后的分析过程中起到了重要的作用。通过比较线粒体和囊泡云在神经突起上的体积密度,研究人员发现,其中发射率最高的神经元类型具有最高的密度。对神经元的超微结构对象和相关发射率的研究,可能会在化学固定作用前为生命体内的生理特性提供一些见解。

讨论

连接组学(Connectomics)近年来经历了快速的发展。密集的连接组学分析受限于突触的注解时间并遵循着电路分析的步骤。SyConn 能够(在可接受的误差内)以较低错误率大大减少分析时间,从而令人工校对变得没有必要。对于数据集质量限制 SyConn 性能的问题,人工检查将会有利于准确率的提升。从该结果中我们也可以看到,利用预先训练的网络与后训练程序,深度卷积神经网络只需要最少的训练数据就能提取出超微结构对象的信息。

虽然自动化可以显著提高效率,但是自动化的神经突起重建技术到现在都没有成果,后者的可变性和复杂性更大。由于我们还处于专家在生物数据分析工作中发挥重要作用的阶段,可以预见,他们在未来的影响会越来越小。相反,学会了所有规则的机器可能会接管该工作。你认为该领域的专家会完全被计算机取代吗?

参考文献:

https://www.csuchico.edu/~pmccaffrey/syllabi/CMSD%20320/362unit4.html

http://www.sciencedirect.com/science/article/pii/S0968432814000250

http://www.sciencedirect.com/science/article/pii/S0959438811001887

本文分享自微信公众号 - 机器之心(almosthuman2014)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-05-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

【学术】从一个简单的模型开始,可以让机器学习更高效

AiTechYun 编辑:xiaoshan ? 要创建通用人工智能,必须首先掌握逻辑回归 从基础开始 在试图发展对世界的科学认识的时候,大多数的领域在探索重要的...

43770
来自专栏企鹅号快讯

2017年度盘点:Github上十大有趣的机器学习项目

目录: 1 AlphaZero-Gomoku 2 OpenPose 3 Face Recognition 4 Magenta 5 YOLOv2 6 MUSE 7...

67580
来自专栏IT派

神技能!在上司靠近座位时,用人脸识别技术及时屏幕切换

为了防止老板看到我开小差,我创建了一个系统,自动识别他的脸并切换屏幕伪装成工作的样子。深度学习使你能够在老板接近时隐藏屏幕!

14000
来自专栏美团技术团队

美团技术团队博客:推荐算法实践

前言 推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深...

562110
来自专栏数据派THU

精选 Github 近期13款开源工具包!(附数据集、链接)

本文共1700字,建议阅读6分钟。 本文为你精选近期Github上的13款深度学习开源工具包和数据集,一起Star和Fork吧~

22080
来自专栏PPV课数据科学社区

【学习】推荐算法实践

前言 推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深...

31030
来自专栏人工智能

深度学习轻松学:如何用可视化界面来部署深度学习模型

翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 DeepCognition.ai 的创始人。 Deep Cognition (深度认知) 建立的...

44270
来自专栏程序你好

什么是TensorFlow,TensorFlow教程

13620
来自专栏语言、知识与人工智能

【腾讯知文】任务型对话机器人简介

2.7K130
来自专栏目标检测和深度学习

本周 Github 精选:13 款炼丹利器,有开源工具包也有超大数据集

18740

扫码关注云+社区

领取腾讯云代金券