今天分享一篇发表在MICCAI 2020上的论文:Deep Volumetric Universal Lesion Detection Using Light-Weight Pseudo 3D Convolution and Surface Point Regression (原文链接:[1])。
在病人的CT扫描中准确、全面地识别、测量和报告病变,对医生来说是重要但却费时的过程,计算机辅助检测可以提高这一个过程的效率。但是在三维成像中,病变区域的外观、位置和大小分布存在巨大的差异,因此仍然具有很大的挑战。
这篇文章提出了一种新型的anchor-free单阶段病灶定位网络 (volumetric lesion detector, VLD),可以在更少的模型参数量的前提下达到更好的效果。网络主要由如下几部分组成:
如上图(Fig.1)所示,3D的CT扫描图作为网络的输入,通过P3DC骨干网络提取深度特征,这些特征被送入VLD的3D中心点回归网络和SPR表面关键点回归网络分别预测中心点坐标和表面关键点坐标。
P3DC骨干网络是基于DenseNet-121进行搭建的,但移除了其第四个dense模块。VLD的核心策略是在前半部分特征提取的时候保持2D网络,而仅使用P3DCs模块将DenseNet-121的第三个dense模块转换成3D网络。这个策略与[2]一致,他们发现了在高层次引入3D信息比低层次更加有效。
3D部分: 第三个dense模块以及输出网络部分均采用3D的卷积网络,文中研究了P3DCs的几种不同构造,如下图(Fig.2)所示:inflated 3D (I3D), spatio-temporal 3D (ST-3D), axaial-coronal-sagittal 3D (ACS-3D)。最后选取了ACS-3D作为基本模块,并把3个分支的通道数比例设置为8:1:1。
3 实验结果
这里我只给出论文中的部分实验结果,具体的实验结果分析以及实验和参数的设置请看原文。
[1] https://link.springer.com/chapter/10.1007/978-3-030-59719-1_1
[2] MULAN: multitask universal lesion analysis network for joint lesion detection, tagging, and segmentation
本文分享自 Python编程和深度学习 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!