今天将分享CT纵隔淋巴结定量分割完整实现版本,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。
一、LNQ2023介绍
准确的淋巴结大小估计对于癌症患者分期、初始治疗管理以及纵向扫描评估对治疗的反应至关重要。当前用于量化淋巴结大小的标准做法基于多种标准,这些标准仅在一个或几个节点上使用单向或双向测量,通常仅在一个轴向切片上。但是人类有数百个淋巴结,其中任何一个都可能由于疾病或免疫反应而不同程度地增大。正常淋巴结的直径可能约为 5 毫米,而病变淋巴结的直径可能有几厘米。纵隔是肺部和心脏周围的解剖区域,可能包含十个或更多淋巴结,通常有三个或更多淋巴结肿大超过 1 厘米。3D 中的准确分割将提供更多信息来评估淋巴结疾病。扫描中所有异常淋巴结的完整 3D 分割有望提供更好的灵敏度,以检测表明对治疗有反应的体积变化。
用于医学图像分割的机器学习模型近年来取得了显着进步,但没有可用于完全量化淋巴结的工具,部分原因可能是缺乏用于训练的像素级真实注释。有两个关键障碍阻碍了自动淋巴结识别和分割工具的发展。首先,淋巴结通常位于正常软组织的强度分布范围内,边界不清,如果没有接受过医学培训,很难识别它们。这个问题由于节点可能会融合而变得更加复杂,导致没有特征形状的更大的垫结构。他们在不同主题上的表现可能会有很大差异,因此很难从小型数据集扩展到强大的工具。第二,由于每个病例通常有一个以上的病变节点,并且手动注释非常耗时,因此没有预先存在的临床用例可以对病例进行完整注释。这些关键问题使淋巴结分割成为弱监督分割技术的理想选择。弱监督学习最近引起了医学影像界的浓厚兴趣,强大的弱监督技术的发展将使机器学习从业者能够利用每天在现实世界临床操作中捕获的弱注释。这些关键问题使淋巴结分割成为弱监督分割技术的理想选择。弱监督学习最近引起了医学影像界的浓厚兴趣,强大的弱监督技术的发展将使机器学习从业者能够利用每天在现实世界临床操作中捕获的弱注释。这些关键问题使淋巴结分割成为弱监督分割技术的理想选择。弱监督学习最近引起了医学影像界的浓厚兴趣,强大的弱监督技术的发展将使机器学习从业者能够利用每天在现实世界临床操作中捕获的弱注释。
虽然已经提出了多种用于图像分割的弱监督技术,但这些技术中的大多数已经在私有数据集上或通过从完全注释的数据集中人工创建部分注释得到了验证。拟议的 LNQ2023 挑战将提供第一个医学基准,用于评估临床试验的大型数据集部分淋巴结分割的弱监督分割技术的性能。LNQ2023 挑战赛开发一个在 CT 扫描中自动分割纵隔淋巴结的系统。训练数据集将包含一组独特的高质量像素级注释,这些注释是癌症临床试验数据集部分中一个或多个临床相关淋巴结的注释。目标是分割纵隔中所有直径大于 1 厘米的淋巴结。将向参与者提供部分注释的案例子集(即五分之一的节点),并且将在完全注释的不同数据集(即所有临床相关节点)上执行算法评估。LNQ2023 是一个完全开放的挑战。LNQ2023 网站将使参与者能够提交他们的结果,以便自动评估并显示在排行榜上。空间重叠的骰子相似系数和平均对称表面距离(ASSD)将用作分割的评估指标。算法的评估将在完全注释的不同数据集(即所有临床相关节点)上执行。LNQ2023 是一个完全开放的挑战。LNQ2023 网站将使参与者能够提交他们的结果,以便自动评估并显示在排行榜上。空间重叠的骰子相似系数和平均对称表面距离(ASSD)将用作分割的评估指标。算法的评估将在完全注释的不同数据集(即所有临床相关节点)上执行。
二、LNQ2023任务
目标有两个:
第一个是建立纵隔淋巴结识别和分割的基准。
第二个是促进全身淋巴结定量的自动化和有效方法的开发。这有望节省时间并减少人工评估可能引入的观察者间和观察者内变异的可能性,从而在纵向随访中进行更准确的反应评估,最终产生更有效的临床试验数据。
三、LNQ2023数据集
CT 采集协议
在临床试验期间患者的治疗过程中,麻省布里格姆综合医院的临床工作人员获得了数据。来自 TIMC 淋巴结集合的图像是使用来自各种制造商(例如 GE Healthcare Discovery CT750HD、GE Medical System BrightSpeed、Siemens SOMATOM Definition、Toshiba Aquilion、Philips iCT)的常规临床 CT 扫描仪获取的,扫描具有常规临床质量,通常切片间距为 2-5mm,像素大小约为1mm或更小。采集通常是 512x512 轴向扫描,具有150个或更多切片(范围:48-656 个切片)。通过删除所有健康信息标识符并创建仅包含批准的标签和图像的新 DICOM 文件,对数据进行完全去标识化处理。去标识化程序得到了 MGB IRB 的批准,所有标题数据都由 MGB 工作人员手动审查。
训练数据使用标签图进行部分分割,详细说明扫描中的一个或多个患病淋巴结。验证集和测试集案例被完全分割,详细说明了扫描中所有患病的淋巴结。
在所有情况下,分割节点必须大于我们为临床相关性预定义的最小直径值1cm,这是由常见的临床试验反应评估标准指南支持的。1 cm的大小阈值通常用于临床试验,因为较小的淋巴结通常被认为不太可能是病理性的。假设是,通过提供仅包含患病淋巴结的标记数据,机器学习模型将学会仅分割重要的患病淋巴结。但是,承认可能会出现误报,这是应该优化的算法错误。 值得注意的是,尽管存在病变淋巴结,但算法必须学会从其预测中排除大量正常淋巴结。
本次挑战的数据总数:513
训练集: 393个部分标注的病例(即病例中并非所有淋巴结)。训练数据集将包含一组独特的高质量像素级注释,这些注释是癌症临床试验数据集部分中一个或多个临床相关淋巴结的注释。目标是分割纵隔中所有直径大于 1 厘米的淋巴结。将向参与者提供部分注释的案例子集(即五分之一的节点),并且将在完全注释的不同数据集(即所有临床相关节点)上执行算法评估。LNQ2023 是一个完全开放的挑战。
验证集(初步评估): 20 个完整注释的案例
测试用例(最终评估):100 个 完整注释的用例。
对图像系列的质量进行了人工审查,以确保没有因去识别化而引起的问题。所有注释者都是经过培训的放射科医师或放射学领域专家,拥有超过十年的经验。
四、计数路线
1、纵隔区域提取,首先使用固定阈值(-600,最大像素值)和最大连通域法获取整个人体ROI区域,然后采用肺分割方法提取肺部区域,然后根据肺部区域的z方向范围从人体ROI区域去除多余的背景区域得到纵隔ROI区域。
2、分析ROI图像,得到图像平均大小是510x328x82,因此将图像缩放到固定大小384x256x160。图像预处理,对步骤1的原始图像进行(-100,400)窗宽窗位截断,然后采用均值为0,方差为1的方式进行归一化处理。然后将数据分成训练集和验证集,对训练集做5倍数据增强处理。
3、搭建VNet3d网络,使用AdamW优化器,学习率是0.001,batchsize是1,epoch是300,损失函数采用二值化的dice和交叉熵。
4、训练结果和验证结果
5、验证集分割结果
由于是要分割纵隔淋巴大肿瘤,要求肿瘤直径大于10mm,所以通过判断每个分割连通域的最大直径来去除直径小于10mm的淋巴肿瘤。
左图是金标准结果,右图是预测结果。
6、测试集分割结果
如果大家觉得这个项目还不错,希望大家给个Star并Fork,可以让更多的人学习。如果有任何问题,随时给我留言我会及时回复的。