今天将分享组织学前列腺自动格里森分级完整实现版本,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。
一、SICAP2020介绍
在全球范围内,前列腺癌(PCa)是男性第二大常见癌症,2018年新增患者130万。据世界卫生组织称,这十年内每年新增病例数将增加40%以上。一旦临床检查或血液测试表明存在前列腺癌,诊断前列腺癌的主要工具就是前列腺活检。用针提取一小部分组织,层压,用苏木精和伊红 (H&E) 染色,最后储存在晶体中。然后,病理学家在显微镜下对样本进行分析,使用格里森分级系统根据腺体、细胞核和管腔的形态和组织来确定癌性模式的存在和分级。在该系统中,根据癌症的预后将组织中的不同癌症模式分为不同级别。特别是,对于二维组织切片,格里森等级 (GG) 范围为3至5,与组织的腺体分化程度成反比。格里森 3 级 (GG3) 包括萎缩性良好分化和致密的腺体区域。GG4 包含筛状、形状不良、大融合和乳头状腺体图案。最后,GG5 包括孤立的细胞或细胞文件、没有腔形成的细胞巢和假玫瑰花图案。
病理学家通过目视检查对组织区域进行分类,检测一种或多种格里森模式的存在,最后根据最突出的等级诊断组合格里森评分(例如,组合等级 5 + 4 = 9 将分配给以下样本) 其中主要的癌性格里森等级是5级,其次是 4 级)。因此,综合格里森评分范围为6至10,并将其分配给整个活检。该评分是目前前列腺癌预后的最佳标志,它定义了要应用的治疗方法。然而,组织学前列腺活检的格里森评分是一项非常耗时且重复的任务,具有病理学家内部和病理学家之间的差异。此外,在 2014 年上届国际泌尿病理学会 (ISUP) 共识会议之后,新的指南被纳入其中,增加了病理学家的工作量。特别是,建议还报告样本中格里森4级的百分比,主要针对评分为3+4=7的区域,其中格里森4级的百分比较高表明早期治疗的便利性,并且筛状腺体模式的存在,表明预后比其他格里森4级模式的存在更差。计算机辅助诊断系统 (CAD) 支持病理学家的工作并提高该过程的客观性。这些基于组织学数字化,获取整个切片图像 (WSI) 并开发计算机视觉算法来检测活检 (或 WSI) 内的癌变区域。
二、SICAP2020任务
组织学前列腺格里森4类分级
三、SICAP2020数据集
SICAPv2 数据库包含来自95名签署相关知情同意书的不同患者的155份活检组织。使用Ventana iScan Coreo扫描仪以40倍放大倍率对组织样本进行切片、染色和数字化,以获得WSI。巴伦西亚Cl´ınico医院的一组泌尿生殖病理学家专家对载玻片进行了分析,并为每次活检分配了综合格里森评分。在等级不确定的情况下,标签由所有病理学家专家一致指定,以避免观察者之间的差异。每次活检中的初级格里森等级(GG)分布如下:36个非癌性区域,40个样本为格里森3级,64个样本为格里森4级,15个样本为格里森5级(以下分别为NC、GG3、GG4和GG5))。
使用基于 OpenSeadragon 库的内部软件对局部癌性模式进行注释,遵循格里森量表并指示筛状腺体结构的存在。为了处理大型 WSI,它们被下采样至 10 倍分辨率,并分为大小为 512x512的块,并且它们之间重叠 50%。通过应用Otsu阈值方法获得patch块中组织存在的掩模。为了开发能够预测主要格里森等级的模型,排除了组织少于20%的patch块。此外,由病理学家注释的、属于癌性活组织检查的没有癌性模式的patch块也被丢弃。在此过程之后,数据库包含4417个非癌性patch块,其中 1635 个标记为 GG3,3622 个标记为 GG4,665 个标记为 GG5。
数据集下载:
https://data.mendeley.com/datasets/9xxm58dvs3/2
四、技术路线
1、将图像缩放到固定大小512x512,然后采用均值为0,方差为1的方式进行归一化处理,再将数据分成训练集和验证集,在对训练集中GG3和GG5这两个类别的图像进行数据增强操作。
2、搭建ResNet2d网络,使用AdamW优化器,学习率是0.001,batchsize是64,epoch是300,损失函数采用交叉熵。
3、训练结果和验证结果
4、验证集分类结果