一、ICIAR 2018介绍
乳腺癌是全球主要的癌症相关死亡原因之一,尤其是女性。然而,早期诊断可显着提高治疗成功率。为了早期诊断,正确分析组织学图像至关重要。具体来说,在诊断过程中,专家通过全玻片和显微镜图像评估整体和局部组织组织。然而,大量的数据和图像的复杂性使得这项任务既耗时又不简单。因此,自动检测和诊断工具的开发具有挑战性,但对该领域来说也是至关重要的。
二、ICIAR 2018任务
任务A:自动将H&E染色的乳腺组织学显微镜图像分为四类:正常、良性、原位癌和浸润性癌。
任务B:在相同的四个类别中对整个切片图像执行像素级标记。
三、ICIAR 2018数据
数据集由苏木精和伊红 (H&E) 染色的乳腺组织学显微镜和全玻片图像组成。
1、显微镜图像
根据每幅图像中的主要癌症类型,显微镜图像被标记为正常、良性、原位癌或浸润性癌。注释由两名医学专家进行,有分歧的图像被丢弃。

该数据集总共包含 400 张显微镜图像,分布如下:正常:100,良性:100,原位癌:100,浸润性癌:100。
显微镜图像采用 .tiff 格式,并具有以下规格:颜色模式:R(ed)G(reen)B(lue),尺寸:2048 x 1536 像素,像素尺寸:0.42 µm x 0.42 µm,内存空间:10-20 MB(大约),标签类型:图像方式。
2、整张切片图像
全切片图像是包含整个采样组织的高分辨率图像。从这个意义上说,显微镜图像只是整个全切片图像的细节。因此,每个全切片图像可以具有多个正常、良性、原位癌和浸润性癌区域。全切片图像的注释由两名医学专家进行,存在分歧的图像被丢弃。每个图像都有一个相应的标记坐标列表,其中包含良性、原位癌和浸润性癌区域(剩余组织被认为是正常的,因此与性能评估无关)。

全切片图像采用 .svs 格式,并具有以下规格:颜色模式:R(ed)G(reen)B(lue),尺寸:可变(例如:42113 x 62625 像素),像素比例:0,467 µ/像素,内存空间:在 numpy 数组 (pyhton) 中为 8 GB(大约),在 .svs 中为 200-250 MB(大约),采集系统:Leica SCN400,标签类型:逐像素。
每个区域的轮廓点的坐标注释可作为 .xml 文件中。
四、技术路线
任务一、乳腺癌四类分类
1、将图像缩放到固定大小1024x1024,然后采用均值为0,方差为1的方式进行归一化处理,再将数据分成训练集和验证集。
2、搭建ResNet2d网络,使用AdamW优化器,学习率是0.001,batchsize是32,epoch是300,损失函数采用交叉熵。
3、训练结果和验证结果


4、验证集分类结果



precision recall f1-score support
0.0 0.64 0.88 0.74 8
1.0 0.00 0.00 0.00 5
2.0 0.82 1.00 0.90 14
3.0 0.91 0.77 0.83 13
accuracy 0.78 40
macro avg 0.59 0.66 0.62 40
weighted avg 0.71 0.78 0.73 40
5、测试集分类结果





任务二、乳腺癌四类分割
1、图像预处理,缩放到固定大小1024x1024,然后采用均值为0,方差为1的方式进行归一化处理。然后将数据分成训练集和验证集。
2、搭建VNet2d网络,使用AdamW优化器,学习率是0.001,batchsize是32,epoch是300,损失函数采用多分类的dice和交叉熵。
3、训练结果和验证结果


4、测试分割结果




