为了获得高质量的分割结果,目前临床上小儿超声心动图的分割主要由超声工作者手工完成,这既费时费力,又高度依赖于超声工作者的专业水平。为了解决这些问题,本文提出了一种新的卷积神经网络(CNN)结构,称为双网络一般对抗网络(DNGAN)。DNGAN由一个产生器和两个鉴别器组成,产生器采用并行对偶网络来提取更多有用的特征以提高性能。我们使用双重鉴别器来强制生成器学习更多的空间特征,并更准确地分割左心的边缘。
图中是儿童的心脏的左心室和左心房的分割标注label,可以发现:左心房的变化比较明显,并且内壁会存在模糊,因此目前的对于四腔的分割存在一下挑战:(1)因为噪音和模糊出现的边界不清晰;(2)心脏的尺寸对于不同人是不同的;(3)每一个心动周期心房和心室的变化是不同的。
在这里插入图片描述
这个DNGAN的结构如上所示:包含一个生成器和两个鉴别器。
由一个U-net和FCN并行构成,分别从输入图片中提取两种特征,然后特征进行像素相乘.
FCN输出的特征图为
,U-net输出的特征图为
,那么由generator输出的图像分割结果为
.
是一个六层的全卷积网络,然后分别用7,5,3作为卷积核的大小。卷积层后面跟着BN层和LeakReLU激活层。
使用的是multi-scale L1损失,类似于2014年的图像分割网络Richer conv net。
先回顾一下一般的GAN的损失函数:
在公式中:
再来看一下DNGAN的损失函数:
为某一张儿童超声心动图四腔图,
为对应的ground truth;
是mean absolute error,也就是我们说的L1loss;
这个可以看到,
是discrimintor提取的特征,L表示discrimintor的层数,所以
表示discrimintor第i层提取出来的特征图
就是常说的cross entropy;
是第二个discriminitor的损失函数,也比较复杂我们来看一下,这个损失函数分辨的是:输入的是生成的mask还是真实的mask。
1, 这篇文章的结果和过程存在疑点,文章中出现一处公式的疑似符号错误。
2, 文章中的并没有给出第二个discrimintor的loss使用MSE和BCE的平均值的原因,不确定是否之前就有文章已经讨论过这个样做的优势。从结果来看,使用GAN的框架来训练造成的提升并不高,反而提升分割精度的重点应该是分割网络的特征融合和宽度增加。3, 文章使用GAN应用在儿童超声心脏病上的出发点很好,希望可以帮助更多的儿童摆脱先天性心脏病的困扰。