冯前进:人工智能与心电图的自动诊断

近些年来,以CT、MRI以及PET为代表的医学影像技术飞速发展,医学影像已成为临床精确诊疗的必需手段。及时获得更清晰的影像并从海量影像数据中提取有用的信息,为重大疾病的预测、辨识和精确诊疗提供及时有效的依据和决策支持,对临床医生具有重要意义,且是临床诊疗中的迫切需求。在7月20~22日召开的第十五届心脏影像及心脏干预大会(CICI 2018)上,来自南方医科大学生物医学工程学院的冯前进院长对人工智能与心电图的自动诊断作了精彩演讲。

研究背景

心电图(ECG)的历史由来已久,它是利用心电图机从体表记录心脏每一心动周期所产生的电活动变化图形的技术,目前在临床上应用较为广泛。ECG的优势在于花费更少、速度更快、方便无创;ECG的功能主要是判断心律失常、诊断心肌缺血、反映心脏结构。目前常用的心电图有十二导联,随着人工智能(Artificial Intelligence,AI)的逐渐普及,心电自动诊断的重要性亦逐渐凸显。心电自动诊断不但可以提供辅助诊断信息,同时也可以24小时实时监控,这对于移动医疗、远程诊断都大有裨益。

心电分析算法的发展经过了几个阶段。2000年以前,医师主要依靠波形特征进行检测,如峰值高度、波峰间期等。之后的六年间,研究者在依靠波形特征检测的基础上加入了时频、小波、高阶统计量等因子。2006年后,随着神经网络和深度神经网络的发展,心电分析算法再次进入了大众视野。就算法设计而言,难点体现在以下几方面:一是通道数量多;由于ECG有12导联,因此会产生12个通道。现有的深度学习网络并没有适合的结构。二是分类标签多;一段心电图会有多个标签主类和标签子类,其中标签主类包括窦性心律、心房颤动、心房扑动、室性早搏、房性早搏、T波低平等一系列症状。如在窦性心律主类中就包含窦性心律过缓、窦性心动过速等心律不齐的标签子类。三是心电数据不等长; 合理的数据组织方法就尤为重要。四是数据不平衡,即异常数据与正常数据的分布并不平衡,需要引入适当的数据扩增方法。五是标注精度低;需要在网络中引入注意力机制。

研究方法

1、针对数据不等长问题,采取分帧方法,公式如下: Fs=(Sl-Fl)/(Fn-1)。其中,Sl为信号长度(Signal length),Fn为帧数(Frame number),Fs为帧移(Frame shift),即帧与帧的重叠程度。

2、针对数据不平衡,要进行数据增强。要注意时移不变性以及样本平衡,异常心动周期可以出现在信号的任何一个位置,数据增强可以将数据类别增补到平衡状态。

3、针对通道数较多,采取分通道卷积的结构进行。

研究结果

通过11,718例的数据总量均采用500Hz的采样率,使用12导联,信号长度在7500点,诊断标签18个。研究验证了数据增强的有效性,在灵敏度(疾病数据的检出率)和AUC(二分类器的综合性能)方面,提升标签数分别为13和10(Figure 1)。

Figure 1

数据增强的有效性

总 结

基于密集卷积网络的心电自动诊断算法利用分通道卷积结构、数据分帧以及数据增强等一系列技术,使心电自动诊断的有效性得到优化。然而这一算法也存在一些不足;从数据来看,相对于图像数据库的数据量还是不够,尤其是疾病的阳性样本数过少;另外,由于数据标注是对数据整体进行的,自动算法难以定位到疾病的异常片段。针对这些问题,可以通过采集更多数据、增加标注精度以及提高数据集质量来解决。此外,由于模型种类繁多,日新月异,如何挑选出合适的模型实现更高的自动诊断精度就成为一个重要的问题。现有的模型对所有的疾病种类的学习过程是相同的,要针对疾病设计出更有特异性的模型。冯前进院长最后指出,在未来尝试使用注意力机制改进模型和热图迭代算法多次训练并辅以深度学习可更好地解决这一难题。

本文内容为《门诊》杂志原创内容转载须经授权并请注明出处。

门诊新视野|微信号:ClinicMZ

《门诊》杂志官方微信

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180808B1K4YD00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券