基于EEG的癫痫自动检测: 综述与展望

脑机接口社区

发布于 2021-04-22 11:27:40

1.2K0

发布于 2021-04-22 11:27:40

文章被收录于专栏：脑机接口

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

摘要：癫痫是一种由脑部神经元阵发性异常超同步电活动导致的慢性非传染性疾病, 也是全球最常见的神经系统疾病之一. 基于EEG的癫痫自动检测是指通过机器学习、分布检验、相关性分析和时频分析等数据分析方法, 对癫痫发作阶段的EEG信号进行自动识别的研究问题, 能够为癫痫诊疗与评估提供客观参考依据, 从而减轻医生工作负担并提高治疗效率, 因此具有十分重要的理论意义与实际应用价值. 本文详细介绍基于EEG的癫痫自动识别整体框架, 以及对应于各个步骤所涉及的典型方法. 针对核心模块, 即特征提取与分类器选择, 进行方法总结与理论解释. 最后, 对癫痫自动检测研究领域的未来研究方向进行展望.

彭睿旻, 江军, 匡光涛, 杜浩, 伍冬睿, 邵剑波. 基于EEG的癫痫自动检测: 综述与展望. 自动化学报, 2021.

癫痫(Epilepsy)是影响全年龄人群的一种由脑部神经元阵发性异常超同步电活动导致的慢性非传染性疾病, 也是全球最常见的神经系统疾病之一. 由于大脑异常电活动的起始位置和传播方式存在差异, 癫痫临床表现呈现多样化、复杂化的特点. 反复癫痫发作会对患者的精神与认知功能造成持续性的负面影响, 甚至危及生命. 因此, 癫痫诊断和治疗的研究具有非常重要的临床意义.

1964年, 国际抗癫痫联盟首次提出了癫痫发作分类方案, 并于1969年对其增订. 该方案指出, 根据发作时癫痫患者的脑电图表现, 可将癫痫疾病的发作定义成五类亚型, 并明确了发作状态(Ictal)、发作间状态(Inter-ictal)的头皮脑电图特征和患者的临床表现具有同等诊断意义.

脑电图(Electroencephalogram, EEG)是放置于头皮特定位置的电极采集获得的大脑内同步神经元活动产生的微伏级电信号. EEG作为最常用、最经济的非侵入式脑电波检测手段, 已有70余年的研究历史, 是癫痫相关疾病诊断最有效的方法, 例如对癫痫发病进行识别、预测和病灶定位等.

为了克服传统诊断手段的局限性、提高医疗效率, 基于EEG的癫痫自动检测已成为行业研究热点. 癫痫自动检测可细分为两个任务: 癫痫发作事件检测(Seizure Event Detection, SED)和癫痫发作检测(Seizure Onset Detection, SOD). SED目的是从多个EEG中尽可能准确地识别癫痫发作信号, SOD目的是在连续脑电监测过程中, 当患者癫痫发作时, 系统能以尽可能短的延时(Latency)识别发作的开始, 并描述持续时间.

临床上脑电的识读与分析主要依赖医疗工作者的视觉检测与手工标注, 这也是目前基于EEG的癫痫检测金标准. 但是癫痫的发作时间和时长具有不确定性, 从海量的脑电数据中读取发病期数据从而分析病情工作繁琐, 且极大依赖检查者主观判断. 因此, 为了克服传统诊断手段的局限性、提高医疗效率, 从1982年Gotman提出基于EEG的癫痫自动识别方法起, 已积累了大量SED相关研究.

同时, 在癫痫治疗过程中, 对抗癫痫药物治疗无效的患者需要采取手术治疗, 需要准确识别手术切除的致痫灶. 致痫灶分为始发区、激惹灶、致痫病变区与功能缺失区, 其中始发区是最有效的标志区, 被看作是致痫灶的替代指标. 临床上可通过在癫痫起始发作时, 使用不同类型的示踪剂来判断始发区位置. SOD也因此具有重要的临床意义. Grewal和Gotman设计了一种可根据用户自身数据调节参数的癫痫发作监测系统, 使得系统的敏感度达到89.7%, 平均时延17.1秒. Kharbouch等对用户敏感方法进行了特征提取的改进并使得系统在80%的被试数据上敏感度达到100%, 时延控制在3.25-18.5秒. Sorensen等则提出了一种基于匹配追踪算法的SOD方法使得分类敏感度达到78%-100%, 延时控制在5-18秒. 近年来, 高采样率设备逐渐普及, 研究者们发现80Hz以上的癫痫脑电中存在的高频振荡节律(High Frequency Oscillation)也可作为一种新的始发区指示标志.

无论SED还是SOD, 癫痫自动检测的核心是对癫痫波的检测. 1972年, Stevens等首次尝试从长时程EEG信号中提取痫样棘波. 此后, 根据痫样棘波的特性, 人们提出了基于形态学、信号相关性、子带分解、特征工程等的棘波检测算法, 对癫痫脑电信号进行自动检测. 近年来, 随着人工智能的不断发展, 特别是机器学习与数据挖掘领域成果的不断积累, 基于机器学习的癫痫自动检测方案大量涌现. 这类能够从数据中学习分类规则, 并能随着数据的扩充而提高性能的自动化算法, 是极具潜力的癫痫自动检测解决方案. 该研究课题也因其理论背景和应用价值, 引起了来自生物、医学、认知和计算机科学等众多领域研究者的广泛兴趣.

癫痫自动检测的核心问题可以归纳为特征提取和分类器设计两个子问题. 其中, 深度学习通过神经网络将特征提取与分类器设计融为一体. 本文将从特征提取和分类器选择的角度比较癫痫自动检测中各个方法的优缺点, 并结合该领域目前所面临的挑战, 对未来研究方向进行展望, 以期为该领域研究提供有益参考.

1. 癫痫自动检测流程

本节详细介绍癫痫自动检测流程, 如图1所示. 该流程通常包括四个步骤: 信号采集、信号预处理、特征提取、分类模型学习与评估. 下面将对此四步进行逐一介绍.

1.1 数据采集与输入

癫痫发作状态的脑电图异常主要表现为棘波、尖波、棘慢波、尖慢波散发或出现各种节律等. 棘波是EEG信号中痫样放电的典型特征之一, 表现为由皮质表面定向引起的表面负偏斜、上升支和下降支陡峭、整体形状如同荆棘的尖刺, 是大脑皮层神经细胞异常放电在EEG信号中引起的波形变化. 棘波周期通常为20-70ms, 突出于背景信号, 幅度大于20uV, 为背景信号1.5倍以上. 因此, 临床上通常选择提取癫痫发作期的痫样棘波和尖波, 并通过定量分析获取癫痫相关的病理信息.

从采集方式可将EEG信号分为颅内EEG和头皮EEG两类. 其中颅内EEG是通过颅骨钻孔或开颅手术等, 将条形或网状电极安置在脑硬膜外并记录不同部位的脑电活动信号. 头皮EEG则是利用脑电帽在人体头皮的固定位置安置电极并记录脑电活动信号. 通过上述方法采集的EEG信号可作为癫痫自动检测的输入信号.

目前研究中, 一部分研究数据来自于医院的非公开患者数据, 大部分则采用公开数据集. 表1列出了目前癫痫自动识别相关研究中常见的数据集.

1.2 数据预处理

原始的EEG信号具有很强的非平稳性和动态性, 且头皮EEG本身幅值较小, 采集程序会受到50Hz或60Hz的工频信号影响. 此外癫痫发作中伴随着意识丧失和肢体动作, 采集过程中极易受到外界不可控因素干扰, 因此头皮EEG往往具有一定的随机性. 为了后续对脑电信号的特征进行研究分析, 首先需要在不丢失有效信息的前提下, 从原始脑电信号中剔除伪迹, 提高信噪比, 以降低分类错误率. 主要的方法包括:

阈值初筛: EEG信号的特征取值, 如振幅、等效曲线下面积等, 超过一定的阈值时, 此信号被认为是异常；
专家特征: 常见的伪迹包括眼电伪迹、肌电伪迹、电极移位、散发伪迹以及弥漫性快速尖锐的alpha波等. 可利用专家经验对典型的干扰波特征进行筛选, 从而除去相应的伪迹.
滤波等信号处理: 脑电的有效信息大多集中于1-60Hz之间, 因此带通滤波是一种常见的EEG信号预处理方法. Oikonomou等提出一种基于卡尔曼滤波的方法, 在预处理阶段增强EEG信号的信噪比, 从而提高棘波检出率. 但由于伪迹频段也部分重叠于目标信号, 单纯的滤波无法完全消除伪迹, 因此亦可使用独立成分分析和主成分分析等方法计算经小波分解的EEG信号组分中的伪迹信号和脑电信号的混合矩阵, 从而实现信噪分离. 此外, 半波处理也是常见的信号处理方法, 能够对EEG信号中存在的尖峰和毛刺进行平滑.

1.3 特征提取与选择

通过对信号进行分析, 提取出有效的特征作为分类依据, 是实现癫痫自动检测的重要步骤. 合理、典型的癫痫EEG特征能够全面地表征EEG的信号模式, 同时有效地描述发作和正常等各种状态下EEG信号的区别, 突出棘波与背景信号的差异, 从而帮助分类模型对癫痫的发作进行有效甄别. 特征的好坏严重影响最终的分类性能.

一般来说, 用于癫痫检测的特征可分为以下四类: 针对序列波形和序列互相关性等的时域特征, 以功率谱密度为代表的对信号能量进行刻画的频域特征, 利用时频变换方法将原始EEG信号转换而成的时频域特征, 以及基于非线性分析的样本熵(Sample entropy)、排列熵(Permutation entropy)、Hurst参数和高阶谱分析等衡量信号不确定性的非线性特征.

特征矩阵可再经奇异值分解、主成分分析、独立成分分析和相关性分析等方法进行特征重新映射提取, 达到降低特征维度的目的. 进行特征选择时, 单因素方差分析(Analysis of variance, ANOVA)是最常用的手段. Ong等提出的布谷鸟搜索算法(cuckoo search algorithm)能够对经过小波分解后的信号分量特征进行特征选择, 使最终分类准确度提高到98.43-100%.

1.4 分类模型学习与评估

根据癫痫的脑电特征, 选择有效的分类模型进行学习和评估是癫痫自动检测的核心. 常见的分类模型可按分类判断依据划分为统计分析和机器学习两种类型.

对于统计分析模型, 除了直接指定信号特征的阈值判断发作状态外, 也包括分布检验、相关性分析等方法. 通过对待测信号进行形态学分析、时频分析等, 比较待测信号和模板癫痫发作信号对应特征的数量、分布、相关性等差异, 实现癫痫自动检测.

随着人工智能的发展, 机器学习模型被广泛用于癫痫自动检测, 包括对手工提取的特征直接分类的传统机器学习、基于神经网络的深度学习、克服脑电个体差异的迁移学习、融合多个特征视图的多视图学习、融合多个基分类器的集成学习、以及优化标注样本的主动学习等.

2. 癫痫自动检测中的特征

本节将基于线性和非线性分析, 讨论基于EEG的癫痫信号分析中使用最广泛的4类手工提取的特征及其计算方式.

时域特征是在EEG信号处理中最基础的特征, 主要是通过直接对原始信号的观察计算提取出相应的特征. 其优势在于计算简捷, 便于研究者直观理解. 但由于EEG信号本身的非平稳性, 个体差异和外界干扰等都容易影响时域特征.

频域特征的依据来自于癫痫发作时EEG的能量发生明显变化, 但依然以背景EEG是近似平稳的为假设. 大部分频域特征都来自于对信号功率谱的特征研究, 在进行谱特征提取时可采用多种参数估计方法, 参数的准确度也影响频域特征的质量.

若考虑特征所包含的信息量, 单纯的时域特征或频域特征都不能完备地对一段EEG信号进行刻画, 并且基于平稳性假设的EEG分析也并不严谨. 因此研究者便将目光投向了时频分析方法, 通过时频变换等手段将非平稳的EEG信号重新表示并提取相应特征.

随着神经科学的发展, 许多研究也将大脑看作一个非线性系统, 并从对系统的复杂度、持久性和同步性等变化的描述中总结了相应的非线性特征. 这些特征不受到EEG信号非平稳性的影响, 同时在应对多通道关联和通道缺失等问题时也更加灵活.

表2总结了近年来癫痫自动检测问题中涉及的四类特征及对应的参考文献.

2.1 时域特征

Katz分形维数能够表现一段时间序列的复杂程度, 因此能够作为癫痫自动识别的潜在特征. 曲线弧长(Curve length, CL)作为Katz分形维数的估计量, 通过计算相邻采样点之间的差异来反映信号的复杂度.

非线性能量算子(Nonlinear energy, NE)是一种对信号进行能量测度的方法, 凸显信号的高频部分, 同时抑制低频部分. 通过对采样点的非线性能量算子取平均, 可得到EEG信号片段的非线性能量算子.

直接对原始EEG信号进行计算, 可获得振幅的均方根(Root mean squared amplitude, RMSAmp)、极值的出现次数(Number of local maxima and minima)、过零率(Zero crossing rate)等特征. 其中, 对于离散信号而言, 在连续函数背景下的导数概念被差分替代, 因此研究中一般通过设定阈值的方法近似0值.

峰度(Kurtosis, kurt)与偏态(Skewness, skew)是衡量数据分布情况的特征. 其中峰度表现分布的平坦程度, 偏态表现分布的对称程度, 若均值大于中位数则为右偏态, 反之为左偏态.

在许多EEG研究中都用到了Hjorth特征, 其中包括活动性、移动性和复杂度三个参数. 直观上, 这3个量分别从振幅、斜率与斜率变化率的角度描述了EEG信号在时域上的特点, 被广泛应用. 对于长时EEG信号片段可取Hjorth参数的最大值、均值和方差作为特征.

此外, 由于EEG也广泛被用于情感计算、心理相关疾病研究、认知负荷评估等问题中, 现有的癫痫自动检测问题也借鉴了应用于上述研究领域的特征, 如能量(Power, P)、均值(Mean)、一阶差分(1st difference)及其标准化形式(Normalized 1st difference)、二阶差分(2nd difference)及其标准化形式(Normalized 2nd difference).

2.2 频域特征

频域中最常用来刻画能量特征的物理量为功率谱密度(Power spectral density, PSD). 图2为Bonn数据集A(正常)、C(发作间期)、E(发作期)子集各第一个样本的功率谱密度示例. 发作时EEG的PSD与其他状态有明显差异, 因此PSD是癫痫自动检测问题中经典的频域特征.

一般利用数据窗将信号切分为具有m个采样点的N个片段, 并计算对应的周期图, 利用平均周期图估计信号的功率谱.

此外, Gotman等将峰值频率(Peak frequency)和主频峰值带(Band width)用于对新生儿的癫痫发作检测. 利用Zibrandtsen等提出的频谱边缘频率(Spectral edge frequency, SEF)特征, 可以求出不同频率范围下对应的SEF(一般取总频谱功率80%、90%、95%之外的边缘频率), 同理利用PSD求出该对应频率范围的频谱总功率(Total spectral power, TSP). 对每一子带的PSD, 可提取均值、方差和熵等参数作为频域特征.

2.3 时频域特征

仅从时域或频域提取特征并不能全面表征癫痫问题中EEG的全部特性, 且EEG本质上并不能看作近似平稳的信号. 因此一些研究通过时频变换得到EEG信号新的表示形式并提取相应特征, 进行癫痫自动检测.

将原始EEG信号转化成时频域表示有多种方法, 例如短时傅里叶变换(Short time Fourier transform, STFT)、小波变换(Wavelet transform, WT)、经验模态分解(Empirical mode decomposition, EMD)、希尔伯特-黄变换(Hilbert-Huang transform, HHT)、平均振幅谱(Mean amplitude spectrum, MAS)等. 图3展示了Bonn数据集A(正常)、E(发作期)子集各第一个样本脑电经db4小波分解后得到的各个子波分量. 其中原始EEG信号由红色表示, 各个子波分量如蓝色所示. 发作期脑电的各个小波分量的振幅、频率等都与正常状态脑电有较为明显的差异.

经离散小波变换(Discrete wavelet transform, DWT)得到的子带信号中, 可以提取对应频带小波系数的均值、方差、极值、均方根、递归能量效率(Recursive energy efficiency, REE)、模糊近似熵等特征, 以实现癫痫发作自动检测. 经EMD分解后得到若干个本征模态函数(Intrinsic mode function, IMF), 采用IMF的绝对值、能量、平均频率、互信息能够得到相应的时频域特征. 对IMF进行HHT可获得其瞬时频率, 其均值与方差能够用以表征时频信息.

2.4 非线性特征(Nonlinear Analysis)

熵(Entropy, En)是能够表征脑电复杂度的物理量. 研究表现发作期脑电的不确定度会明显降低, 因此围绕与熵有关的特征提取有大量的研究. 例如, Fisher信息(Fisher information, FI)、谱熵(Spectral entropy, SpEn)、香农熵(Shannon's entropy, ShEn)、近似熵(Approximate entropy, ApEn)等.

此外, 样本熵(Sample Entropy)和排列熵(Permutation entropy)等也可作为特征. 图4为Bonn数据集A(正常)、C(发作间期)、E(发作期)子集各第一个样本的样本熵示例.

Hurst参数(Hurst exponent, HE)是一种衡量时间序列随机性的指标. 一般来说, 未发作阶段EEG信号更具有随机性, 发作期由于具有典型棘慢波, 序列的局部趋势性越强, Hurst指数更接近1. 与之类似, 去趋势波动指标通过对局部趋势进行拟合并计算信号与之的RMS, 也能表征信号的随机性. 由于发作期神经元同步放电, 通道间的同步性特征也被用于癫痫自动检测研究, 如Lyaounov指数(Lyapunov exponent)的差异性、最大互相关指数等.

3. 癫痫自动检测的分类模型

本节讨论基于EEG的癫痫自动检测中常见的统计分析模型和机器学习模型. 表3总结了近年研究中用到的机器学习分类方法与对应结果.

3.1 统计分析

统计分析模型可对待测信号的特征统计量或与模板信号之间的分布差异、相关性等设定阈值, 实现棘波检测. Li等利用Kullback-Leibler测度衡量EEG信号时频分析的Choi-Williams分布(CWD)差异, 再经奇异值分解并结合阈值分析, 达到超过90%的棘波检测正确率. Huan等通过瞬时频率的时频分析获得离散CWD, 使用相关性分析计算待测EEG信号离散CWD的高频部分和基本棘波的中心瞬时频谱之间的相关系数, 实现棘波检测. Huan等通过计算统一尺度下离散CWD的频谱差变化并与阈值比对, 实现89.5%棘/尖波检出率. Yadav利用形态学分析(Morphology Analysis), 统计尖峰斜率和尖峰间隔时间, 与设定阈值对应比较实现棘波检测, 在线检测误报率为0.1/h, 平均时延9.1s.

统计分析模型进行分类时, 模型的判断依据计算简单、易于理解和实现. 其缺陷在于: 1. 判别严重依赖专业化的参数设置或参与比对的模板信号, 而EEG信号个体差异显著且具有非平稳性, 使得这类模型的通用性受限; 2. 专家特征往往是实际物理量, 这类模型无法处理特征之间的隐关系以及隐藏的深度特征，使得模型的准确性受限.

3.2 传统机器学习

常用传统机器学习模型包括支持向量机(Support vector machine, SVM)、线性判别分析(Linear discriminant analysis, LDA)、朴素贝叶斯(Naive Bayes, NB)、逻辑回归(Logistic regression, LR)、随机森林(Random forest, RF)等. Li等利用双重密度离散小波变换并提取各个分量的非线性特征, 并使用ANOVA选择Hurst参数、模糊熵等作为分类特征, 采用SVM进行分类. Reddy等计算可调Q因子小波变换所得小波分量的中心相关熵, 并采用RF、LR、多层感知机等模型进行癫痫信号识别. Jaiswal和Banka提出了局部梯度模式转换的特征提取方法, 并采用K近邻、SVM、决策树等分类方法进行癫痫检测.

传统机器学习模型的优势在于模型的复杂度低、可解释性强, 但需要研究人员对癫痫的生理机理和临床表现有深入理解. 由于依赖专家经验, 深层特征不易被观察和提取, 因此模型准确性受限. 此外, 若对被测信号提取特征的过程耗时过长, 实际场景中模型效率受影响.

3.3 深度学习

随着深度学习近年来在图像、语音、文本等领域的迅猛发展, 深度神经网络(Deep neural network, DNN)模型在癫痫自动检测中也逐渐得到应用. 提取深度特征可消除对手工特征的依赖, 且在处理多通道数据时相较于传统模型有显著优势.

常用的基于EEG的深度学习癫痫自动检测方法包括3类:

卷积神经网络模型(Convolutional neural network, CNN);
循环神经网络模型(Recurrent neural network, RNN);
自编码器模型(Autoencoders, AE).

CNN类模型通过池化和卷积提取输入数据的特征. 根据模型输入数据的维度数分为1D-CNN和2D-CNN两种机制. 其中2D-CNN一般将原始EEG信号通过时频变换等方式转换成2维图像信号并利用CNN实现癫痫自动检测. 例如, Avcu等提出的seizureNet通过傅里叶变换将原始信号转换成时频图再利用卷积层学习实现癫痫自动检测. Covert等提出时间图网络算法将原始EEG信号转换成时间图并利用5种不同层数的CNN网络实现癫痫自动检测. Li等同时提取信号的多尺度时、频域特征, 将压缩-激励网络(Squeeze-and-Excitation Networks, SENet)嵌入CNN模型, 实现自动检测, 在癫痫发作事件检测和癫痫发作期检测的实验中, 都取得了很高的准确率和敏感性. Thodoroff 等将原始EEG信号利用快速傅里叶变换和电极采样位置的2维投影合成并进行三次样条插值, 得到的平滑图像后利用循环卷积神经网络(Recurrent CNN, RCNN)实现自动检测, 获得了极高的敏感性和较低的误报率. Bizopoulos等使用LeNet、AlexNet、VGGNet、ResNet、DenseNet作为检测模型对图像化的EEG信号进行癫痫自动检测. 1D-CNN适合直接对EEG信号进行处理, 具有相对于2D-CNN更直观的网络结构, 且更小的运算符代价. 同时, 将原始EEG信号转化为时频图像可能带来一定的信息损失, 因此1D-CNN能够更大程度的利用数据信息. 常见思路是将原始信号按照时间窗切分后以一维形式输入CNN网络.

针对音频、视频等随时间变化的数据, 常用的深度学习模型为RNN, 以长短时记忆(Long-Short term memory, LSTM)与门控循环单元(Gated recurrent unit, GRU)结构为主. LSTM解决了模型学习之前时间对当前时间数据信息的影响, 和反向传播时梯度消失的问题. Chen等利用3层LSTM网络进行特征提取后通过sigmoid函数分类, 得到96.82%的准确率. GRU是LSTM的变体, 将LSTM中的输入门和遗忘门合并为更新门, 降低了LSTM模型的复杂度. Roy 等设计了5层GRU网络ChronoNet, 通过softmax函数分类得到92.84%的正确率.

AE是一种无监督深度学习结构, 通过对原始数据的降维表示实现分类. AE包含编码器和解码器两个部分. 编码器可将高维的输入数据降维, 并得到与输入数据对应的隐藏层表示. 隐藏层表示重新通过解码器恢复为原始维度, 从而实现对原始输入的重构. Sharathappriyaa等首先使用Harmonic波包变换, 再将子带信号进行特征提取并使用AE进行癫痫诊断. Rajaguru等利用多层自编码器和期望最大化主成分分析方法确定输入数据的重新表示, 再利用遗传算法分类, 实现93.78%的癫痫检测正确率.

相较于传统机器学习模型, 深度学习模型可学习无法手工提取的深度特征或模式, 以此提升最终分类效果. 同时, 深度学习模型融合了传统模型中特征提取与分类两步, 在训练数据足够的情况下能取得更好的学习效果, 且节省检测时间. 然而, 深度学习模型往往依赖大量数据, 否则容易因参数过拟合影响模型泛化性能.

3.4 迁移学习

上述癫痫自动检测模型是基于训练数据与测试数据具有相同数据特征分布的假设. 但EEG信号个体差异显著, 实际应用中, 测试数据和模型的训练数据往往不服从独立同分布假设, 因此克服个体差异的通用癫痫自动检测模型更有实际价值. 迁移学习\cite{tflearning}是利用相关域的标注数据或知识结构, 完成或改进对目标域的学习的机器学习模型. 对于通用的癫痫自动检测模型, 用于训练模型的数据和实际测试数据可能来自于不同的个体, 其信号的分布或存在较大的差异, 且训练数据量受限, 因而可通过迁移学习模型提高癫痫自动检测模型的泛化性能和正确率. 如何进行有效迁移以提高模型泛化性能是迁移学习考虑的重点.

基于手工提取的特征, Yang等提出利用特征空间内大间隔直推式迁移学习的LMPROJ方法最小化训练数据与目标数据手工提取的特征之间的分布均值差, 实现EEG信号自适应识别, 分类准确率超过93%, 显著优于传统机器学习. Jiang等把测试数据和训练数据的最大均值差异融合到TSK模糊系统模型中, 对原始EEG信号通过小波包变换、STFT和核主成分分析等得到的手工特征进行分类, 检测正确率相比于无迁移学习有大幅提升.

深度学习和迁移学习也可融合，进行深度迁移学习. Zhang等对VGG16、VGG19和ResNet50三种CNN网络参数进行迁移, 并将原始EEG信号通过时频变换转换为时频图, 在跨用户的癫痫自动检测实验中平均准确率超过96%. Zhu等引入迁移学习中的元学习(Meta learning), 在模型层面上通过记忆增强相关结构使模型通过少量样本快速学习, 同时改进距离矩阵的运算, 再通过经预训练的基学习器和元学习器, 不断优化参数实现稳定分类.

3.5 多视图学习

多视图学习基于视图一致性和互补原则, 利用多个不同视图之间的差异性和相似性, 提高模型分类精度. 多视图学习包括协同训练、多核学习和子空间学习等类别. 协同训练通过对不同视图执行交替训练, 最大化视图一致性; 多核学习通过使用不同的内核训练模型并关联到不同的视图, 再通过内核的线性或非线性组合提高学习性能; 子空间学习则通过获得多个视图的公共子空间, 提高数据一致性. 如何最大化视图间的信息互补和对应模型的一致性是多视图学习的难点.

在癫痫自动检测中, Tian等利用CNN模型提取EEG信号的时域、频域和时频域深度特征, 并构建为三个视图, 通过多视图TSK模糊系统进行多视图学习, 提升了相较于单一视图的分类检测效果. Yuan等通过通道感知技术, 利用AE提取多通道EEG信号的通道特征和通道内的时频特征两类视图, 实现多视图癫痫自动检测. Liu等利用用户敏感模型进行通道选择, 再针对选择的通道各个子频段提取时频特征构成多视图特征. 通过公共空间投影矩阵提取数值和形态学特征, 并利用最大平均差异自编码器提取通道间时频域特征, 实现多视图的癫痫自动检测.

3.6 集成学习

集成学习模将多个基分类器(弱分类器)集合成强分类器以提高分类效果, 主要包括Bagging、Boosting和Stacking三种学习策略. Bagging随机改变训练集的分布而产生多个训练子集, 对应训练多个基学习器再进行集成．Boosting在弱学习器的基础上, 增大上一轮被错误分类的样本的权重并训练新模型, 最终组成强学习器．Stacking首先训练多个不同的基学习器, 再把其输出作为输入训练一个新的分类模型. 集成学习的难点是如何同时提高基学习器的准确性和多样性.

在癫痫自动检测中, Hosseini等对手工提取的特征进行了子空间划分, 并使用基于Bagging的集成学习模型实现癫痫自动检测. Abualsaud等通过压缩感知对原始EEG信号进行重构, 再使用Stacking融合多个传统机器学习模型实现癫痫发作期分类. Akyol使用多个DNN基学习器分别对原始EEG输入信号进行学习, 然后将其分类结果输入下一层的元学习器进行Stacking融合, 达到较好的分类性能.

3.7 主动学习

主动学习从大量无标注样本中选择最用的样本进行标注, 从而可以通过更少的标注样本达到要求的分类效果. 主动学习很适合癫痫检测, 因为EEG信号很容易获取, 但在实际训练癫痫检测模型时, 为信号打标签非常费时乏味, 给医生带来很大负担, 而主动学习可有效缓解这一问题. 主动学习的核心在于如何选择对构建分类模型最有用的样本.

在癫痫自动检测中, Chen等提出了double-DNN模型, 主DNN模型运用最小置信度估计样本不确定性, 副DNN模型根据主DNN模型的输出计算样本的误分类代价, 并通过欧式距离估计候选样本与已知样本的差异程度确定样本的多样性, 结合上述三个指标选择最有用的EEG样本进行标注. Ramachandran等对EEG手工特征进行分类, 对于超过阈值的样本通过基于伯努利-高斯混合模型的主动学习模型重新确定其不确定度, 进而不断优化分类模型, 提高模型对分类边界处样本的感知能力.

4. 结论与展望

癫痫自动检测, 即自动识别癫痫的发作状态, 能够大幅减轻医疗工作者负担, 并降低医生主观判断病情的不确定性. 鉴于EEG是一种低成本、易获取且无创的临床生理信号, 基于EEG的癫痫自动检测是提高癫痫检测、治疗效率的有效手段. 本文首先系统地阐述了基于EEG的癫痫自动检测流程, 并对其各个步骤中所涉及到的具体方法进行了详细、全面的调研和总结. 其中特征提取与分类器是该流程的核心模块, 因此本文对典型的脑电特征和常用分类器进行了详细的描述.

根据上述调研与分析, 结合基于EEG的癫痫自动检测实际应用场景需求, 本文从以下几个方面对该领域今后的研究方向进行展望:

使用传统机器学习方法时, 提取出有效的分类特征是癫痫检测的关键. 通过传统方法进行癫痫发作检测目前已经能够达到较高的检出水平, 但如何区分癫痫亚型疾病、如何区别发作期与发作间期以实现对癫痫疾病的预测, 仍然是值得探讨的问题.
当前的癫痫自动检测效果主要受限于现有的公开数据集数量和质量. 很多研究是在非公开数据集上进行的, 这也导致其模型的可靠度与可重复性大大降低. 因此, 建立大型的高质量癫痫EEG数据集是非常有必要的, 有助于公平、透明地对比不同检测模型的效果.
近年来兴起的迁移学习方法可以通过由源域向目标域迁移, 利用更多源域数据, 提高分类性能, 为提高单一数据来源的癫痫自动检测模型鲁棒性提供新的解决思路.
对于不同类别的癫痫疾病识别也需进一步探索. 首先, 医学研究显示, 某些类型的癫痫会导致特定的肢体动作和肌肉活动, 与此相关的伪迹信号应该如何剔除值得深入研究. 其次, 如何设计高效的分类模型进行多类癫痫识别，并提高不同类型癫痫间的区分能力具有相当大的临床意义, 特别是对于医疗资源欠发达地区而言.
随着可穿戴设备的不断发展, 除了现有针对EEG信号的特征提取外, 其他生理特征的融合也具有相当的研究价值. 既往研究显示血氧饱和度(Blood oxygen saturation, SpO2)与癫痫发作的终止有关. 将诸如此类的其他特征指标与EEG结合, 并运用多视图等机器学习方法进行癫痫自动检测, 有望进一步提高检测准确度.
近年随着深度学习的迅猛发展, 大量基于深度学习的自动检测方法被广泛地应用于癫痫自动检测, 并取得了良好效果. 但该类方法也存在许多挑战. 第一, 深度学习往往依赖于大量数据, 但实际研究中受限于数据集, 很难获得大量的训练样本, 这对于模型的准确性和鲁棒性都会造成较大影响. 第二, 现有的公开数据集几乎都是EEG信号片段, 与实际场景中连续实时信号存在差异, 在解决实际问题时, 利用EEG片段信号训练的神经网络模型可能并不能很好地适应现实数据. 最后, 由于实际使用中计算资源受限, 轻量级的神经网络模型将会更实用.

论文信息

彭睿旻, 江军, 匡光涛, 杜浩, 伍冬睿, 邵剑波. 基于EEG的癫痫自动检测: 综述与展望. 自动化学报, 2021.