李飞飞新作:用AI检测抑郁症,准确率已超80%

文丨拾柒

【项目应用场景】

医疗

【望潮科技测评】

没有经历过抑郁症的人,并不能体会到它的可怕。

当前,抑郁症已经成为全球第四大疾病,预计2020年将成为第二大疾病。不少名人都曾陷入过抑郁症的痛苦,如白岩松、崔永元等,也有不堪病痛而自杀的。

然而,针对抑郁症的诊前预测和诊后监控,现阶段都处于薄弱环节,主要原因还在于心理医生和精神病医生难以做到诊前精准预测和诊后有效追踪。

AI在检测方面的天然优势,让其在医学界的研究及应用越来越多样化。此前,已经有研究者将AI应用于检测抑郁症上,且正确率已经达到七成。

但,今天并不是想要介绍这一技术,而是曾经说过“AI没有国界,AI的福祉亦无边界”的李飞飞老师亲自参与的一篇论文。

图:斯坦福大学教授、斯坦福大学人工智能实验室与视觉实验室负责人李飞飞

在这篇论文当中,李飞飞及其团队瞄准了AI诊断抑郁症这个方向,结合语音识别、计算机视觉及自然语言处理技术,通过表情和语音诊断一个人是否患了抑郁症。

当前,这项研究初见成效,诊断抑郁症的机器模型准确度已经达到了83.3%。并且,该模型还可以部署到手机上,从而能够让更多的人方便诊断抑郁症,不用再受到没钱、没时间等困扰。

模型构建原理

在整体方案中,李飞飞团队选择的是先在模型中输入3D面部关键点视频、患者说话的音频,以及转成文字的访谈录音这三种数据。之后,输出健康问卷(PHQ, Patient Health Questionnaire)评分或抑郁症分类标签,就能得出此人是否患了抑郁症。

图:对应面部视频、音频、访谈录音三种数据

为什么输入视频、音频、访谈录音这三种数据,就可以得出此人是否患有抑郁症?

原因在于,在目前的抑郁症诊断过程中,医生需要和患者面对面聊天,来判断对方是否患病。

其中,需要医生来观察的要素包括:对方是否语调单一,完全不抑扬顿挫;说话音量是否比较低;讲话时手势是不是比正常人少;是不是总爱低头向下看等。

当然,除了医生的观察,还需要通过患者健康问卷来调查了解更详细的信息。

正因如此,用AI来诊断抑郁症,就相当于用机器学习模型来代替那个和患者对话的医生,把患者在医生面前的表现变成数据,输入机器学习模型中。

训练模型全过程

据了解,训练这个模型主要用到的是DAIC-WOZ数据,包括142名患者的健康问卷评分和189次临床访谈、总共50小时的数据。

整个模型,主要由两个部分组成。第一个部分为句子级嵌入式(Sentence-LevelEmbeddings),即整个句子多模态嵌入,可实现捕捉更长时间的声音、视觉和语音元素。

图:多模态句子级嵌入示例

第二个部分,则被称为因果卷积网络(C-CNN, CausalConvolutional Networks)。之所以用该卷积网络,主要原因在于抑郁症患者在说话的时候,会在不同的字词之间停顿更长时间,因此,整个句子的音视频也就比较长。在处理这种长句子上,因果卷积网络要比循环神经网络强。

在整体的实验数据上,相比前人,李飞飞这项新研究数据相对较高。不过,与前人所不同的是,这项新研究并不依赖一些预先做好的访谈记录,所以来的背景资料更少。并且,这项新研究无需特征工程,可以直接用输入原始数据。

最后,值得提的一件事,就是这项研究成果还入选了NIPS NeurIPS 2018医疗健康机器学习(ML4H)Workshop。

— END —

MORE丨黑科技推荐

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181128A197XT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券