李飞飞新论文「AI医生」诊断抑郁症,准确率超过80%,可移植到手机端

郭一璞 假装发自 斯坦福 量子位 报道 | 公众号 QbitAI

在全世界范围内,有超过3亿人患有抑郁症。其中的60%的人都没有接受任何治疗。

我们时有听到名人患抑郁症甚至严重到自杀的消息,却不知周围一些普通人身在病中不知病。

面对这一病症,AI能做些什么?

曾经说过“AI没有国界,AI的福祉亦无边界”的李飞飞老师这次要为那些怀疑自己患抑郁症的人创造福祉了,这次她和团队瞄准了AI诊断抑郁症这个方向:

结合语音识别计算机视觉自然语言处理技术,通过表情和语言诊断一个人是否患了抑郁症

目前,这项研究初见成效,诊断抑郁症的机器学习模型目前precision达到83.3%,recall达到82.6%

并且,这个模型可以部署到手机上,让更多人能方便的诊断抑郁症,不再受困于“没钱”、“没时间”、“别人知道我去查抑郁症会怎么议论我”的阻挠之中。

另外,这项研究成果还入选了 NIPS NeurIPS 2018医疗健康机器学习(ML4H)Workshop。

下面,量子位为大家详细介绍李飞飞这篇新作品的具体内容。

为什么用表情和语言能诊断抑郁症?

因为医生就是这么干的。

在目前的抑郁症诊断过程中,医生需要和患者面对面聊天,来判断对方是否患病。

需要医生来观察的要素包括:

对方是否语调单一,完全不抑扬顿挫;

说话音量是否比较低;

讲话时手势是不是比正常人少;

是不是总爱低头向下看;

……

另外,还需要通过患者健康问卷(PHQ, Patient Health Questionnaire)来调查来了解更详细的信息。

用AI来诊断抑郁症,就相当于用机器学习模型来代替那个和患者对话的医生,把患者在医生面前的表现变成数据,输入机器学习模型中。

因此,李飞飞团队采用的方案是先模型中输入3D面部关键点视频患者说话的音频转成文字的访谈录音三种数据,分别对应下图中的abc三行。

之后,输出PHQ评分或抑郁症分类标签,就能得出此人是否患了抑郁症。

训练模型全过程

训练这个模型用到的是DAIC-WOZ数据集,包括142名患者的PHQ评分和189次临床访谈、总共50小时的数据。

整个模型由两个部分组成。

第一个部分叫句子级嵌入(Sentence-Level Embeddings)。

以往的嵌入方式都是嵌入一个音节或单词,只能捕捉几百毫秒的时间。李飞飞团队用的是整个句子多模态嵌入,可以实现捕捉更长时间的声音、视觉和语言元素。

下图就是多模态句子级嵌入的示例:

第二个部分叫因果卷积网络(C-CNN, Causal Convolutional Networks)。

之所以用因果卷积网络,是因为抑郁症患者说话慢。

相比普通人,抑郁症患者说话的时候会在不同的字词之间停顿更长时间,因此整个句子的音视频也就比较长。处理这种长句子的时候,因果卷积网络要比RNN强。

效果如何

我们来看一下实验结果。

其中,A是指输入数据为音频,V是指输入数据为视频,L是指输入数据为文本。

对比前人的实验结果,李飞飞的这项新研究数据上相对较高。不过,与前人不同的是,这项新研究并不依赖一些预先做好的访谈记录,所以来的背景资料更少。并且,这项新研究无需特征工程,可以直接用输入原始数据。

这张实验结果表格对比了使用不同嵌入方式的结果。其中,前两行是手工嵌入,第3~6行是预训练嵌入,最后两行是我们用到的句子级嵌入,输入的是log-mel光谱图、3D面部关键点视频和Word2Vecs的序列。

传送门

论文: Measuring Depression Symptom Severity from Spoken Language and 3D Facial Expressions Albert Haque, Michelle Guo, Adam S Miner, Li Fei-Fei https://arxiv.org/abs/1811.08592

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-11-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

图灵奖得主Judea Pearl:机器学习无法成为强AI基础,突破口在“因果革命”

来源:arXiv 编辑:新智元编辑部 【新智元导读】图灵奖得主、贝叶斯网络之父Judea Pearl日前在arXiv上传了他的最新论文,论述当前机器学习理论局限...

46411
来自专栏量子位

谷歌AI绘制大脑神经地图,开源代码帮你理清混乱的脑回路

1404
来自专栏人工智能快报

科学家使用深度学习研制生物医药

美国伊利诺伊大学香槟分校与加利福尼亚大学洛杉矶分校合作开发了一款新的用于医学研究的机器学习系统。 目前约有1100种已知的可以穿透微生物膜的具有不同序列的抗菌肽...

27411
来自专栏人工智能快报

麻省理工研制出硅基人工神经突触

为制造出便携式的“大脑芯片”,麻省理工学院的科研人员用单晶硅成功制作出了人工神经突触,这大大促进了人造硬件的发展。 当谈到处理能力时,人类的大脑是无法被击败的。...

37115
来自专栏机器之心

前沿 | 视网膜眼底图像预测心脏病风险:Nature综述深度学习在生物医疗中的新应用

3367
来自专栏新智元

谷歌开源DeepVariant,之前的经典检测基因变异法将被颠覆

来源:research.googleblog.com 编译:马文 【新智元导读】今天,谷歌开源了DeepVariant深度学习模型,这是将基因组中的识别变异(v...

3516
来自专栏人工智能

五类受自然启发的AI算法

摘要:本文主要讲解了受自然启发的五类AI算法以及各自的实际用例:神经网络、遗传算法、群集集体智慧、强化学习、人体免疫。 ? 搜索/寻路算法 搜索算法本质上是一个...

22010
来自专栏人工智能快报

深度学习能使细胞和基因图像更加清晰

卷积神经网络的深度学习使计算机更加有效、全面的处理图像,生物学领域正在逐渐运用这一技术,它能使细胞、基因等图像更加清晰,使机器看到更多人类从未见过的东西。 眼睛...

3885
来自专栏ATYUN订阅号

AI研究新突破:利用神经网络预测新的化合物

佛罗里达州立大学的一个研究小组开发了一种AI系统,用来识别数十万个假想的晶体结构中的哪一个可以预测新的化合物。

1033
来自专栏思影科技

脑电时域复杂度可以评估抑郁症的电休克、磁休克疗法的疗效和认知副作用

最近,来自加拿大成瘾与心理健康中心的Faranak Farzan 等人在Brain杂志上发表了一篇文章,通过研究表明脑电信号的时域复杂度可以用来衡量在抑郁症治疗...

2974

扫码关注云+社区

领取腾讯云代金券