前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI通过面部识别和语音识别预估抑郁症的严重程度

AI通过面部识别和语音识别预估抑郁症的严重程度

作者头像
AiTechYun
发布2019-05-13 14:28:07
1.7K0
发布2019-05-13 14:28:07
举报
文章被收录于专栏:ATYUN订阅号ATYUN订阅号

用AI进行情绪识别是目前较为热门的领域,像Beyond Verbal,Affectiva和Cogito等初创公司正在利用自然语言处理从声音中检测情绪唤起。但现在有一种观点认为,单凭言语无法诊断抑郁症,更不用说判断其严重程度了。

印度理工学院巴特那大学和卡昂诺曼底大学科学家的新论文“The Verbal and Non Verbal Signals of Depression — Combining Acoustics, Text and Visuals for Estimating Depression Level”,探讨非语言标志和视觉可以大大提高对抑郁水平的估计。

抑郁症和精神疾病不断增加,这样的研究可以推动更先进,个性化和自动化技术发展,抑郁症检测是一个具有挑战性的问题,因为它的许多症状都是隐蔽的。

研究人员对七种模式进行了编码,包括头部向下倾斜、眼睛凝视、微笑的持续时间和强度、自我触摸以及文字和语言暗示,它们被输入到机器学习模型,将它们融合成向量。

然后,将这些融合的载体传递到第二个系统,该系统基于个人健康问卷抑郁量表(PHQ-8)预测抑郁的严重程度,PHQ-8是一种常用于大型临床心理学研究的诊断测试。

为了训练各种系统,研究人员选择了AIC-WOZ,这是一个抑郁症数据集,包含注释的音频片段,录像和189个临床访谈的问卷回答,支持对焦虑、抑郁和创伤后应激障碍等心理状况的诊断。

每个样本都包含大量数据,包括原始音频文件,以及受访者的68个面部坐标文件(带有时间戳,置信度分数和检测成功标志),两个文件都含有参与者的头部姿势和眼睛注视特征,谈话记录文件等。

在几个预处理步骤和模型训练之后,团队使用三个指标比较AI系统的结果:均方根误差(RMSE),平均绝对误差(MAE)和可解释的方差分数(EVS)。

报告说,声学,文本和视觉这三种方式的融合有助于给出最准确的抑郁水平估计,在RMSE上表现优于现有技术7.17%,在MAE上表现超出现有技术8.08%。

未来,他们计划研究多任务学习架构,并深入挖掘文本数据的新颖表示。如果这一研究取得成果,那么对于现阶段患有抑郁症的3亿多人来说,这将是一个充满希望的方向。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ATYUN订阅号 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档