邓侃解读谷歌首篇电子病历论文:完整披露谷歌医疗大脑野心

新智元专栏

作者:邓侃

【新智元导读】上周,谷歌公布了首篇电子病历相关论文,由Jeff Dean率队联合众多大牛和顶级医学院完成。然而,不少业内人士,包括

康奈尔大学副教授王飞博士

都认为该论文质量一般。但是,本文作者,大数医达创始人、CMU博士邓侃指出,这篇论文的意义在于完整地披露了Google Medical Brain项目的目标、方法、规划和进展,并且为“深度学习在医疗领域的应用”定义了一套标准。正所谓“三流企业做产品,二流企业做服务,一流企业做标准”,做AI跟着谷歌老大哥走不会错,而现在谷歌既已公开了这套标准,动作快跑在前面还可能赢!因此,这篇论文,还得细细研读。

上周,2018年1月24日,Google Brain 大神 Jeff Dean,率领另外 30 余号人,联名发表了一篇论文,题为 “Scalable and accurate deep learning for electronic health records”,业界反响热烈。

反响热烈的原因,大致有以下几条,

1. Google Brain 大神 Jeff Dean 亲自出马,可见此文重要性很高。

2. 这是谷歌医疗大脑项目组的第一篇论文。

3. 论文联名作者,很可能涵盖了谷歌医疗大脑(Google Medical Brain)项目组的主要成员。其中包括 Claire Cui,她是 Larry Page 斯坦福师妹,不仅在谷歌资历深,而且职位很高,是 Google Brain 的中枢人物。

但是,这篇论文的争议也不少。总结来看:

1. 这篇论文的实验结果,不是特别抢眼。

2. 与传统算法的对比实验,不够完整。只对比了最基本的传统算法,没有对比改进版传统算法。

3. 超过 20 万 GPU 小时,深度学习算法的计算成本太高。

4. 总共只收集了 21.6 万条住院病历数据,训练数据量太小。

但是,有一点可能被不少人忽视了:这篇论文实际上把 Google Medical Brain 项目的目标、方法、规划和目前进展,介绍得相当完整。

个人理解,这篇论文的重点,正是在于介绍 Google Medical Brain 项目的目标、方法和规划。至于目前已经取得的阶段性成绩,并不是评判这篇论文的唯一着眼点。

关键意义:给出Google Brain 版深度学习医疗标准

Google Medical Brain 这篇论文,定义了以下几个问题。

1. 定义了深度学习医疗要解决的问题:预测三个方面指标,

治疗疗效,譬如在院死亡率,和计划外的复诊率;

医疗成本,譬如住院天数;

诊断精度,譬如出院诊断。

2. 定义了深度学习医疗的基本方法:Google Medical Brain 摈弃了人工智能医疗的传统方法,不再从医学文献中整理权威的临床规则,而是转移到从海量病历中整理实际的临床经验。换句话说,改传统的演绎法为经验归纳法。

收集海量病历;

把每一个病历转换成一条临床路径时间序列;

用深度学习算法,预测时间序列。包括用病情描述,预测疾病诊断,预测死亡率。用病情描述加治疗方案,预测复诊率和住院天数等等。

3. 定义了预测精度的评估指标:评估指标用 AUROC,而不是用 F1。

4. 总结了传统的预测方法:明确定义了治疗疗效、医疗成本、和诊断精度,这三类指标,传统方法用哪些因子和公式来预测。

5. 规定了整合多源异构病历数据的标准:沿用开源的 FHIR 标准。

6. 提出了一种解释深度学习结果的可视化方法:把病历展开为可视化的时间轴,高亮对预测有显著作用的重要因子,以此来解释深度学习在预测时,更看重哪些因子。虽然“看重”不能严谨地表达预测的全部逻辑,但能解释局部逻辑,总比没有强。

7. 提出了几种处理临床路径时间序列的深度学习算法:其中,个人感觉,an attention-based time-aware neural network model (TANN),最值得深入研究。

AI“带头大哥”谷歌已经公布自己的标准,掉队还是超越看你选择

三流企业做产品,二流企业做服务,一流企业做标准。

在人工智能领域,谷歌是实际的标准制订者之一。

在人工智能医疗领域,最值得关注的,是谷歌旗下两个部门的工作,一个是 Google Medical Brain,另一个是 Google DeepMind。

DeepMind 打败所有人类围棋高手以后,转场去研究人工智能家庭医生。以英国为例,家庭医生从业人数不足,人力成本高昂,临床水平参差不齐。但迄今为止,DeepMind 没有完整地披露人工智能家庭医生项目的目标、方法、规划。

因此,谷歌大脑这首篇电子病历论文的意义在于,不仅完整地披露了 Google Medical Brain 项目的目标、方法、规划和进展,还实际上给 “深度学习在医疗领域的应用”,定义了一套标准。

跟着带头大哥走就好了,别掉队。

走快点,跑起来,跑到前面去了,就赢了。

参考文献:

Scalable and accurate deep learning for electronic health records:https://arxiv.org/pdf/1801.07860.pdf

加入社群

新智元AI技术+产业社群招募中,欢迎对AI技术+产业落地感兴趣的同学,加小助手微信号: aiera2015_1 入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名-公司-职位;专业群审核较严,敬请谅解)。

此外,新智元AI技术+产业领域社群(智能汽车、机器学习、深度学习、神经网络等)正在面向正在从事相关领域的工程师及研究人员进行招募。

加入新智元技术社群 共享AI+开放平台

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180204A0CHMT00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励