邓侃解读谷歌首篇电子病历论文:完整披露谷歌医疗大脑野心

作者:邓侃

【新智元导读】上周,谷歌公布了首篇电子病历相关论文,由Jeff Dean率队联合众多大牛和顶级医学院完成。然而,不少业内人士,包括康奈尔大学副教授王飞博士都认为该论文质量一般。但是,本文作者,大数医达创始人、CMU博士邓侃指出,这篇论文的意义在于完整地披露了Google Medical Brain项目的目标、方法、规划和进展,并且为“深度学习在医疗领域的应用”定义了一套标准。正所谓“三流企业做产品,二流企业做服务,一流企业做标准”,做AI跟着谷歌老大哥走不会错,而现在谷歌既已公开了这套标准,动作快跑在前面还可能赢!因此,这篇论文,还得细细研读。

上周,2018年1月24日,Google Brain 大神 Jeff Dean,率领另外 30 余号人,联名发表了一篇论文,题为 “Scalable and accurate deep learning for electronic health records”,业界反响热烈

反响热烈的原因,大致有以下几条,

1. Google Brain 大神 Jeff Dean 亲自出马,可见此文重要性很高。

2. 这是谷歌医疗大脑项目组的第一篇论文。

3. 论文联名作者,很可能涵盖了谷歌医疗大脑(Google Medical Brain)项目组的主要成员。其中包括 Claire Cui,她是 Larry Page 斯坦福师妹,不仅在谷歌资历深,而且职位很高,是 Google Brain 的中枢人物。

但是,这篇论文的争议也不少。总结来看:

1. 这篇论文的实验结果,不是特别抢眼。

2. 与传统算法的对比实验,不够完整。只对比了最基本的传统算法,没有对比改进版传统算法。

3. 超过 20 万 GPU 小时,深度学习算法的计算成本太高。

4. 总共只收集了 21.6 万条住院病历数据,训练数据量太小。

但是,有一点可能被不少人忽视了:这篇论文实际上把 Google Medical Brain 项目的目标、方法、规划和目前进展,介绍得相当完整。

个人理解,这篇论文的重点,正是在于介绍 Google Medical Brain 项目的目标、方法和规划。至于目前已经取得的阶段性成绩,并不是评判这篇论文的唯一着眼点。

关键意义:给出 Google Brain 版深度学习医疗标准

Google Medical Brain 这篇论文,定义了以下几个问题。

1. 定义了深度学习医疗要解决的问题:预测三个方面指标,

  1. 治疗疗效,譬如在院死亡率,和计划外的复诊率;
  2. 医疗成本,譬如住院天数;
  3. 诊断精度,譬如出院诊断。

2. 定义了深度学习医疗的基本方法:Google Medical Brain 摈弃了人工智能医疗的传统方法,不再从医学文献中整理权威的临床规则,而是转移到从海量病历中整理实际的临床经验。换句话说,改传统的演绎法为经验归纳法。

  1. 收集海量病历;
  2. 把每一个病历转换成一条临床路径时间序列;
  3. 用深度学习算法,预测时间序列。包括用病情描述,预测疾病诊断,预测死亡率。用病情描述加治疗方案,预测复诊率和住院天数等等。

3. 定义了预测精度的评估指标:评估指标用 AUROC,而不是用 F1。

4. 总结了传统的预测方法:明确定义了治疗疗效、医疗成本、和诊断精度,这三类指标,传统方法用哪些因子和公式来预测。

5. 规定了整合多源异构病历数据的标准:沿用开源的 FHIR 标准。

6. 提出了一种解释深度学习结果的可视化方法:把病历展开为可视化的时间轴,高亮对预测有显著作用的重要因子,以此来解释深度学习在预测时,更看重哪些因子。虽然“看重”不能严谨地表达预测的全部逻辑,但能解释局部逻辑,总比没有强。

7. 提出了几种处理临床路径时间序列的深度学习算法:其中,个人感觉,an attention-based time-aware neural network model (TANN),最值得深入研究。

AI“带头大哥”谷歌已经公布自己的标准,掉队还是超越看你选择

三流企业做产品,二流企业做服务,一流企业做标准。

在人工智能领域,谷歌是实际的标准制订者之一。

在人工智能医疗领域,最值得关注的,是谷歌旗下两个部门的工作,一个是 Google Medical Brain,另一个是 Google DeepMind。

DeepMind 打败所有人类围棋高手以后,转场去研究人工智能家庭医生。以英国为例,家庭医生从业人数不足,人力成本高昂,临床水平参差不齐。但迄今为止,DeepMind 没有完整地披露人工智能家庭医生项目的目标、方法、规划。

因此,谷歌大脑这首篇电子病历论文的意义在于,不仅完整地披露了 Google Medical Brain 项目的目标、方法、规划和进展,还实际上给 “深度学习在医疗领域的应用”,定义了一套标准。

跟着带头大哥走就好了,别掉队。

走快点,跑起来,跑到前面去了,就赢了。

参考文献:

Scalable and accurate deep learning for electronic health records:https://arxiv.org/pdf/1801.07860.pdf

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-02-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

VR如何巧妙填补传统数据视觉化的漏洞

1824
来自专栏机器之心

NIPS大会最精彩一日:AlphaZero遭受质疑;史上第一场正式辩论与LeCun激情抗辩;元学习&强化学习亮点复盘

37610
来自专栏新智元

MIT非视线成像“透视相机”:隔墙观物、影中窥人!

2012年,MIT计算机视觉科学家安东尼奥·托拉尔巴(Antonio Torralba)在西班牙海岸度假时,发现他酒店房间墙壁上的杂散阴影似乎不是由任何东西投射...

1475
来自专栏专知

AI与深度学习重点回顾:Denny Britz眼中的2017

【导读】近日,博客WILDML的作者Denny Britz把他眼中的2017年AI和深度学习的大事进行了一番梳理和总结:从AlphaGo的自主学习到AlphaG...

3555
来自专栏PPV课数据科学社区

批评文:大数据,大安利

最近在社会上刮起一阵大数据的不正之风,本科生也敢拿着几个G的硬盘声称这些数据能解决某某疑难问题,让人联想起存满硬盘黄片的处男说这家伙老爽了。 虽然在社会科学领域...

2988
来自专栏人工智能头条

【无人驾驶技术系列】光学雷达(LiDAR)在无人驾驶技术中的应用

3055
来自专栏量子位

能把晦涩难懂的研究工作讲清楚,Distill就奖你10000美刀

Root 编译整理 量子位 出品 | 公众号 QbitAI 在机器学习研究圈里,大家可能都有这样的赶脚: 大部分从事机器学习研究的人,不太擅长写作,无法清晰地呈...

3256
来自专栏大数据文摘

机器也有品味:谷歌最新算法让街景图具有专业摄影师审美

1572
来自专栏量子位

NIPS风波 | 获奖者登台开炮:ML是炼金术,大神LeCun强硬回怼

夏乙 问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 谁能想到,NIPS这种顶会都能风波乍起。 Ali Rahimi(阿里·拉希米),因为2007年...

3047
来自专栏专知

机器学习是“炼金术”?

1676

扫码关注云+社区

领取腾讯云代金券