前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >原谷歌工程院长张智威清华开讲:研发医疗领域的AlphaGo

原谷歌工程院长张智威清华开讲:研发医疗领域的AlphaGo

作者头像
量子位
发布2018-03-21 15:53:00
7370
发布2018-03-21 15:53:00
举报
文章被收录于专栏:量子位量子位
量子位 | 若朴 牧北 整理报道

HTC负责研发及医疗的总裁、原Google中国工程院副院长张智威(Edward Y. Chang)博士,周二上午做客清华并发表《研发面向健康的AlphaGo》演讲。

在演讲中,张智威介绍了医疗行业的现状和未来,以及HTC在这一领域的一些研究。

此外,张智威详细讲解了如何利用迁移学习的方法,把人工智能技术应用于疾病检测领域。张智威还对AlphaGo进行了剖析,并围绕如何研发医疗领域的AlphaGo进行了阐述。张智威还介绍了VR技术在医疗领域的应用。

清华大学计算机科学与技术系教授、中国中文信息学会副理事长孙茂松,在演讲开始前对张智威在Google和HTC的工作和学术情况进行了简要的介绍。

以下是张智威此次在清华开讲的视频,总时长大约是50分钟。此外,量子位还把张智威此次演讲的内容,重新整理成易读的文字版本。推荐关注人工智能、医疗、VR等领域的读者,观看或者阅读张智威此次在清华的分享。

现场视频

文字版本

近期医疗及HTC情况简介

医疗的发展,受到成本、品质、普及,三个方面互相牵制。比如成本降低,品质和普及率相应也会降低。品质要做好,成本必然会提升。

成本方面,以发达国家为例,美国公司每年要为员工支付1万美元的医疗保险,46%的美国居民生病了不去医院,而是自己在网上查询。从普及率上来讲,全球还有25亿人没有医疗设备, 非洲医生和病人的比例是1:2000。

品质方面,即使在美国有120万例误诊。所以品质-成本-普及都出现了问题,为什么呢?现在有一种反应式的诊断模型,就是根据你的检查结果推断病情。 现在已经到了医疗行业产生颠覆性创新的时候,这得益于几个重要技术的发展进步。

第一是AI和大数据,第二是移动设备,第三是移动传感器。这三个技术在一起,就会有革命性的颠覆。 基于这些技术,HTC正在进行新的探索。

例如,HTC正试图把医疗诊断从响应式(reactive model),转变为主动式(proactive model)。人体的健康数据,通过手机传入云端,经由分类器判断是否有健康问题的预兆。这些数据也会发送到医院,以确定是否需要进一步的检查。

这个模型的改进之处,首先是有基于云的医疗大数据、AI分析,其次是家中有一些便宜轻便的信息监控设备。HTC正在参加一个与此相关的《Tricoder XPRIZE大赛》,并且已经入围前两名。

这个比赛的挑战目标是推出5磅(4.5斤)以下,能检测15中疾病的便携设备。HTC团队的解决方案,是一个盒子+手机。能诊断中耳炎、黑色素瘤、尿道炎、中风、带状疱疹、贫血、肝病、肺炎、高血压、慢性阻塞性肺疾病等。

如何用AI进行疾病检测

以检测皮肤的黑色素瘤为例。想要解决这个问题,通常需要两类数据集,一类是黑色素瘤,一类是正常的痣。然后把数据丢到支持向量机或者深度学习网络中去学习。

但是我们发现一个问题,在医疗领域并没有大数据,疾病在正常情况下是小数据。以中耳炎为例,我们在中国台湾的医院里只收集到1000个病例,而且第一年我们还得和医生合作试图找到中耳炎的“特征值”。费劲半天,做出一个准确率80%的分类器。

第二年医生说不给钱就不合作了。怎么办?正好深度学习很火,于是我们就把数据都丢到深度学习网络中,然而,深度学习的结果更差。准确率只有70%。 于是我们就转向使用ImageNet的数据。

你可能会觉得奇怪,中耳炎的这种疾病的数据,跟ImageNet上都是锅碗瓢盆、汽车人脸的一般的数据,两者并没有什么相关性。怎么能用ImageNet帮助疾病诊断呢?

量子位注:此时开始有PPT入画 ?

这是一个CNN(卷积神经网络)的模型,假设我有一亿张照片进来,而且都没有打标签,这时候怎么进行训练?这是个编码的问题。PPT上,左右两边各有一个神经网络,图片丢入左侧的网络进行压缩编码,右边尝试还原图片。

通过原始图片和还原图片的比对,可以建立一个地面实况,这样再多的图片,都可以进行无监督学习。接着就可以进行稀疏编码。经过这样一个过程,一大堆跟中耳炎不相关的数据进行训练,把CodeBook训练出来。

然后再拿1000张中耳炎的图片进行训练。向网络中输入一张中耳炎的图片,跟原来不同的是网络中有了新的特征向量,最后我们的精度提高到91%。

为什么这种迁移学习的方法会有效?

这是吴恩达2009年发布的一个论文, 举这个例子想说明,不管上层的目标语义如何,底层的神经元(可以说是CodeBook)是共通的。所以,用莫名其妙的图片把底层网络训练得很稳定,这时候只需要用1000张中耳炎的图片调整上层网络即可。

为什么这个模式这么有效?到底哪些神经元被开启?当一个病人被诊断为中耳炎的时候,中部和底部被开启的神经元,居然是变形虫、红色的甲虫、红色的丝巾或者红酒,虽然这跟中耳炎看起来不一样,但是表明了患者的耳部有类似的现象。

以前我不是迁移学习的信徒,但是在这个案例里面,低层级的神经元,其实可以从另一个大数据集借鉴过来,这非常有趣。

心律不齐是个常见问题,但是想要构建一个分类器,全世界能用的数据只有两个数据集可用,一个在哈佛,一个在MIT,加起来只有200个病例数据,绝对是小数据。所以我们现在也在尝试建立新的数据集。

那么在语音、音乐方面的学习成果,能不能迁移到心电图领域?但过去两年,我们还没有得到任何的突破成果。希望大家可以继续研究。

复制AlphaGo

问诊,国内春雨医生,国外有几家也在做,我们对这个感兴趣,也是受到AlphaGo启发。AlphaGo的细节不说了,基本上就是两个分类器:策略网络和价值网络。DeepMind最初用6000万盘棋谱训练,但是训练出来的AlphaGo棋力只有一段。

然后AlphaGo开始随机调整策略网络,价值网络也开始尝试奇怪的下法,最终可以说AlphaGo自己跟自己下了无穷多盘围棋。

所以AlphaGo给大家最大启发,不是赢棋,而是如何构建一个智商超过300的机器。

构建的方法无非两件事:一是训练,速度快、可扩展,另外就是无限多的数据。如果能做好这件事,各位都是亿万富翁。最近两年,我们每天都在想,哪些领域可以拿到无限的数据。

Google曾经有一个项目,希望收集到全世界的医疗数据,做大数据的分析。但是最终这个项目失败了,因为隐私和数据太过分散等原因。那个负责人改去做股票,觉得股票有无限多的数据。

回到问诊这个事情上,医生询问之后还会进行化验,这个过程能不能变成在线的问答诊断呢?关键问题是,怎么用最少的问题,了解病人可能的病征。这个方法虽然不能确诊,但可以缩小范围,甚至帮助病人准确的挂号。

接下来就要依靠:CNN+强化学习。强化学习被用来在询问数量和诊断精度之间作一个平衡,目前对100种常见疾病已经做到50%的确诊率。

未来的挑战

其实我们就想在大家不舒服之前,就能诊断出来。这个怎么做呢?从概念上讲非常简单,就是收集很多很多的数据。哈佛列了一下医疗数据可能的来源,这些数据可能是结构化、半结构化、非结构化的,可能来自于医院、保险公司、社交媒体。

如果能收集到这些数据,接下来就是大数据的挑战。

过去的六七年里,我们在大数据算法方面,数据挖掘方面做了很多的工作。其中最难的是支持向量机,最简单的是深度学习。

总结一下,未来的趋势一个是精准医疗,基于大数据,以后每个人治病的用药可能都会不同。 比方说,维生素D每个人吸收的情况不同,有人吃下去是毒药,有些人无效。这些取决于每个人DNA的不同。但是仍然收集数据是最难的。

还有一个是精准手术,这个可以跟VR结合,提高脑部肿瘤手术的效率和精度。对于新技术, 有医院A的大夫说,如果当初有VR设备帮助,那个病人就不会死。医院B的大夫说,我们都是一流的大夫,用不着这个。

深度学习在这方面也有很多结合。医院C跟我们说,我们收到的病例非常多,能不能做一个AI的系统,帮我们判断病人是否还有救。如果还有希望,我们就收治。但是这个要求,我们不敢承接,就怕万一误判了怎么办。

深度学习最重要的就是快。

一个是训练要非常快。另外就是训练完成后,在手机或者移动设备上进行分类,如果模型太大的话,可能没有办法进行实时诊断。

快有很多方式,但深度学习基本上只有几件事。比方说全连接网络,就是在做相乘,这个是前向网络;后向网络也一样,就是矩阵相乘。所以瓶颈就在稠密矩阵相乘、卷积还有其他运算等等。也有很多可以进行优化的方法。

以及

在结束近一个小时的分享之后,张智威还在现场进行了半个小时的问答。张智威回答的问题包括如下几个方面:

提问:结构化医疗数据的采集的意义?

提问:少见的疾病,能否借助深度学习?

提问:神经网络如何解决在线问诊?

提问:VR在手术中如何实际应用?

提问:AI未来会取代医生么?

……

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-02-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 现场视频
  • 文字版本
  • 近期医疗及HTC情况简介
  • 如何用AI进行疾病检测
  • 复制AlphaGo
  • 未来的挑战
    • 以及
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档