原谷歌工程院长张智威清华开讲:研发医疗领域的AlphaGo

量子位 | 若朴 牧北 整理报道

HTC负责研发及医疗的总裁、原Google中国工程院副院长张智威(Edward Y. Chang)博士,周二上午做客清华并发表《研发面向健康的AlphaGo》演讲。

在演讲中,张智威介绍了医疗行业的现状和未来,以及HTC在这一领域的一些研究。

此外,张智威详细讲解了如何利用迁移学习的方法,把人工智能技术应用于疾病检测领域。张智威还对AlphaGo进行了剖析,并围绕如何研发医疗领域的AlphaGo进行了阐述。张智威还介绍了VR技术在医疗领域的应用。

清华大学计算机科学与技术系教授、中国中文信息学会副理事长孙茂松,在演讲开始前对张智威在Google和HTC的工作和学术情况进行了简要的介绍。

以下是张智威此次在清华开讲的视频,总时长大约是50分钟。此外,量子位还把张智威此次演讲的内容,重新整理成易读的文字版本。推荐关注人工智能、医疗、VR等领域的读者,观看或者阅读张智威此次在清华的分享。

现场视频

文字版本

近期医疗及HTC情况简介

医疗的发展,受到成本、品质、普及,三个方面互相牵制。比如成本降低,品质和普及率相应也会降低。品质要做好,成本必然会提升。

成本方面,以发达国家为例,美国公司每年要为员工支付1万美元的医疗保险,46%的美国居民生病了不去医院,而是自己在网上查询。从普及率上来讲,全球还有25亿人没有医疗设备, 非洲医生和病人的比例是1:2000。

品质方面,即使在美国有120万例误诊。所以品质-成本-普及都出现了问题,为什么呢?现在有一种反应式的诊断模型,就是根据你的检查结果推断病情。 现在已经到了医疗行业产生颠覆性创新的时候,这得益于几个重要技术的发展进步。

第一是AI和大数据,第二是移动设备,第三是移动传感器。这三个技术在一起,就会有革命性的颠覆。 基于这些技术,HTC正在进行新的探索。

例如,HTC正试图把医疗诊断从响应式(reactive model),转变为主动式(proactive model)。人体的健康数据,通过手机传入云端,经由分类器判断是否有健康问题的预兆。这些数据也会发送到医院,以确定是否需要进一步的检查。

这个模型的改进之处,首先是有基于云的医疗大数据、AI分析,其次是家中有一些便宜轻便的信息监控设备。HTC正在参加一个与此相关的《Tricoder XPRIZE大赛》,并且已经入围前两名。

这个比赛的挑战目标是推出5磅(4.5斤)以下,能检测15中疾病的便携设备。HTC团队的解决方案,是一个盒子+手机。能诊断中耳炎、黑色素瘤、尿道炎、中风、带状疱疹、贫血、肝病、肺炎、高血压、慢性阻塞性肺疾病等。

如何用AI进行疾病检测

以检测皮肤的黑色素瘤为例。想要解决这个问题,通常需要两类数据集,一类是黑色素瘤,一类是正常的痣。然后把数据丢到支持向量机或者深度学习网络中去学习。

但是我们发现一个问题,在医疗领域并没有大数据,疾病在正常情况下是小数据。以中耳炎为例,我们在台湾的医院里只收集到1000个病例,而且第一年我们还得和医生合作试图找到中耳炎的“特征值”。费劲半天,做出一个准确率80%的分类器。

第二年医生说不给钱就不合作了。怎么办?正好深度学习很火,于是我们就把数据都丢到深度学习网络中,然而,深度学习的结果更差。准确率只有70%。 于是我们就转向使用ImageNet的数据。

你可能会觉得奇怪,中耳炎的这种疾病的数据,跟ImageNet上都是锅碗瓢盆、汽车人脸的一般的数据,两者并没有什么相关性。怎么能用ImageNet帮助疾病诊断呢?

量子位注:此时开始有PPT入画 ?

这是一个CNN(卷积神经网络)的模型,假设我有一亿张照片进来,而且都没有打标签,这时候怎么进行训练?这是个编码的问题。PPT上,左右两边各有一个神经网络,图片丢入左侧的网络进行压缩编码,右边尝试还原图片。

通过原始图片和还原图片的比对,可以建立一个地面实况,这样再多的图片,都可以进行无监督学习。接着就可以进行稀疏编码。经过这样一个过程,一大堆跟中耳炎不相关的数据进行训练,把CodeBook训练出来。

然后再拿1000张中耳炎的图片进行训练。向网络中输入一张中耳炎的图片,跟原来不同的是网络中有了新的特征向量,最后我们的精度提高到91%。

为什么这种迁移学习的方法会有效?

这是吴恩达2009年发布的一个论文, 举这个例子想说明,不管上层的目标语义如何,底层的神经元(可以说是CodeBook)是共通的。所以,用莫名其妙的图片把底层网络训练得很稳定,这时候只需要用1000张中耳炎的图片调整上层网络即可。

为什么这个模式这么有效?到底哪些神经元被开启?当一个病人被诊断为中耳炎的时候,中部和底部被开启的神经元,居然是变形虫、红色的甲虫、红色的丝巾或者红酒,虽然这跟中耳炎看起来不一样,但是表明了患者的耳部有类似的现象。

以前我不是迁移学习的信徒,但是在这个案例里面,低层级的神经元,其实可以从另一个大数据集借鉴过来,这非常有趣。

心律不齐是个常见问题,但是想要构建一个分类器,全世界能用的数据只有两个数据集可用,一个在哈佛,一个在MIT,加起来只有200个病例数据,绝对是小数据。所以我们现在也在尝试建立新的数据集。

那么在语音、音乐方面的学习成果,能不能迁移到心电图领域?但过去两年,我们还没有得到任何的突破成果。希望大家可以继续研究。

复制AlphaGo

问诊,国内春雨医生,国外有几家也在做,我们对这个感兴趣,也是受到AlphaGo启发。AlphaGo的细节不说了,基本上就是两个分类器:策略网络和价值网络。DeepMind最初用6000万盘棋谱训练,但是训练出来的AlphaGo棋力只有一段。

然后AlphaGo开始随机调整策略网络,价值网络也开始尝试奇怪的下法,最终可以说AlphaGo自己跟自己下了无穷多盘围棋。

所以AlphaGo给大家最大启发,不是赢棋,而是如何构建一个智商超过300的机器。

构建的方法无非两件事:一是训练,速度快、可扩展,另外就是无限多的数据。如果能做好这件事,各位都是亿万富翁。最近两年,我们每天都在想,哪些领域可以拿到无限的数据。

Google曾经有一个项目,希望收集到全世界的医疗数据,做大数据的分析。但是最终这个项目失败了,因为隐私和数据太过分散等原因。那个负责人改去做股票,觉得股票有无限多的数据。

回到问诊这个事情上,医生询问之后还会进行化验,这个过程能不能变成在线的问答诊断呢?关键问题是,怎么用最少的问题,了解病人可能的病征。这个方法虽然不能确诊,但可以缩小范围,甚至帮助病人准确的挂号。

接下来就要依靠:CNN+强化学习。强化学习被用来在询问数量和诊断精度之间作一个平衡,目前对100种常见疾病已经做到50%的确诊率。

未来的挑战

其实我们就想在大家不舒服之前,就能诊断出来。这个怎么做呢?从概念上讲非常简单,就是收集很多很多的数据。哈佛列了一下医疗数据可能的来源,这些数据可能是结构化、半结构化、非结构化的,可能来自于医院、保险公司、社交媒体。

如果能收集到这些数据,接下来就是大数据的挑战。

过去的六七年里,我们在大数据算法方面,数据挖掘方面做了很多的工作。其中最难的是支持向量机,最简单的是深度学习。

总结一下,未来的趋势一个是精准医疗,基于大数据,以后每个人治病的用药可能都会不同。 比方说,维生素D每个人吸收的情况不同,有人吃下去是毒药,有些人无效。这些取决于每个人DNA的不同。但是仍然收集数据是最难的。

还有一个是精准手术,这个可以跟VR结合,提高脑部肿瘤手术的效率和精度。对于新技术, 有医院A的大夫说,如果当初有VR设备帮助,那个病人就不会死。医院B的大夫说,我们都是一流的大夫,用不着这个。

深度学习在这方面也有很多结合。医院C跟我们说,我们收到的病例非常多,能不能做一个AI的系统,帮我们判断病人是否还有救。如果还有希望,我们就收治。但是这个要求,我们不敢承接,就怕万一误判了怎么办。

深度学习最重要的就是快。

一个是训练要非常快。另外就是训练完成后,在手机或者移动设备上进行分类,如果模型太大的话,可能没有办法进行实时诊断。

快有很多方式,但深度学习基本上只有几件事。比方说全连接网络,就是在做相乘,这个是前向网络;后向网络也一样,就是矩阵相乘。所以瓶颈就在稠密矩阵相乘、卷积还有其他运算等等。也有很多可以进行优化的方法。

以及

在结束近一个小时的分享之后,张智威还在现场进行了半个小时的问答。张智威回答的问题包括如下几个方面:

提问:结构化医疗数据的采集的意义?

提问:少见的疾病,能否借助深度学习?

提问:神经网络如何解决在线问诊?

提问:VR在手术中如何实际应用?

提问:AI未来会取代医生么?

……

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-02-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

热门 | Google Brain前员工深度盘点2017人工智能和深度学习各大动态

翻译 | AI科技大本营 参与 | shawn 编辑 | Donna 2017年是人工智能井喷的一年。Google Brain团队前成员Denny Britz在...

31460
来自专栏京东技术

「仓储网络智能库存管理问题」最好的答案 | GOC大赛

本篇特约全球运筹优化挑战赛-仓储物流智能库存管理赛题冠军 TP_AI队伍分享赛题解析。来自清华大学经管学院的闵旭和来自北京大学人工智能创新中心的马思源因为比赛走...

42720
来自专栏数据猿

【案例】大拇哥财富——互联网金融个人评分模型

数据猿导读 随着互联网技术的不断发展,传统金融业务也从线下不断转移到线上,很多原先在线下的金融机构开始在互联网上开展经营活动。由于线上和线下的经营方式的差异,在...

39460
来自专栏BestSDK

IBM识别癌变细胞技术取得重大突破,用深度学习与神经网络重塑病理学

医生在诊断癌变细胞时,主要通过用活组织切片检查法分析病人组织样本的方式。然而即使这些组织有时如针头般微小,病理学家需要从中检测出肿瘤细胞消失的种种迹象,也要观测...

34450
来自专栏人工智能快报

利用深度学习加速癌症研究

美国橡树岭国家实验室(ORNL)发布消息称,深度学习技术已被用于加速癌症研究。 尽管近几十年来在检测和治疗方面取得了稳步进展,癌症仍然是美国的第二大死亡原因,每...

36660
来自专栏DT数据侠

当空间数据遇上机器学习,城市的颜值有了新的度量方法

每个人都生活在一定的空间,城市的各项公共服务设施也需要占据一定的空间。通过对这些空间数据的挖掘和分析,我们能够比以往更科学、更清晰地观察我们所在的城市。9月27...

9400
来自专栏PPV课数据科学社区

2017人工智能与机器学习年终盘点(重要工具资源汇总)

2017年是人工智能技术全面开火、勇猛精进的一年,也是对未来全球科技和经济影响深远的一年。 无论人工智能圈子内外的从业者,都开始正视这个可能会很快改变所有人命...

44190
来自专栏玉树芝兰

“啤酒尿布”模型管用,说不清因果又怎样?

一个模型,可以准确做分类预测。而且反复在新的、没有训练的数据上尝试过,好用,那不就好了?

7910
来自专栏新智元

黄仁勋GTC主旨演讲:从摩尔定律的尽头到深度学习大爆炸,发布新一代GPU,市值突破700亿美元( PPT)

【新智元导读】英伟达CEO黄仁勋一年一度的GTC主旨演讲凌晨结束,新智元第一时间带来了深度报道(带PPT的)。本次大会最受关注的是,英伟达发布了新一代的GPU,...

368100
来自专栏量子位

建模数据科学家的福音:MIT系特征自动构造工具今日发布

Root 编译整理自TechCrunch & Feature Labs 量子位 报道 | 公众号 QbitAI 建模数据科学家的活难度很大。 得洞察big da...

45050

扫码关注云+社区

领取腾讯云代金券