原谷歌工程院长张智威清华开讲：研发医疗领域的AlphaGo

量子位

发布于 2018-03-21 15:53:00

7740

发布于 2018-03-21 15:53:00

文章被收录于专栏：量子位

量子位 | 若朴牧北整理报道

HTC负责研发及医疗的总裁、原Google中国工程院副院长张智威(Edward Y. Chang)博士，周二上午做客清华并发表《研发面向健康的AlphaGo》演讲。

在演讲中，张智威介绍了医疗行业的现状和未来，以及HTC在这一领域的一些研究。

此外，张智威详细讲解了如何利用迁移学习的方法，把人工智能技术应用于疾病检测领域。张智威还对AlphaGo进行了剖析，并围绕如何研发医疗领域的AlphaGo进行了阐述。张智威还介绍了VR技术在医疗领域的应用。

清华大学计算机科学与技术系教授、中国中文信息学会副理事长孙茂松，在演讲开始前对张智威在Google和HTC的工作和学术情况进行了简要的介绍。

以下是张智威此次在清华开讲的视频，总时长大约是50分钟。此外，量子位还把张智威此次演讲的内容，重新整理成易读的文字版本。推荐关注人工智能、医疗、VR等领域的读者，观看或者阅读张智威此次在清华的分享。

现场视频

文字版本

近期医疗及HTC情况简介

医疗的发展，受到成本、品质、普及，三个方面互相牵制。比如成本降低，品质和普及率相应也会降低。品质要做好，成本必然会提升。

成本方面，以发达国家为例，美国公司每年要为员工支付1万美元的医疗保险，46%的美国居民生病了不去医院，而是自己在网上查询。从普及率上来讲，全球还有25亿人没有医疗设备，非洲医生和病人的比例是1:2000。

品质方面，即使在美国有120万例误诊。所以品质-成本-普及都出现了问题，为什么呢？现在有一种反应式的诊断模型，就是根据你的检查结果推断病情。现在已经到了医疗行业产生颠覆性创新的时候，这得益于几个重要技术的发展进步。

第一是AI和大数据，第二是移动设备，第三是移动传感器。这三个技术在一起，就会有革命性的颠覆。基于这些技术，HTC正在进行新的探索。

例如，HTC正试图把医疗诊断从响应式(reactive model)，转变为主动式(proactive model)。人体的健康数据，通过手机传入云端，经由分类器判断是否有健康问题的预兆。这些数据也会发送到医院，以确定是否需要进一步的检查。

这个模型的改进之处，首先是有基于云的医疗大数据、AI分析，其次是家中有一些便宜轻便的信息监控设备。HTC正在参加一个与此相关的《Tricoder XPRIZE大赛》，并且已经入围前两名。

这个比赛的挑战目标是推出5磅(4.5斤)以下，能检测15中疾病的便携设备。HTC团队的解决方案，是一个盒子+手机。能诊断中耳炎、黑色素瘤、尿道炎、中风、带状疱疹、贫血、肝病、肺炎、高血压、慢性阻塞性肺疾病等。

如何用AI进行疾病检测

以检测皮肤的黑色素瘤为例。想要解决这个问题，通常需要两类数据集，一类是黑色素瘤，一类是正常的痣。然后把数据丢到支持向量机或者深度学习网络中去学习。

但是我们发现一个问题，在医疗领域并没有大数据，疾病在正常情况下是小数据。以中耳炎为例，我们在中国台湾的医院里只收集到1000个病例，而且第一年我们还得和医生合作试图找到中耳炎的“特征值”。费劲半天，做出一个准确率80%的分类器。

第二年医生说不给钱就不合作了。怎么办？正好深度学习很火，于是我们就把数据都丢到深度学习网络中，然而，深度学习的结果更差。准确率只有70%。于是我们就转向使用ImageNet的数据。

你可能会觉得奇怪，中耳炎的这种疾病的数据，跟ImageNet上都是锅碗瓢盆、汽车人脸的一般的数据，两者并没有什么相关性。怎么能用ImageNet帮助疾病诊断呢？

量子位注：此时开始有PPT入画 ?

这是一个CNN（卷积神经网络）的模型，假设我有一亿张照片进来，而且都没有打标签，这时候怎么进行训练？这是个编码的问题。PPT上，左右两边各有一个神经网络，图片丢入左侧的网络进行压缩编码，右边尝试还原图片。

通过原始图片和还原图片的比对，可以建立一个地面实况，这样再多的图片，都可以进行无监督学习。接着就可以进行稀疏编码。经过这样一个过程，一大堆跟中耳炎不相关的数据进行训练，把CodeBook训练出来。

然后再拿1000张中耳炎的图片进行训练。向网络中输入一张中耳炎的图片，跟原来不同的是网络中有了新的特征向量，最后我们的精度提高到91%。

为什么这种迁移学习的方法会有效？

这是吴恩达2009年发布的一个论文，举这个例子想说明，不管上层的目标语义如何，底层的神经元(可以说是CodeBook)是共通的。所以，用莫名其妙的图片把底层网络训练得很稳定，这时候只需要用1000张中耳炎的图片调整上层网络即可。

为什么这个模式这么有效？到底哪些神经元被开启？当一个病人被诊断为中耳炎的时候，中部和底部被开启的神经元，居然是变形虫、红色的甲虫、红色的丝巾或者红酒，虽然这跟中耳炎看起来不一样，但是表明了患者的耳部有类似的现象。

以前我不是迁移学习的信徒，但是在这个案例里面，低层级的神经元，其实可以从另一个大数据集借鉴过来，这非常有趣。

心律不齐是个常见问题，但是想要构建一个分类器，全世界能用的数据只有两个数据集可用，一个在哈佛，一个在MIT，加起来只有200个病例数据，绝对是小数据。所以我们现在也在尝试建立新的数据集。

那么在语音、音乐方面的学习成果，能不能迁移到心电图领域？但过去两年，我们还没有得到任何的突破成果。希望大家可以继续研究。

复制AlphaGo

问诊，国内春雨医生，国外有几家也在做，我们对这个感兴趣，也是受到AlphaGo启发。AlphaGo的细节不说了，基本上就是两个分类器：策略网络和价值网络。DeepMind最初用6000万盘棋谱训练，但是训练出来的AlphaGo棋力只有一段。

然后AlphaGo开始随机调整策略网络，价值网络也开始尝试奇怪的下法，最终可以说AlphaGo自己跟自己下了无穷多盘围棋。

所以AlphaGo给大家最大启发，不是赢棋，而是如何构建一个智商超过300的机器。

构建的方法无非两件事：一是训练，速度快、可扩展，另外就是无限多的数据。如果能做好这件事，各位都是亿万富翁。最近两年，我们每天都在想，哪些领域可以拿到无限的数据。

Google曾经有一个项目，希望收集到全世界的医疗数据，做大数据的分析。但是最终这个项目失败了，因为隐私和数据太过分散等原因。那个负责人改去做股票，觉得股票有无限多的数据。

回到问诊这个事情上，医生询问之后还会进行化验，这个过程能不能变成在线的问答诊断呢？关键问题是，怎么用最少的问题，了解病人可能的病征。这个方法虽然不能确诊，但可以缩小范围，甚至帮助病人准确的挂号。

接下来就要依靠：CNN+强化学习。强化学习被用来在询问数量和诊断精度之间作一个平衡，目前对100种常见疾病已经做到50%的确诊率。

未来的挑战

其实我们就想在大家不舒服之前，就能诊断出来。这个怎么做呢？从概念上讲非常简单，就是收集很多很多的数据。哈佛列了一下医疗数据可能的来源，这些数据可能是结构化、半结构化、非结构化的，可能来自于医院、保险公司、社交媒体。

如果能收集到这些数据，接下来就是大数据的挑战。

过去的六七年里，我们在大数据算法方面，数据挖掘方面做了很多的工作。其中最难的是支持向量机，最简单的是深度学习。

总结一下，未来的趋势一个是精准医疗，基于大数据，以后每个人治病的用药可能都会不同。比方说，维生素D每个人吸收的情况不同，有人吃下去是毒药，有些人无效。这些取决于每个人DNA的不同。但是仍然收集数据是最难的。

还有一个是精准手术，这个可以跟VR结合，提高脑部肿瘤手术的效率和精度。对于新技术，有医院A的大夫说，如果当初有VR设备帮助，那个病人就不会死。医院B的大夫说，我们都是一流的大夫，用不着这个。

深度学习在这方面也有很多结合。医院C跟我们说，我们收到的病例非常多，能不能做一个AI的系统，帮我们判断病人是否还有救。如果还有希望，我们就收治。但是这个要求，我们不敢承接，就怕万一误判了怎么办。

深度学习最重要的就是快。

一个是训练要非常快。另外就是训练完成后，在手机或者移动设备上进行分类，如果模型太大的话，可能没有办法进行实时诊断。

快有很多方式，但深度学习基本上只有几件事。比方说全连接网络，就是在做相乘，这个是前向网络；后向网络也一样，就是矩阵相乘。所以瓶颈就在稠密矩阵相乘、卷积还有其他运算等等。也有很多可以进行优化的方法。

以及

在结束近一个小时的分享之后，张智威还在现场进行了半个小时的问答。张智威回答的问题包括如下几个方面：

提问：结构化医疗数据的采集的意义？

提问：少见的疾病，能否借助深度学习？

提问：神经网络如何解决在线问诊？

提问：VR在手术中如何实际应用？

提问：AI未来会取代医生么？

……

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-02-23，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自量子位微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度