北京大学王立威教授：AI 医学影像的现状、机遇与挑战

企鹅号小编

发布于 2017-12-29 16:56:27

1.2K0

发布于 2017-12-29 16:56:27

文章被收录于专栏：企鹅号快讯

王立威教授作为首位获得AI's 10 to Watch奖的亚洲学者，同时也是LUNA和天池AI医疗大赛冠军队导师，从人工智能研究者的角度出发，为500多位资深医疗人工智能人士做了120分钟的深度分享和学员互动问答。

王立威教授指出，只满足把自己定位于一个人工智能研究者来看待医学影像问题，将图像识别技术单纯地嫁接到医学影像原有的系统上，即便数字结果看起来不错，但距离“好用的产品”依旧非常遥远。

嘉宾介绍：

王立威：北京大学信息科学技术学院教授

王立威教授在机器学习领域发表论文100余篇，2011年入选人工智能重要国际奖项AI's 10 to Watch，是亚洲首位获得该奖项的学者。2012年获得首届国家自然科学基金优秀青年基金；担任国际人工智能权威会议NIPS，IJCAI领域主席；中国计算机学会人工智能与模式识别专委会常委。

我为什么选择医学影像这条路

重新审视AI这个工具：我眼中的人工智能与机器学习

当前AI医学影像技术的真实现状

实战案例详解：人工智能肺结节检测与良恶性诊断

经验分享：错误、弯路、失败、技巧、解决方法

致AI医学影像领域的工作者：我们应具备哪些素质与技术

未来AI医学影像的机遇与突破点

关于《未来医疗大讲堂—医学影像专题》系列课程的更多介绍，欢迎点击超链接阅读：

《做AI的不懂医学，学医的不懂AI ？顶级”AI+医学影像“系列课程来袭》

以下内容节选自王立威教授课程

为什么选择医学影像这条路？

王立威教授谈到，有三个领域会与深度学习进行紧密的结合，并希望能够选择其中一个方面来进行深入研究：一个是无人驾驶；一个是金融领域；再一个则是医学领域。

他认为，无人驾驶在计算机视觉的识别技术已经趋于成熟，具备可以与机器学习进行深入结合的条件，但作为一个与汽车实体紧密相关的应用方向，在高校内做研究的空间相对受限；此外，驾驶作为一种动态活动，相对于静态图像识别的难度与复杂性要高得多。

而金融领域尽管积累了非常多高质量的封闭数据，但它属于噪声非常大的信号，受突发政策、人为操作的影响较大，并非总是严格遵循客观规律。

AI技术不是金融交易中的核心技术，交易的安全是重中之重。如果只考虑交易频次问题，交易又分为低频和高频，“如果是低频交易，我不认为AI 有太大的用武之地，因为AI 需要大数据、低频交易数据量太小，如果要让AI技术发挥技术，一定是在高频领域。但是现阶段的一个问题是，高频领域有很多分析的工作还是是需要人来做，例如提炼对交易产生影响的因素或者策略。所以综合上述的几个因素，我最后选择了从医学影像入手。”

在这个应用研究的三岔路口上，王立威教授最终选择了医学影像领域。

“医学影像是未来几年之内人工智能影响最深远的领域。”

一方面，医学影像属于静态图像识别，相对于视频的处理技术要更加成熟；另一方面，依托北京大学的一系列附属医院，不论是从数据的获取或是系统的测试落地上，王立威教授所在的北京大学研究团队都有着得天独厚的优势。

王教授表示，如果开发者要执行的任务处于非常封闭的环境，和人的常识没有什么关系，这样的任务非常适合机器来做，但是如果这项任务和常识挂钩，例如对自然语言的理解，对于机器而言难度非常大。“医学影像相对而言是具有一定封闭性的问题。”

当前AI医学影像技术的真实现状

当然，不是说医学影像具有一定的封闭性，AI就能够在医学领域畅行无阻。王立威教授列举了两个AI对医学影像产生重大影像的案例——斯坦福团队在皮肤癌检测以及Google的DeepMind的糖网筛查。

王教授的观点是：

1、医学影像处理病种的数量非常庞大，上述两个团队的例子解决的都是单病种问题。医学影像上一共可以分为两千多个的病种。“解决一个单病种已经不是简单的事情，斯坦福的团队已经和顶级的医学专家研究数年才得到目前的成果，要囊括两千多个病种更是难上加难。此外，病种与病种之间的差异度也很大，所以，AI 医学影像需要顶级医学专家和顶级机器学习学者通力合作才有可能成功。”

2、成像设备的差异会产生多种类型的图像。CT、MRI、X光、超声、内窥镜、病理切片这些图像缺乏一定的标准。“现在我们只是在一些病种上进行单点突破，整个医学影像仍任重道远。”

从技术角度而言，今天的机器学习、人工智能技术对于检测等问题可能做得比较好，但是全局性病变、结构性病变对机器学习还是有难度。

未来几年看谁能胜出，就看谁能选对病种，选错就有可能浪费时间、精力。

肺结节的早期筛查是AI+医学影像的热门领域，但是，肺结节的种类繁多、形态各异、容易与肺内其他组织（例如血管等）混淆。

这些问题也会考验从这个领域切入的创业者，例如肺门区域结节和磨玻璃结节的检测。因此，王教授团队采用了三阶段模型框架来解决这样的问题。

肺门区域结节是非常容易发生错误、漏检的地方，肺门区域结节和其他结构完全连接在一起的特性使得信息难以区分。王教授团队的技术核心是将多尺度信息结合，应用一种特征金字塔网络（FPN）。通过整合多尺度信息，有效地将结节与正常组织、其它病变区分开，精确检测肺门区域结节。

磨玻璃结节也是一个容易漏检的部分，相比而言，磨玻璃结节与其他区域的亮度差异较小。通过引入难例挖掘机制，使得模型更为关注困难样本，提高磨玻璃结节的检测准确度。

在这个问题上，王立威教授的团队使用焦点损失函数(Focal Loss)对磨玻璃难例挖掘进行优化。

在结节临床意义分析方面，王立威教授指出：一个患者的整个肺里只有一个地方有结节，另一个患者有很多结节，虽然有一样的结节，但是对于两个人的意义是不同的。我们通过结合病例内所有结节的全局信息，进行结节临床意义分析与判断，帮助医生关注到更具有临床意义的结节。

“我们希望最后的诊断结果对医生有帮助，我们也必须对临床意义进行分析，最终提交结果。”这里采用了Context Net，避免孤立地看待检测出的结节，而是在全局上判断哪些是有临床意义的，包括利用系统判断结节良恶性的概率值。

在王教授看来，分析不是一个简简单单的目标检测，要考虑到医学的特点。初学者前期会使用通用型的算法，但机器学习有很多细节不是写在代码里的，只有深耕很多年，自己亲自实践才能有更多的领悟。

此外，王立威教授团队在算法延拓方面也取得了一些突破。

“我们在结节属性问题、模型可解释性等方面也有一些成果。结节属性对医生写报告很有帮助，我们可以测量结节直径、体积，给医生一个更直观的感受。在模型的可解释性方面，我们利用前期算法得到的模型，可以检测病变、判断良恶性。但是医生会问，这个模型判断的依据是什么，逻辑是什么，我们不希望这个模型是一个黑箱，从而影响我们使用的信心。”

雷锋网AI掘金志线上直播结束后，王立威教授对部分学员提出的问题进行了解答，以下是选摘的问答实录，雷锋网AI掘金志作了不改变原意的编辑：

问：与医生医院的合作过程中最应该注意哪些问题？

答：第一，一定要互相了解。做AI的技术人员和医生在完全不了解对方领域知识的情况下，沟通起来是蛮困难的。这两个领域差异巨大，你要逐渐适应对方的思维模式。所以如果能够理解对方的思维方式，我觉得沟通起来就会越来越容易，合作会越来越容易。

第二，作为人工智能、机器学习的技术工作者，切忌从自己的角度出发去想技术怎么用。AI医学影像最核心最根本的是从医生的角度考虑其真正的需求是什么？我有一个很深刻的体会就是某种意义上，需求应该是由医生来主导。所以双方要进行深入的沟通，哪些问题是医生真的需要辅助，同时又是技术有可能解决的。

提问：如果AI模型的可重复性较差，如何提高模型的可信度？

答：网上有很多开源代码，我指的是你用了这个代码之后，是不是能够达到算法设计者的水平。代码和模型是两个概念，模型实际上是用代码在数据上训练出来，但训练本身是有很多技巧的。如果你不了解其中的技巧，实现不了代码开发者的水平，只是说你拿到的代码，能不能用自己的经验训练出同样的模型。新手在机器学习，特别是深度学习方面和富有经验的专业专家相比，差距还是巨大的，这个需要很多年的技术积累。

问：作为放射科医生，对于肺结节自动检出产品，最关心的是假阴性，这个问题怎么解决？

答：从医学的角度来讲，大家关注的性能指标应该是两个：特异性和敏感性，敏感度其实指的是一种查全率，是不是把所有的结节都找到了。特异性是指假阳性的比例。在某种意义上，这是两个矛盾的指标，如果把一个指标调到最大，那肯定另一个指标的表现就会变得很差，大家都希望这两个指标能够达到一个最好的平衡。

本文来自企鹅号 - 雷锋网媒体

如有侵权，请联系 cloudcommunity@tencent.com 删除。

机器学习