深度学习比医生更擅长发现癌症

JeremyHoward 打开了他将在Exponential Medicine 上做的机器学习的演讲。一个如史诗般的创造刚刚发生,他不得不把它包括在内。“在我登机之前,我之前的制作的演讲有一点过时,” Howard 说到。“所以我们不得不在飞机上对它做一点修改。”

什么使他如此兴奋?

周一,谷歌将其深度学习的软件TensorFlow开源。深度学习代表了一些谷歌的最先进的服务,这其中包括最近的几项如自动回复邮件和图片搜索。但是在将代码开源之前,公司希望从总体上加快在深度学习软件方面和机器学习领域的速度。

“谷歌大概领先世界5到7年,” Chris Nicholson 告诉Wired,他管理一家叫做Skymind的创业公司。“如果他们开源了他们的工具,这会让其他人更加擅长机器学习技术。”

这是很重大的一件事情,因为这个领域前进速度快得令人难以置信。

Howard 提到长期以来希望机器具有的能力如实时翻译和计算机生成艺术几年前并不存在。即使谷歌的自动回复邮件(最近才发布)在2011年只是个愚人节玩笑。

电脑现在能够做到这些,并能够做的更多。

“所以,一些能够让4年前愚人节玩笑变为如今实际的科学技术的令人惊讶的事情正在发生。” Howard 说到。

这个事情从广义角度来讲就是机器学习——主要是指算法通过例子而不是手动编程来学习。从谷歌的搜索引擎到亚马逊的推荐功能,机器学习无处不在。在医药领域,机器学习正被用于分析肺部CT扫描和帮助识别出成百上千的,能够让医生用其来更好的诊断和预测癌症的新的特征。

但是这些都是基于一个陈旧的、需要动手操作的机器学习模式。最新的进步是深度学习,并且它更加强大和独立。

图片识别恐怕是最值得称赞的、能够表现深度学习的进步速度的例子之一。2010年世界顶尖的图片识别技术的错误率(28.2%)是今天的6倍。今年早些时候,谷歌和微软宣布了他们的深度学习算法在任务处理方面比人类表现还好,各自将其错误率降低到了4.8%和4.94%。

但是 Howard的自己的演讲可能更加靠近揭示这种快速的进步。当他去年在Exponential Medicine 做演讲时,他说道,深度学习在世界和医药领域的应用只是刚刚起步。

“自从去年我的演讲后,所有的这些都以指数级的速度发生了,” Howard说到,“我们现在有了谷歌的自动邮件回复,有了Skype的自动翻译,有了自动艺术生成器(automatic art generators )。此外还有,去年我说过我将能够看到我们能够使用它来提高医学诊断的精确性和效率。”

“并且我们也做到了,我们创立了一个叫做 Enlitic 的公司。”

去年, Howard 的 Enlitic 公司只有一个雏形。他们的算法成功识别出狗和不同星系。很酷,但是不是最终目标。

最终, Howard 想着通过为全世界不容易找到医生的4百万人提供现代医学诊断的方式,来发挥深度学习在医药方面巨大的影响——不仅仅在美国,而且也在世界的其他地方。

这方面是一个空白。根据世界经济论坛, Howard 说道,在先进的体制中(国家之间会有一定的不同),训练足够的专家以满足发展中国家大约要花300年时间。

那么,去年 Enlitic 完成了什么目标呢?

“我们构建了它(系统),” Howard 说。“我们从几百万病人的疾病记录入手,然后建立了一个关于人体的人工神经网络。”

到目前为止, Enlitic 的深度学习系统很不错。非常好。 Howard 说他们打算在同行评审期刊中公布他们的结果,但是这里透漏一点信息。

他们用肺部CT扫描来为他们的算法提供数据来诊断潜在肿瘤增长的可能性,并将结果与一组4人组成的世界顶尖的人类放射科医生的诊断结果比较。

人类放射科医生有7%的假阴性率(漏掉癌症诊断的概率)。而 Enlitic的 AI ?假阴性率为0。人类放射科医生有66% 假阳性率(误诊为癌症)。 Enlitic 的 AI 相应结果为 47%。这意味着 AI 在这个任务中的表现显著优于人类。

“因此,它对癌症的早起诊断很有用,” Howard 说到。“如果你能够早点被发现患有癌症,你的存活率将会高出10倍。”

除此之外, Enlitic 也能够追踪病情痕迹——为放射科医生呈现相似病人的病例和相似病人随后的病情——来帮助医生对病情的估计。并且 Howard 说他们也在使用它来帮助医生分析4000像素的X光图片来识别从图片上看只有几个像素的骨折特征。

“之前有些在临床中没有成功的事情,” Howard 说。“在现代深度学习时代带来之前,你不能做到这些。”

Enlitic 已经募集了1千5百万美元,现在正和澳大利亚的Capital Radiology ,一个快速成长的澳大利亚放射公司,合作来在他们的网上推出 Enlitic 软件。在将来,他们也希望能够进入亚洲市场。

深度学习进步很快,也有非常广阔的应用。但是 Howard 看的更加长远。他将这种技术与90年代的互联网相比较,并且这就是他急于更新他的演讲。虽然一些人已经从事这项技术的研究,很多人还并不了解它。 TensorFlow 可能会打开新时代的洪流大闸,也可能让深度学习进步走的更快。

“这可能像60或者70年代公布C语言一样重要,” Howard 说,“这是第一次某些发现在公布后会给世界带来与电脑合作的新方式。”

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-11-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏磐创AI技术团队的专栏

在 Google 首款微信小程序“猜画小歌”里遇见 AI

602
来自专栏AI科技评论

干货 | 数学通大道,算法合自然?

算法对我们的生活中的有着各种潜移默化的影响,但算法是否存在被滥用的情况?本文对算法使用问题提出了自己的看法。

622
来自专栏量子位

让人上瘾的MIT课程发布:代号9.11,零基础探秘人类大脑

884
来自专栏人工智能快报

深度学习和人工智能正在引领我们走向智能住宅

未来的智能住宅计划正在慢慢变得越来越可行。在这些计划中,住宅能够为住户完成所有家务,如将晚餐做好并放到厨房的餐桌上,同时具有各种便利设施。随着深度学习研究的发展...

903
来自专栏ATYUN订阅号

微软正在开发用于识别AI算法偏差的工具

微软正在开发一个工具来自动识别一个范围内的不同的AI算法偏差。将自动识别渗入机器学习的不公平现象是非常值得提倡的,它可以帮助企业利用人工智能,而不会无意中歧视某...

895
来自专栏量子位

圣诞节吃饺子时,怎么给女票解释啥是AI?

Root 编译整理自 Wired 量子位 出品 | 公众号 QbitAI 上回的美图头像神器,大家有推荐给女票嘛? 把好看的照骗玩了一圈之后,可能她心里想问,感...

3227
来自专栏加米谷大数据

技术分享 | 大数据可视化的五大发展趋势

在这个信息爆炸的时代,借助图形化的手段,高效和清晰的交流信息是数据可视化的目的所在,作为一种信息载体,她拥有对数据的多种表现形式,可以是美丽的且带有趣味性的,以...

3245
来自专栏钱塘大数据

揭秘微信身份证背后的高科技——人脸识别技术

在日常生活中,相信很多人都会遇到需要证明“我就是我”的尴尬处境,如果碰巧未带身份证,就只好陷入有苦难言的无奈之中。最近,全国首张微信身份证发行,从此只要带着手机...

38211
来自专栏大数据文摘

机器真的已经战胜人类医生了吗?医学AI标题党文章中的三大陷阱

1797
来自专栏牛客网

【面经】360产品运营岗位面经

2250

扫描关注云+社区