原作 Jackie Snow Root 编译自 MIT Technology Review
据报道,全球现在超过17亿人的肌肉骨骼都出毛病,每年大概有3千万的急诊病例,而且这个数字还在往上走。骨骼方面的问题已经成为了最常见的慢性重症。
为了加快X光片的诊断速度,近日斯坦福吴恩达领头的研究团队开源了含有4万张人体上肢端的X光片的数据集MURA,并用这个数据集训练CNN寻找并定位X光片的异常部分。
最后训练的结果,是该模型在手指和手腕X光片中的诊断表现比放射科医生要好些。

不过放射医生依然能比模型更准确地诊断出手肘、前臂、手、上臂及肩膀的异常。

该神经网络含有169层。当输入多角度的上肢X光片时,模型就可以预测出异常的概率。

作为最大的医学影像数据集,MURA所含的4万张图都是由放射科医生一张张标注的。

这四万张图来自近15000篇论文,其中9067篇为正常上肢骨骼肌X光片的研究,5915篇是异常研究。上肢包括肩膀、肱部、手肘、前臂、手腕、手、指端。

现在,越来越多的数据集涌现出来,给深度学习提供了非常好的条件。AI算法在图像识别上能逐步超越人类很大程度上得益于这些数据集的开源。下面列举一些目前在医学影像数据集供大家参考。

不过,依照目前AI发展的速度来看,医学院应该停止培养放射专业的学生了。多伦多大学计算机系教授Geoffrey Hinton在接受纽约客采访时认为。
最后,附论文链接: https://arxiv.org/pdf/1712.06957.pdf 数据集要等到2月才会公布,可以持续关注Stanford ML https://stanfordmlgroup.github.io/projects/mura/