资源 | 吴恩达推荐:斯坦福放出最大放射影像数据集,在4万张X光片上完成ML挑战赛

大数据文摘作品

编译:闫雨莹

斯坦福大学ML Group昨天发布了一个新的数据集——MURA。据官网信息,这一数据集由自12,173名患者的14,863项研究组成,总共包括了40,561张多视角肌肉骨骼X光片。

MURA官网链接:

https://stanfordmlgroup.github.io/competitions/mura/

此外,斯坦福还在这个数据集的基础上发布了举办深度学习挑战赛的消息,目的十分明确:你的算法能不能打败放射科医生?

不管是数量还是质量,这一最新发布的数据集都非常优质,斯坦福教授吴恩达也在推特上推荐了这个比赛。

目前,肌肉骨骼疾病影响全球超过17亿人,斯坦福这一数据集旨在帮助医学影像技术取得重大进展,从而改善世界上许多缺乏放射科医生的医疗机构的状况。

关于MURA

据官网介绍,MURA是肌肉骨骼放射照片的数据集,由来自12,173名患者的14,863项研究组成,总共包含40,561个多视角放射图像。

图片囊括了七种放射科主要研究对象:手肘,手指,前臂,手,肱骨,肩膀和手腕。

这些数据的搜集横跨十年:2001年-2012年,斯坦福大学医院的放射科认证医生们对每个研究对象,都手动标记下了正常或异常的标签。

为为了评估模型以及放射科医师的表现,斯坦福ML Group从测试集上六名斯坦福放射科医师那里重新收集了额外标签,其中包括207项肌肉骨骼研究。使用PACS系统,放射科医师对这些研究进行了逐个回顾性检查,并将测试集中的每项研究标记为,临床阅读室环境中的正常或异常的DICOM文件。

这些放射科医师的平均工作年限为8.83年。我们随机选择了这些放射科医师中的3位,创建了一个“医生黄金标准”。

那么,如何报名参加比赛呢?

MURA将使用非公开的测试装置对你的代码进行官方评估。参赛团队可以在Codalab上提交他们的可执行代码,然后运行在不公开可读的测试集上即可。这样的设置保留了测试结果的完整性。

ML Group还发布了一个官方评估代码的教程。

教程链接:

https://worksheets.codalab.org/worksheets/0x42dda565716a4ee08d61f0a23656d8c0/

一旦模型被正式评估,你的分数就将被添加到右侧排行榜上。

目前,在这一排行榜上列出的是斯坦福专业放射科医生的成绩。

【今日机器学习概念】

Have a Great

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-05-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏牛客网

Keep算法岗娱乐面面经

之前看到牛客有人发Keep内推贴,因为一直对Keep比较有好感于是马上内推了一波,笔试只a了1题居然进了面试,本来约的上周四,我说没时间可不可以周末,电话对面说...

791
来自专栏数据的力量

史上最好的思维导图中文教程

791
来自专栏Y大宽

4 翻转课堂的设计及步骤(含慕课和视频制作)

总分总的格式 总体框架 话题导入,图片或视频 知识讲解 图片内容 模板应用

1623
来自专栏凌帅的阅读思考与实践

破解低效率勤奋陷阱的高效率读书技术(附实例)

1. 翻开一本看过的书,却什么也记不起来?看着书上自己熟悉的笔迹,确实是自己写的啊,却一点印象也没有。于是疑惑:读了有什么用?

832
来自专栏数据小魔方

云课堂Excel课程数据可视化分析

我一直是网易云课堂的重度用户,从大二开始就一直在上面学习各种技能类课程,作为互联网在线教育的知名品牌,云课堂在某种程度上弥补了我们从校园到职场过渡过程中,很多技...

3526
来自专栏非著名程序员

程序员的技术修炼如登峰,到不了顶也要努力向上攀!

为了学习React Native,我用了5天时间研究了JavaScript,并写了四篇文章总结自己的认识,有人留言:“才学了5天就能这么厉害?”。前段时间,我花...

1998
来自专栏人工智能快报

神经形态计算成为大脑仿真最佳平台之一

科研人员利用一个名为SpiNNaker的神经形态计算机开展大脑仿真实验,取得的效果与利用传统超级计算机进行仿真获取的最佳效果不相上下。

442
来自专栏大数据文摘

一份AI博士生的ICML2018“学霸”笔记(55页)

7 月 10 日,第35届机器学习技术国际会议ICML 在瑞典斯德哥尔摩举行,作为AI领域最负盛名的会议之一,本次会议共收到2473篇论文。其中,621篇被接收...

800
来自专栏顾宇的研习笔记

什么才是听课的正确姿势?

这个重要的事实是:你的注意力是大脑中最宝贵的资源,大脑会根据你的喜好充分你用你的注意力。

742
来自专栏大数据文摘

数字化诗人:这可能是第一位用算法写诗的诺贝尔文学奖得主

1003

扫码关注云+社区