资源 | 吴恩达推荐:斯坦福放出最大放射影像数据集,在4万张X光片上完成ML挑战赛

大数据文摘作品

编译:闫雨莹

斯坦福大学ML Group昨天发布了一个新的数据集——MURA。据官网信息,这一数据集由自12,173名患者的14,863项研究组成,总共包括了40,561张多视角肌肉骨骼X光片。

MURA官网链接:

https://stanfordmlgroup.github.io/competitions/mura/

此外,斯坦福还在这个数据集的基础上发布了举办深度学习挑战赛的消息,目的十分明确:你的算法能不能打败放射科医生?

不管是数量还是质量,这一最新发布的数据集都非常优质,斯坦福教授吴恩达也在推特上推荐了这个比赛。

目前,肌肉骨骼疾病影响全球超过17亿人,斯坦福这一数据集旨在帮助医学影像技术取得重大进展,从而改善世界上许多缺乏放射科医生的医疗机构的状况。

关于MURA

据官网介绍,MURA是肌肉骨骼放射照片的数据集,由来自12,173名患者的14,863项研究组成,总共包含40,561个多视角放射图像。

图片囊括了七种放射科主要研究对象:手肘,手指,前臂,手,肱骨,肩膀和手腕。

这些数据的搜集横跨十年:2001年-2012年,斯坦福大学医院的放射科认证医生们对每个研究对象,都手动标记下了正常或异常的标签。

为为了评估模型以及放射科医师的表现,斯坦福ML Group从测试集上六名斯坦福放射科医师那里重新收集了额外标签,其中包括207项肌肉骨骼研究。使用PACS系统,放射科医师对这些研究进行了逐个回顾性检查,并将测试集中的每项研究标记为,临床阅读室环境中的正常或异常的DICOM文件。

这些放射科医师的平均工作年限为8.83年。我们随机选择了这些放射科医师中的3位,创建了一个“医生黄金标准”。

那么,如何报名参加比赛呢?

MURA将使用非公开的测试装置对你的代码进行官方评估。参赛团队可以在Codalab上提交他们的可执行代码,然后运行在不公开可读的测试集上即可。这样的设置保留了测试结果的完整性。

ML Group还发布了一个官方评估代码的教程。

教程链接:

https://worksheets.codalab.org/worksheets/0x42dda565716a4ee08d61f0a23656d8c0/

一旦模型被正式评估,你的分数就将被添加到右侧排行榜上。

目前,在这一排行榜上列出的是斯坦福专业放射科医生的成绩。

【今日机器学习概念】

Have a Great

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-05-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏花叔的专栏

为了学习小游戏开发,我做了个坦克大战

话说,花叔以前没怎么做过游戏,但自从微信说要做小游戏时,花叔就开始研究,终于在今年外部可发布小游戏时上线了个人的一款小游戏: 想要绑定的公众号,可以直接添加ap...

67317
来自专栏FreeBuf

聊聊鲜为人知的美军内部异常监测系统(ADAMS)

最近在海淘美国历年的安全项目,突然眼前一亮发现了这个名为ADAMS的DARPA立项。项目的全称是“Anomaly Detection at Multiple S...

23211
来自专栏VRPinea

AR成为病患福音:杜克大学利用Hololens降低脑外科手术风险

3247
来自专栏机器人网

机器人基础:伺服马达转向控制原理

舵机也叫伺服电机,最早用于船舶上实现其转向功能,由于可以通过程序连续控制其转角,因而被广泛应用机器人的各类关节运动,以及用在智能小车上以实现转向,如图1 、图2...

3859
来自专栏钱塘大数据

芯片这么难以制造,背后真相是什么

最近“芯片”刷屏,对于芯片产业的关注热潮背后,国人正在重新审视芯片行业的发展。实际上,国内高端通用芯片产业仍然处在起步阶段,与欧美、日韩的芯片产业仍有较大差距...

3837
来自专栏生信技能树

ngs数据分析结果只占一篇science文章的一张大图的3张子图

保持遗传稳定性的两个关键机制包括DNA损伤修复 (调控基因组稳定性)以及有丝分裂检测点(调控染色体组稳定性)。

1793
来自专栏java思维导图

一个女程序媛征男友的需求说明书

java思维导图 xmind导图配合精美文章,可视化学习,让java不再难懂。 前 言 常听人说程序员的生活枯燥为人刻板,其实这是你不懂程序员。代码之外,生活...

2785
来自专栏灯塔大数据

必读 | 芯片为什么难制造?这篇文章终于讲透

中兴被禁售芯片之事仍在发酵,缺“芯”之痛引发各界担忧。芯片为什么如此难制造?关键核心技术该怎么攻破?本文告诉你答案。

902
来自专栏阮一峰的网络日志

每周分享第 31 期

欢迎投稿,请前往 GitHub 的 ruanyf/weekly 提交 issue。

743
来自专栏Data Analysis & Viz

用python的PIL库轻松拼接一百张照片

和大家分享下之前用python的第三方库PIL库进行多图拼接制作的一些漂亮的照片墙成果图。

1832

扫码关注云+社区