首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

资源 | MURA:斯坦福ML团队开放的大型放射影像数据与挑战赛

此外,MURA 是最大的开放性放射影像数据之一,它有助于诊断上肢骨骼疾病。 ? 什么是 MURA?...MURA(肌骨骼放射影像)是骨骼 X 射线的大型数据,算法的任务是确定一张 X 射线影像是正常还是异常。...MURA 是最大的开放放射影像数据之一,研究者将该数据提供给社区来举办对应的竞赛,因而能了解模型在医学影像上能不能做得更好。 MURA 使用一个隐藏的测试数据以官方评估模型的性能。...MURA 提交教程:https://worksheets.codalab.org/worksheets/0x42dda565716a4ee08d61f0a23656d8c0/ MURA如何收集数据的...他们使用类别激活图(Class Activation Map)来可视化放射照片的对模型异常预测贡献最大的部分。 ? 该基线表现如何

55440

教程 | 如何在TensorFlow中高效使用数据

选自TowardsDataScience 作者:Francesco Zuppichini 机器之心编译 处理并使用数据是深度学习任务非常重要的组成部分。...概述 使用 Dataset 需要遵循三个步骤: 载入数据:为数据创建一个数据实例。 创建一个迭代器:通过使用创建的数据构建一个迭代器来对数据进行迭代。...使用数据:通过使用创建的迭代器,我们可以找到可传输给模型的数据元素。 载入数据 我们首先需要一些可以放入数据数据。...创建迭代器 我们已经学会创建数据集了,但如何从中获取数据呢?我们必须使用迭代器(Iterator),它会帮助我们遍历数据集中的内容并找到真值。有四种类型的迭代器。...但并不是将新数据馈送到相同的数据,而是在数据之间转换。如前,我们需要一个训练和一个测试

1.5K80

数据 | 共享单车使用数据

下载数据请登录爱数科(www.idatascience.cn) 自行车共享系统是传统自行车的新一代租赁方式,从会员资格,租赁和返还的整个过程已实现自动化。...除了自行车共享系统在现实世界中的有趣应用之外,这些系统生成的数据的特性使它们对研究具有吸引力。与其他运输服务(例如公共汽车或地铁)相反,在这些系统中明确记录了旅行的持续时间,出发和到达的位置。...因此,期望通过监视这些数据可以检测到城市中的大多数重要事件。...数据集中包括了美国共享单车公司Capital Bikeshare在华盛顿地区2011年和2012年的使用量历史记录,以及每天对应的天气信息。 1. 字段描述 2. 数据预览 3....数据来源 http://capitalbikeshare.com/system-data 5.

1.5K20

资源 | 吴恩达推荐:斯坦福放出最大放射影像数据,在4万张X光片上完成ML挑战赛

数据文摘作品 编译:闫雨莹 斯坦福大学ML Group昨天发布了一个新的数据——MURA。...MURA官网链接: https://stanfordmlgroup.github.io/competitions/mura/ 此外,斯坦福还在这个数据的基础上发布了举办深度学习挑战赛的消息,目的十分明确...不管是数量还是质量,这一最新发布的数据都非常优质,斯坦福教授吴恩达也在推特上推荐了这个比赛。...关于MURA 据官网介绍,MURA是肌肉骨骼放射照片的数据,由来自12,173名患者的14,863项研究组成,总共包含40,561个多视角放射图像。...那么,如何报名参加比赛呢? MURA使用非公开的测试装置对你的代码进行官方评估。参赛团队可以在Codalab上提交他们的可执行代码,然后运行在不公开可读的测试上即可。

53450

如何使用sklearn加载和下载机器学习数据

主要包含以下几种类型的数据: 小型玩具(样本)数据 数据生成器生成数据 API 在线下载网络数据 2玩具(样本)数据 sklearn 内置有一些小型标准数据,不需要从某个外部网站下载任何文件...]) 糖尿病数据 回归 load_linnerud([return_X_y]) Linnerrud 数据 多标签回归 load_breast_cancer([return_X_y]) 乳腺癌数据...分类 load_wine([return_X_y]) 葡萄酒数据 分类 load_digits([n_class, return_X_y]) 手写数字数据 分类 2.1波士顿房价数据 用于回归任务的数据...以下是一些常用的数据: 4.120个新闻组文本数据 20个新闻组文本数据包含有关20个主题的大约18000个新闻组,被分为两个子集:一个用于训练(或者开发),另一个用于测试(或者用于性能评估)。...fetch_20newsgroups 返回一个能够被文本特征提取器接受的原始文本列表,fetch_20newsgroups_vectorized 返回将文本使用tfidf处理后的特征矩阵。

4.1K50

关于开源神经影像数据如何使用的协议

考虑到大量的开放数据,我们的目标是提供通用的指导方针,这些指导方针可以根据示例轻松调整,但在适当的情况下,会提供特定的示例(特别是当讨论如何下载一个示例)。...iii.如果机构中确实存在集群,研究人员可能需要申请访问。...i.一些数据,比如那些在OpenNeuro上托管的数据,不需要申请;任何人都可以下载和使用数据。 ii.其他数据,如ABCD,需要托管数据的组织批准正式的数据使用协议(DUA)。...f.研究者可能希望在此阶段预先登记他们的研究和分析计划(关于如何预注册研究,请参阅下面的“故障排除”)。 关键: DUA必须在使用数据之前得到批准。...xii.例如,应包括提供成像采集参数、预处理管道和行为测量的总结,以及如何使用和分析数据的描述。 预期结果 我们有详细的步骤,如何数据生命周期的所有阶段使用开源数据

1.1K30

吴恩达团队发起骨骼X光片识别挑战赛,好胆你就来

翻译 | 张建军 出品 | 人工智能头条(公众号ID:AI_Thinker) 【人工智能头条导读】今年 1 月,斯坦福吴恩达团队开源了 MURA ,这是一个骨骼 X 光片的大型数据,总共有 40561...MURA 是最大的公共放射线影像数据之一。我们把该数据开放给社区并举办借此比赛,希望参赛者的模型可以达到和放射科医生一样的水平。 ▌怎样参加比赛?...MURA 包含一个隐藏的测试数据用于官方评估模型的性能。参赛队伍需要把他们的可执行代码提交到 Codalab,代码会在一个非公开的测试上运行。这样的流程保证了测试结果的公平性。...MURA 数据包含了对 12173 个病人的 14863 份研究数据,总共有 40561 份多视图放射线影像。...同时我们使用类别激活图(Class Activation Map)来可视化放射线照片中对模型异常预测的结果贡献最大的部分。 ▌基线模型表现如何

52540

Pytorch中如何使用DataLoader对数据进行批训练

为什么使用dataloader进行批训练 我们的训练模型在进行批训练的时候,就涉及到每一批应该选择什么数据的问题,而pytorch的dataloader就能够帮助我们包装数据,还能够有效的进行数据迭代,...如何使用pytorch数据加载到模型 Pytorch的数据加载到模型是有一个操作顺序,如下: 创建一个dataset对象 创建一个DataLoader对象 循环这个DataLoader对象,将标签等加载到模型中进行训练...关于DataLoader DataLoader将自定义的Dataset根据batch size大小、是否shuffle等封装成一个Batch Size大小的Tensor,用于后面的训练 使用DataLoader...进行批训练的例子 打印结果如下: 结语 Dataloader作为pytorch中用来处理模型输入数据的一个工具类,组合了数据和采样器,并在数据上提供了单线程或多线程的可迭代对象,另外我们在设置...shuffle=TRUE时,每下一次读取数据时,数据的顺序都会被打乱,然后再进行下一次,从而两次数据读取到的顺序都是不同的,而如果设置shuffle=False,那么在下一次数据读取时,不会打乱数据的顺序

1.3K20

非80端口如何使用Lets Encrypt申请https证书?

昨天晚上在服务器上为 nginx 部署 https 服务器,和之前不同的是,这次使用的 http 端口是 8080,之前使用默认的 80,因此使用 Let's Encrypt 生成证书时并没有以前那么顺利...早上 6 点爬起来,大脑非常清晰,我还是想解决非80端口如何使用Let's Encrypt 申请 https 证书的问题,我突然想起考研数学界的永乐大帝,李永乐老师,他讲过:数学,只有深刻理解的东西,才能更好的感觉它...简单来说,就两步,一是要证明你对你的域名有控制权,防止你为别人申请证书,二是证书的颁发和吊销。第二点基本不需要我们干预,自动完成,咱们说下第一点。...二是,在 https://example.com/ 的已知 URI 下放置一个 HTTP 资源,这个就是最初提到的网站在 80 端口正常运行,我们就可以在服务器端执行证书申请,这些操作都会自动完成,示意图如下...正如李永乐老师教导,只有深刻理解了的东西,你才能更好的使用它。

5K20

使用Python解析MNIST数据

前言 最近在学习Keras,要使用到LeCun大神的MNIST手写数字数据,直接从官网上下载了4个压缩包: ?...MNIST数据 解压后发现里面每个压缩包里有一个idx-ubyte文件,没有图片文件在里面。回去仔细看了一下官网后发现原来这是IDX文件格式,是一种用来存储向量与多维度矩阵的文件格式。...解析脚本 根据以上解析规则,我使用了Python里的struct模块对文件进行读写(如果不熟悉struct模块的可以看我的另一篇博客文章《Python中对字节流/二进制流的操作:struct模块简易使用教程...解析idx3文件的通用函数 12:param idx3_ubyte_file: idx3文件路径 13:return: np.array类型对象 14""" 15return data 针对MNIST数据的解析脚本如下...11数据下载地址为http://yann.lecun.com/exdb/mnist。 12相关格式转换见官网以及代码注释。

1.2K40

数据 | 如何方便的下载GLASS数据

GLASS数据一般有三种分辨率,其一基于MODIS数据生产的1km分辨率的GLASS产品,第二种是通过1km聚合而成的0.05度的GLASS产品,还有一种就是通过AVHRR数据生产的0.05度的GLASS...上图就是以GLASS LAI产品为例,显示的三种GLASS数据。 介绍完GLASS数据以后,我们就要说一下如何下载使用它了。...国内可提供下载的网站是,国家地球系统科学数据中心,网址为:http://www.geodata.cn。 但是我们今天不推荐使用它进行下载GLASS数据,因为还要申请账号,挺麻烦的。...美国马里兰大学的官网也提供GLASS数据的下载,并且不需要申请账号,十分的方便。关键这个网站国内也可以直接访问,不需要设置访问国外网站。...如果进行数据处理可以使用python中的pyHDF库,用起来还是蛮方便的。 需要注意的是,GLASS数据会把数据存储为整数,所以一般需要乘以一个尺度因子。这些信息也都存贮在HDF文件中。

3.6K30

如何在 GPU 深度学习云服务里,使用自己的数据

本文为你介绍,如何在 GPU 深度学习云服务里,上传和使用自己的数据。 (由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开。...解决了第一个问题后,我用 Russell Cloud 为你演示,如何上传你自己的数据,并且进行深度学习训练。 注册 使用之前,请你先到 Russell Cloud 上注册一个免费账号。...它的使用方法,我们后面会介绍。 先说说,你最关心的数据上传问题。 数据 解压后目录中的另一个文件夹,cats_and_dogs_small,就包含了我们要使用和上传的数据。...通过一个实际的深度学习模型训练过程,我为你展示了如何把自己的数据上传到云环境,并且在训练过程中挂载和调用它。...如果你对数据科学感兴趣,不妨阅读我的系列教程索引贴《如何高效入门数据科学?》,里面还有更多的有趣问题及解法。

2.2K20

实战 | 如何使用微搭低代码实现公差申请应用

功能设计 需求了解之后一般需要进行功能设计,可以使用viso,我现在喜欢使用在线的设计工具,在线工具的好处是模板比较多,只需要输入关键字找到对应的模板就可以,这里先输入功能图 点击立即使用即可创建,我们按照实际的需求进行修改...业务流程 模块规划好之后还需要分析一下业务流程,我们使用流程图就可以 总体上按照员工的职务的级别和请假的天数找对应级别的领导审核即可 数据源设计 需求规划好之后我们就需要进行数据源的设计,点击控制台的数据源管理...,点击新建数据源按钮 输入数据源的名称和标识,点击开始新建按钮 点击编辑按钮开始设计数据源的字段 点击添加字段按钮,依次创建申请人、所在部门、出差地点、出差事由、职务、开始日期、结束日期、出差天数...创建应用 流程设置好后我们就可以创建应用了,点击应用管理,点击创建空白应用 选择模型应用 点击下一步,输入应用名称和标识,选择公差申请数据源 系统就自动帮你完成了页面的创建 分配权限 应用发布之前需要先分配权限...进入应用管理,找到公差申请的应用,点击应用名称即可进入,点击发布按钮 发布为体验版 点击应用的链接,使用用户名密码访问即可 产品介绍 腾讯云微搭低代码是高效、高性能的拖拽式低代码开发平台,向上连接前端的行业业务

71320

如何使用scikit-learn在Python中生成测试数据

测试数据是一个微型的手工数据,你可以用它来测试机器学习算法或者工具。 测试数据数据具有定义良好的属性,例如其中的线性或者非线性数据,你可用它们探索特定的算法行为。...完成本教程后,你将会学到以下内容: 如何生成多类别分类预测的测试问题 如何生成二元分类预测的测试问题 如何生成线性回归预测的测试问题 教程概述 本教程共三部分,内容如下: 测试数据 分类测试问题 回归测试问题...测试数据 开发和实现机器学习算法面临的第一个问题是,如何能够保证已经正确地实现了机器学习算法。...它们可以很容易地被放大 我建议你在刚开始使用新的机器学习算法或者开发新的测试工具的时候用测试数据来调试。...扩展阅读 如果你希望深入研究,本节将提供更多关于本文主题的参考资料 Scikit-learn 用户引导:数据加载使用程序 Scikit-learn API: sklearn.datasets:数据

2.7K60
领券