前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >LeCun点赞,那个小巧的 MNIST 数据集长大了!

LeCun点赞,那个小巧的 MNIST 数据集长大了!

作者头像
昱良
发布2019-06-03 18:06:44
1.1K0
发布2019-06-03 18:06:44
举报
文章被收录于专栏:机器学习算法与Python学习
晓查 发自 凹非寺 量子位 出品 | 公众号 QbitAI

MNIST数据集是图像分类领域的基准测试之一,用于0~9手写数字图像分类任务,包含6万张训练图像和1万张测试图像。它已经有20多年的历史了。但是官方测试集因为测试集样本太少,MNIST通常被认为不能提供有意义的置信区间。

现在,来自纽约大学两位研究人员给MNIST测试集再增加5万张图片,叫做QMNIST,获得校友、也是MNIST发起者LeCun转发。

LeCun给予了这个数据集很高的评价,认为它“重生、恢复、扩展”了MNIST。

数据集内容

QMNIST扩展数据集包含以下一些文件。

其中,前两个gz压缩文件和标准MNIST数据文件格式相同,不同的是QMNIST包含6万个测试样本。

前10000个QMNIST测试样本与MNIST测试集是逐一匹配的,后50000个示例是根据MNIST用算法重建的数据集。

使用方法

QMNIST的GitHub页上提供了Pytorch平台的QMNIST数据加载器,需要将数据集下载至与pytorch.py相同的文件夹下将网络下载选项设置为download=’True’。

它与标准的Pytorch MNIST数据加载器兼容。

代码语言:javascript
复制
from qmnist import QMNIST

# the qmnist training set, download from the web if not found
qtrain = QMNIST( _qmnist , train=True, download=True)  

# the qmnist testing set, do not download.
qtest = QMNIST( _qmnist , train=False)

# the first 10k of the qmnist testing set with extended labels
# (targets are a torch vector of 8 integers)
qtest10k = QMNIST( _qmnist , what= test10k , compat=False, download= True )

# all the NIST digits with extended labels
qall = QMNIST( _qmnist , what= nist , compat=False)

传送门

数据集地址: https://github.com/facebookresearch/qmnist

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习算法与Python学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据集内容
  • 使用方法
  • 传送门
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档