专栏首页量子位取代MNIST?德国时尚圈的科学家们推出基准数据集,全是衣裤鞋包

取代MNIST?德国时尚圈的科学家们推出基准数据集,全是衣裤鞋包

李林 编译整理 量子位 报道 | 公众号 QbitAI

MNIST,是一个手写数字数据集,除了用在机器学习入门的教学中,它还是对机器学习算法进行基准测试的常用数据集。

但是,总有人觉得MNIST不够好,想要扩充、改进、替代它。

今天,德国研究机构Zalando Research在GitHub上发布了一个名叫Fashion-MNIST的数据集,其中训练集包含60000个样例,测试集包含10000个样例,分为10类。样例都来自日常穿着的衣裤鞋包,每一个都是28×28的灰度图像。

除了内容不一样,这个数据集的图片尺寸、训练/测试集划分、文件的存储结构,都和MNIST一模一样。

这个数据集虽然名字里带有“fashion”,内容也都是服饰,但它的目标用途和时尚毫无关系:它致力于成为MNIST的替代品,用作机器学习算法的基准测试。

Fashion-MNIST(左)和原始MNIST(右)的t-SNE可视化展示

为什么要替代MNIST呢?

Zalando Research在这个数据集的说明中称,AI/机器学习/数据科学界的同学们搞出一个新算法之后,往往会先在MNIST上做基准测试,来验证这个算法。

于是,在这些群体之间流传着这样一种说法:如果一种算法连MNIST都搞不定,那它就是真没用;如果它能搞定MNIST,放到别的地方也不一定管用……

MNIST不好用,主要是因为它太简单了。甚至有人证明过,如果只是想区分开两个手写数字,很多时候识别一个像素就够了。

Google研究员、Keras作者François Chollet也曾经说,MNIST有很多问题,但其中最严重的一个,是它对于计算机视觉任务真的不具有代表性,做计算机视觉的算法,至少应该用CIFAR10这个复杂程度的数据集。

这次推出fashion-MNIST,想要取代MNIST的是德国研究机构Zalando Research,隶属于主营衣服鞋子的德国电商公司Zalando。

最后,如果你想试试这个fashion-MNIST数据集,请到https://github.com/zalandoresearch/fashion-mnist

本文分享自微信公众号 - 量子位(QbitAI),作者:专注报道AI

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-08-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 连LeCun都推荐的Fashion-MNIST数据集,是这位华人博士的成果

    允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上周六,量子位在报道中提到德国时尚圈的科学家,推出一个名叫Fashion-MNIST的数据集。这个数...

    量子位
  • 一个算法同时解决两大CV任务,让目标检测和实例分割互相帮助,地平线实习生论文被AAAI 2020收录

    上面的结果由Mask R-CNN得到,可以看到由于边界框定位不准导致前两张图的实例掩码缺失,以及后两张图的边界框与实例掩码不统一。

    量子位
  • 罗永浩推出新一代坚果手机,比AI亮眼的是AV能力

    就在昨天(8月20日)进行的新品发布会上,罗永浩推出了锤子科技手机新品:坚果Pro 2S。

    量子位
  • 学界 | Fashion-MNIST:替代MNIST手写数字集的图像数据集

    机器之心转载 公众号:PaperWeekly 作者:肖涵 FashionMNIST 是一个替代 MNIST 手写数字集 [1] 的图像数据集。 它是由 Zala...

    机器之心
  • 连LeCun都推荐的Fashion-MNIST数据集,是这位华人博士的成果

    允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上周六,量子位在报道中提到德国时尚圈的科学家,推出一个名叫Fashion-MNIST的数据集。这个数...

    量子位
  • MNIST重生,测试集增加至60000张!

    尽管MNIST是源于NIST数据库的基准数据集,但是导出MNIST的精确处理过程已经随着时间的推移被人们多遗忘。因此,作者提出了一种足以替代MNIST数据集的重...

    AI科技大本营
  • 数据分析工具深度评测:Tableau与FineBI,哪个更好用?

    谈起当今最受欢迎的数据分析工具,可能很多人都会想到国外的Tableau和国内的代表自助式工具FineBI,但其实很多人都不知道他们之间的差异,那么这两个产品究竟...

    数据分析的那些事儿
  • Python教程之HelloWorld

    孙亖
  • 干货 | 论文笔记:第一人称视角视频中的行人轨迹预测

    AI 科技评论按:本文为上海交通大学林天威为 AI 科技评论撰写的独家稿件,得到了其指点和审核,AI 科技评论在此表示感谢。 视频中的人体动作分析是计算机视觉研...

    AI科技评论
  • 写出让java相看两不厌的kotlin代码-@JvmField和@JvmStatic的方法论

    在java代码里使用就报错"Non-static cannot be accessed from a static context."

    1025645

扫码关注云+社区

领取腾讯云代金券