前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用Google的Quickdraw创建MNIST样式数据集!

使用Google的Quickdraw创建MNIST样式数据集!

作者头像
AiTechYun
发布2018-03-02 17:03:04
1.6K0
发布2018-03-02 17:03:04
举报
文章被收录于专栏:ATYUN订阅号ATYUN订阅号

对于那些运行深度学习模型的人来说,MNIST是无处不在的。手写数字的数据集有许多用途,从基准测试的算法(在数千篇论文中引用)到可视化,比拿破仑的1812年进军更为普遍。数字如下所示:

它经久不衰的主要原因是缺乏替代品。在这篇文章中,我想介绍另一种方法,就是Google的QuickDraw数据集。2017年QuickDraw数据集应用于Google的绘图游戏Quick,Draw。该数据集由5000万幅图形组成。图纸如下所示:

构建您自己的QuickDraw数据集

我想了解您如何使用这些图纸并创建自己的MNIST数据集。Google使每个图纸变为可用的28x28灰度位图文件,这些可以作为MNIST 28x28灰度位图图像的替代品。并且Google已经将数据集公开。所有数据都位于Google的云端控制台中,但是对于这些图像,您需要使用numpy_bitmaps的这个链接。

您应该到达一个允许您下载任何类别图像的页面。然后选择类别,我选择眼镜,脸,铅笔和电视机。通过脸这个类别可以知道精细的绘画可能更难学习,您应该选择其他有趣的类别。

接下来的挑战是获得这些.npy文件并使用它们。这是一个简短的python gist ,我用来阅读.npy文件并将它们组合起来创建一个可以用来替代MNIST的含有80,000个图像的数据集。它们以hdf5格式保存,这种格式是跨平台的,经常用于深度学习。

用QuickDraw代替MNIST

我使用这个数据集代替MNIST。在Keras 教程中,使用Python中的自动编码器进行一些工作。下图显示了顶部的原始图像,并使用自动编码器在底部显示重建的图像。

接下来我使用了一个R语言的变分自编码器的数据集。以下是导入数据的代码片段:

代码语言:javascript
复制
library(rhdf5)
x_test <- t(h5read('x_test.h5', 'name-of-dataset'))
x_train <- t(h5read('x_train.h5', 'name-of-dataset'))
y_test <- (h5read('y_test.h5', 'name-of-dataset'))
y_train <- (h5read('y_train.h5', 'name-of-dataset'))

这是使用自定义的quickdraw数据集的可视化的潜在空间。

本文为编译文章,作者Rajiv Shah,原网址为 http://projects.rajivshah.com/blog/2017/07/14/QuickDraw/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-07-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ATYUN订阅号 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 构建您自己的QuickDraw数据集
  • 用QuickDraw代替MNIST
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档