深度学习、机器学习图像/人脸/字幕/自动驾驶数据集(Dataset)汇总

1. CIFAR-10 & CIFAR-100

CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。

下载地址

https://www.cs.toronto.edu/~kriz/cifar.html

(类别:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck)

(作者:Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton)

(数据格式:Python版本、Matlab版本、二进制版本<for C程序>)

CIFAR-100

下载地址

https://www.cs.toronto.edu/~kriz/cifar.html

与CIFAR-10类似,包含100个类,每类有600张图片,其中500张用于训练,100张用于测试;这100个类分组成20个超类。每个图像有一个"find" label和一个"coarse"label。

2. 图像分类结果及对应的论文

下载地址

http://rodrigob.github.io/are_we_there_yet/build/classification_datasets_results.html

包含数据集:MNIST、CIFAR-10、CIFAR-100、STL-10、SVHN、ILSVRC2012 task 1

ILSVRC: ImageNet Large Scale Visual Recognition Challenge

下载地址

http://www.image-net.org/challenges/LSVRC/2014/

3. ImageNet

下载地址

http://www.image-net.org/

ImageNet相关信息如下:

1)Total number of non-empty synsets: 21841 2)Total number of images: 14,197,122 3)Number of images with bounding box annotations: 1,034,908 4)Number of synsets with SIFT features: 1000 5)Number of images with SIFT features: 1.2 million

4. COCO

下载地址

http://mscoco.org/

COCO(Common Objects in Context)是一个新的图像识别、分割、和字幕数据集,它有如下特点:

1)Object segmentation

2)Recognition in Context 3)Multiple objects per image 4)More than 300,000 images 5)More than 2 Million instances 6)80 object categories 7)5 captions per image 8)Keypoints on 100,000 people

COCO 2016 Detection Challenge(2016.6.1-2016.9.9)

http://mscoco.org/dataset/#detections-challenge2016

和COCO 2016 Keypoint Challenge(2016.6.1-2016.9.9)

http://mscoco.org/dataset/#keypoints-challenge2016

已经由Microsoft发起 由ECCV 2016(ECCV:European Conference On Computer Vision )。

4. 3D数据

1)RGB-D People Dataset

http://www2.informatik.uni-freiburg.de/~spinello/RGBD-dataset.html

2)NYU Hand Pose Dataset

http://cims.nyu.edu/~tompson/NYU_Hand_Pose_Dataset.htm

code

https://github.com/jonathantompson/ModelFit

3)Human3.6M (3D Human Pose Dataset)

http://vision.imar.ro/human3.6m/description.php

《Iterated Second-Order Label Sensitive Pooling for 3D Human Pose Estimation》

5. 人脸Dataset

1)LFW (Labeled Faces in the Wild)

http://vis-www.cs.umass.edu/lfw/index.html

6. Stereo Datasets

1)Middlebury Stereo Datasets

http://vision.middlebury.edu/stereo/data/

2)KITTI Vision Benchmark Suite

http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=stereo

7. 普林斯顿大学人工智能自动驾驶汽车项目

1)Deep Drive

http://deepdrive.io/

2)Source Code and Data

http://deepdriving.cs.princeton.edu/

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2018-01-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏图形学与OpenGL

机械版CG 实验3 变换参考实例

#include <GL/glut.h> #include <stdlib.h> static int shoulder = 0, elbow = 0;//...

9210
来自专栏悦思悦读

决策树告诉你Hello Kitty到底是人是猫

Hello Kitty,一只以无嘴造型40年来风靡全球的萌萌猫,在其40岁生日时,居然被其形象拥有者宣称:HelloKitty不是猫! 2014年八月,研究 H...

40570
来自专栏AI研习社

一文教你如何用神经网络识别验证码!

AI 研习社按:本文作者 Slyne_D,原载于作者个人博客,雷锋网 AI 研习社已获授权。文中相关链接详见文末“阅读原文”。 这是去年博主心血来潮实现的一个小...

31030
来自专栏QQ音乐技术团队的专栏

Android中图片压缩分析(下)

上篇我们详细介绍了图片质量压缩的相关内容和算法,接下来的下篇给大家介绍一下图片的尺寸压缩和常用的几种尺寸压缩算法。

1.2K10
来自专栏CNN

MobileNet原理+手写python代码实现MobileNet

MobileNet是针对移动端优化的卷积,所以当需要压缩模型时,可以考虑使用MobileNet替换卷积。下面我们开始学习MobileNet原理,并且先通过Ten...

21620
来自专栏企鹅号快讯

使用RNN预测股票价格系列一

正文共11490个字,16张图,预计阅读时间:29分钟。 01 概述 我们将解释如何建立一个有LSTM单元的RNN模型来预测S&P500指数的价格。 数据集可以...

27890
来自专栏一棹烟波

OpenCV3.4两种立体匹配算法效果对比

 以OpenCV自带的Aloe图像对为例: ? ? ? 1.BM算法(Block Matching) 参数设置如下: int numberOfDispa...

1.5K40
来自专栏生信小驿站

python 特征选择①

VarianceThreshold 是特征选择中的一项基本方法。它会移除所有方差不满足阈值的特征。默认设置下,它将移除所有方差为0的特征,即那些在所有样本中数值...

9920
来自专栏烂笔头

常用样本相似性和距离度量方法

目录[-] 数据挖掘中经常需要度量样本的相似度或距离,来评价样本间的相似性。特征数据不同,度量方法也不相同。 欧式距离 欧式距离(Euclidean ...

1K40
来自专栏贾志刚-OpenCV学堂

OpenCV 3.1.0中的图像放缩与旋转

OpenCV在3.1.0版本中的图像放缩与旋转操作比起之前版本中更加的简洁方便,同时还提供多种插值方法可供选择。首先来看图像放缩,通过OpenCV核心模块API...

53570

扫码关注云+社区

领取腾讯云代金券