机器学习常用数据集合集

AI 研习社,资源版块已经正式上线,所有资源目前一律限时免费,欢迎大家前往社区资源中心下载喔~

ai.yanxishe.com/page/resources

研究机器学习的时候手里没有数据集简直就像在战场上枪里没有子弹,这次就给大家带来一点弹药。

这份PDF是机器学习最常用的一些学术数据集的合集(来自于 AI 科技评论整理的一篇文章)。不仅提供了高速、稳定、墙内可用的下载地址,年岁已久的数据集也已经更新成了现代格式方便直接调用。

包括的数据集有:

(1)图像分类 MNIST、CIFAR10/100、Caltech-UCSD Birds-200-2011、Caltech 101、Oxford-IIIT Pet、Oxford 102 Flowers、Food-101、Stanford cars

(2)自然语言处理 IMDb Large Movie Review、Wikitext-103/2、WMT 2015 French/English、AG News、Amazon reviews、DBPedia ontology、Sogou news、Yahoo! Answers、Yelp reviews

(3)目标检测/分割 Camvid、PASCAL VOC、COCO 2017(以及各种子集)

限时收藏入口

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20181109A1OT6J00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券