首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

公共数据集

  如今是一个大数据驱动人工智能技术如火如荼大发展的时代,数据对于研究者验证优化算法、与同类型算法进行对比测试都具有重要意义。现将工作中积累的公共数据集进行了整理,供各位研究人员参考。

图像处理

10k 美国人脸数据库

2GB 猫的图片

为性别和年龄分类任务而建的未经滤波处理的人脸数据集

情感分类图像数据集

具备属性标记的50种动物图像

加州理工行人检测数据集(需科学上网)

自然图像中的字符识别数据集

人脸检测数据库

采集自Flickr的数十种商标图像

GDXray 近2w幅X光透视影像

大名鼎鼎的斯坦福 ImageNet 数据库

室内场景识别图像

弗罗里达大学提供经规范评分标记的用于情感刺激和心理认知研究的图像

近百万样本的 MNIST 手写数字数据库

MIT提供室内室外各种场景下的环境光照变化图像

斯坦福提供的120个品种超过2w样本犬类图像

用于动作检测和行为识别的视频图像库

牛津大学37类宠物图像

人群中异常行为检测视频数据集

Visual genome 由斯坦福大学人工智能实验室李飞飞教授等建立的结构化描述图像数据库

YouTube 视频人脸数据集(用于非受控场景下人脸识别研究)

机器学习

多种类型的分类和回归数据集

Discogs每月更新的音乐作品信息数据

免费的音乐信息数据库

每日更新的IMDb数据库

分类、回归、时间序列等机器学习任务测试基准数据库

LFW野外标注人脸数据库(用于非受控条件下的人脸识别研究)

分年度真实贷款申请和被拒数据

哥伦比亚大学提供百万级歌曲数据(需科学上网)

电影评分和推荐数据

对《纽约客》杂志标题的评分数据

旧金山地区餐厅卫生评分数据

加州大学尔湾分校提供用于机器学习任务的多种类别数据集

来自Yahoo! 的多种分类和评分数据

高质量的YouTube视频目标边界标注数据(需科学上网)

Youtube 8m:高质量机器标注Youtube视频数据(需科学上网)

2012年度eBay在线拍卖数据

自然语言处理

自动关键词提取数据

2004年英文博客语料库

Google抓取的英文网页语料库

Flickr个人分类数据

多语种Google Books Ngrams数据集 (2.2TB)

Google MC-AFP - 机器理解数据集

Gutenberg项目提供的电子书

第36届加拿大议会的会议记录

微软机器理解数据库

欧洲语言间机器翻译用平行语料库

多领域公众情绪数据集

开源多语种Wordnet

英文垃圾短信数据集

Stanford问答数据集

2005~2011英语新闻语料库

多语种新闻语料库

维基百科语料数据

维基百科链接数据(需科学上网)

WordNet大规模英文语义数据库

玻森中文语料数据

大气环境

美国和加拿大部分地区气候数据

澳大利亚每日天气数据

美国国家海洋和大气管理局航空气象中心

加拿大政府气象中心数据

每月更新的全球温度数据

欧洲及地中海沿岸地区极端天气状况数据

自1929年开始遍布全球的超9000个气象站记录的全球气候数据

美国国家航空航天局多种类全球数据可视化浏览服务

美国国家海洋和大气管理局白令海洋生态和气候数据

美国国家海洋和大气管理局多种类型大气和天气数据

美国国家海洋和大气管理局 SURFRAD 气象雷达数据

世界银行公开气候变化数据

英国东安格利亚大学提供的多种气候数据

分地区全球天气历史数据

用于生态学模型和地理信息系统的全球气候数据

国内政府公开数据

国家数据

北京市政务数据资源网

上海市政府数据服务网

浙江政务服务网

武汉市政府公开数据服务网

专利数据

中国专利数据

欧洲专利局数据服务

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181011G18CXH00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券