前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >找不到合适的数据?这里有281个计算机视觉数据集任你选

找不到合适的数据?这里有281个计算机视觉数据集任你选

作者头像
机器之心
发布2019-06-05 11:30:16
7730
发布2019-06-05 11:30:16
举报
文章被收录于专栏:机器之心机器之心

机器之心编辑

参与:路

这里有数百个计算机视觉数据集。

数据对于模型训练而言非常重要,但寻找合适自己项目的数据集却并不简单。计算机视觉社区经常出现新的数据集,但研究者很难追踪新型数据集。

于是,哥伦比亚大学博士冯捷在 2017 年 8 月创建了一个专用于搜索计算机视觉数据集和代码/模型的搜索引擎 VisualData。

VisualData 网站地址:https://www.visualdata.io/

该网站现已收集 281 个计算机视觉数据集,用户可以在该网站上通过简单的搜索找到适合自己项目的数据集。

用户注册网站后可以实时收到新数据集、代码发布的消息,还可以点击「Add my dataset」贡献自己的数据集。

此外,每个数据集都有多个标签,如图像分类、目标检测、图像搜索、3D 重建等,还标注了数据集的公开状态、是否已有代码,以及数据集的流行度。

VisualData 网站上数据集示例。

用户可以点击数据集,查看数据集详情。点击「View Dataset」跳转链接,查看该数据集相关链接,比如 GitHub 项目等。

每个数据集的流行度得分就是根据用户查看数据集详情以及点击数据集链接的频率来计算的。

收集方法

VisualData 网站创建者冯捷 2017 年获得哥伦比亚大学博士学位,现任亚马逊应用科学家,研究兴趣为计算机视觉和机器学习。

他在 reddit 上表示,他首先写脚本来监控大量数据源(如 arXiv、实验室主页、社交媒体等),然后手动评估这些自动收集到的数据集,再更新到 VisualData 网站上。

其他数据集资源网站

VisualData 是专门提供计算机视觉数据集信息的网站,当然还有其他一些数据集资源网站。比如:

  • Kaggle 数据集:https://www.kaggle.com/datasets(目前包括 16484 个数据集)
  • Papers With Code:https://paperswithcode.com/sota(目前包括 910 个数据集)

更多数据资源,参见:20 个安全可靠的免费数据源,各领域数据任你挑

本文为机器之心编辑,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档