前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR 2022数据集汇总|包含目标检测、多模态等方向

CVPR 2022数据集汇总|包含目标检测、多模态等方向

作者头像
计算机视觉
发布2022-05-24 09:04:40
9150
发布2022-05-24 09:04:40
举报

编辑丨极市平台

M5Product Dataset

论文地址:https://arxiv.org/abs/2109.04275

数据集地址:https://xiaodongsuper.github.io/M5Product_dataset/index.html

M5Product 数据集是一个大规模的多模态预训练数据集,具有针对电子产品的粗粒度和细粒度注释。

  • 600 万个多模态样本、5k个属性和2400 万个值
  • 5 种模式-图像 文本 表 视频 音频
  • 600 万个类别注释,包含6k个类别
  • 广泛的数据源(100 万商户提供)

Ego4D

论文地址:https://arxiv.org/abs/2110.07058

数据集地址:https://ego4d-data.org/

在全球 74 个地点和 9 个国家/地区收集的大规模、以自我为中心的数据集和基准套件,包含超过 3,670 小时的日常生活活动视频。使用七种不同的现成头戴式摄像机捕获数据:GoPro、Vuzix Blade、Pupil Labs、ZShades、OR-DRO EP6、iVue Rincon 1080 和 Weeview。除了视频,部分 Ego4D 还提供其他数据模式:3D 扫描、音频、凝视、立体、多个同步的可穿戴相机和文本叙述。

Daily Multi-Spectral Satellite Dataset

论文链接:https://arxiv.org/pdf/2203.12560.pdf

数据集地址:https://mediatum.ub.tum.de/1650201

DynamicEarthNet 数据集包含每日 Planet Fusion 图像,以及两年内全球 75 个地区的每月土地覆盖类别。七个土地覆盖类别以时间一致的方式手动注释。还提供了 Sentinel 2 图像。该数据集是第一个大规模的多类和多时态变化检测基准,我们希望它能促进地球观测和计算机视觉领域的多时态研究新浪潮。

VCSL (Video Copy Segment Localization) dataset

论文地址:https://arxiv.org/abs/2203.02654

数据集地址:https://github.com/alipay/VCSL/tree/main/data

与现有的受视频级标注或小规模限制的复制检测数据集相比,VCSL 不仅具有两个数量级的片段级标记数据,16 万个真实视频副本对包含超过 28 万个本地复制片段对,而且涵盖各种视频类别和广泛的视频时长。每个收集的视频对中的所有复制片段都是手动提取的,并附有精确注释的开始和结束时间戳。

Rope3D

论文地址:https://arxiv.org/abs/2203.13608

数据集地址:https://thudair.baai.ac.cn/rope

Rope3D目标检测数据集是首个同时具有图像和点云3D联合标注的大规模、多视角的路侧数据集,共50009帧图像数据以及对应的2D&3D标注结果。基于该数据集,可以进行路端单目3D检测任务的研究。

EDS 数据集

数据集地址:https://github.com/DIG-Beihang/PSN

EDS 数据集针对由机器硬件参数引起的难以察觉的域间偏移问题研究,包含了来自 3 台不同 X 光机器的 14219 张图片, 其中 10 类物品, 共计 31655 个目标实例,均由专业标注人员进行标注。

FineDiving

论文地址:https://arxiv.org/pdf/2204.03646.pdf

数据集地址:https://github.com/xujinglin/FineDiving

本数据集收集了奥运会、世界杯、世锦赛以及欧锦赛的跳水项目比赛视频。每个比赛视频都提供了丰富的内容,包括所有运动员的跳水记录、不同视角的慢速回放等。

我们构建了一个由语义和时间结构组织的细粒度视频数据集,其中每个结构都包含两级注释。

对于语义结构,动作级标签描述了运动员的动作类型,步骤级标签描述了过程中连续步骤的子动作类型,其中每个动作过程中的相邻步骤属于不同的子动作类型。子动作类型的组合产生动作类型。在时间结构中,动作级标签定位运动员执行的完整动作实例的时间边界。在此注释过程中,我们丢弃所有不完整的动作实例并过滤掉慢速播放。步骤级标签是动作过程中连续步骤的起始帧。

PIAA 数据库

论文地址:https://arxiv.org/abs/2203.16754

数据集地址:https://cv-datasets.institutecv.com/#/data-sets

个性化图像美学评估 (PIAA) 由于其高度主观性而具有挑战性。人们的审美取决于多种因素,包括形象特征和主体性格。现有的 PIAA 数据库在注释多样性方面,特别是在学科方面受到限制,已不能满足日益增长的 PIAA 研究需求。为了解决这一难题,我们对个性化图像美学进行了迄今为止最全面的主观研究,并引入了一个新的具有丰富属性的个性化图像美学数据库(PARA),该数据库由 438 个主题的 31,220 张带有注释的图像组成。PARA 具有丰富的标注,包括 9 个面向图像的客观属性和 4 个面向人的主观属性。

本文仅做学术分享,如有侵权,请联系删文。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉工坊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • M5Product Dataset
  • Ego4D
  • Daily Multi-Spectral Satellite Dataset
  • VCSL (Video Copy Segment Localization) dataset
  • Rope3D
  • EDS 数据集
  • FineDiving
  • PIAA 数据库
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档