标准化数据集在多媒体研究中至关重要。今天,我们要给大家推荐一个汇总了姿态检测数据集和渲染方法的 github repo。
这个数据集汇总了用于对象姿态估计的数据集,以及生成合成训练数据的呈现方法。在下表中,3D CAD 模型表示为模型,2D 图像表示为对象。
该项目分为四个部分:
受控环境中的对象
野外物体
3D 模型数据集
渲染方法
受控环境中的对象
此表列出了通常称为 BOP:Benchmark 6D 对象姿态估计的数据集,该数据集提供精确的 3D 对象模型和精确的 2D~3D 对齐。
可以下载所有 BOP 数据集,并使用作者提供的工具箱。
使用项目上面的代码 ply2obj.py 将原始 .ply 文件转换为 .obj 文件,并运行 create_annotation.py 为数据集中的所有场景创建一个注释文件。
野外物体
在该表中, Pix3D 和 ScanNet 提供精确的 2D-3D 对齐,而其他仅提供粗略的对齐。
PASCAL3D+ 是用于视点估计的事实基准。
ScanNet 通常用来评估场景重建和分割。
3D 模型数据集
为了验证网络泛化能力,可以使用以下数据集生成合成训练数据。请注意,ABC 包含通用和任意的工业 CAD 型,而 ShapeNetCore 和 ModelNet 包含常见类别的对象,如汽车和椅子。
渲染方法
可微渲染
Blender Render 渲染
本 repo 提供了相关的 python 代码,以使用 Blender 作为一个易于安装和生成照片级真实图像的 python 模块,从 3D 模型生成渲染图像。
领取专属 10元无门槛券
私享最新 技术干货