前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ECCV2020优秀论文汇总|涉及点云处理、3D检测识别、三维重建、立体视觉、姿态估计、深度估计、SFM等方向

ECCV2020优秀论文汇总|涉及点云处理、3D检测识别、三维重建、立体视觉、姿态估计、深度估计、SFM等方向

作者头像
3D视觉工坊
发布2020-12-11 10:03:00
8880
发布2020-12-11 10:03:00
举报
文章被收录于专栏:3D视觉从入门到精通

前言

ECCV2020的oral和spotlight名单已经发布,与往年相比,accepted paper list中增加了很多3D方向相关的作品,实在值得鼓舞。

工坊对这些优秀作品进行了跟进,今天和大家分享下ECCV2020中3D方向相关的oral和spotlight,涉及点云处理、3D检测识别、三维重建、立体视觉、姿态估计、深度估计、SFM等~

点云相关

1、Quaternion Equivariant Capsule Networks for 3D Point Clouds

文章链接:https://arxiv.org/pdf/1912.12098.pdf

文章主要提出了一种用于处理点云的3D胶囊网络结构,可用于3D识别与方向估计。

2、Intrinsic Point Cloud Interpolation via Dual Latent Space Navigation

文章链接:https://arxiv.org/pdf/2004.01661v1.pdf

论文提出了一种基于学习的方法,用于对表示为点云的3D形状进行插值,该方法可用于保留固有的形状属性。

3、PointMixup: Augmentation for Point Clouds

Paper暂未开放

4、PointContrast: Unsupervised Pretraining for 3D Point Cloud Understanding

Paper暂未开放

三维重建

1、Ladybird: Deep Implicit Field Based 3D Reconstruction with Sampling and Symmetry

Paper未开放

2、Deep Fashion3D: A Dataset and Benchmark for 3D Garment Reconstruction from Single-view Images

文章链接:https://arxiv.org/pdf/2003.12753.pdf

论文主要开源了单视图图像重建3D服装的数据集

3、Combining Implicit Function Learning and Parametric Models for 3D Human Reconstruction

Paper暂未开放

4、Coherent full scene 3D reconstruction from a single RGB image

文章链接:https://arxiv.org/pdf/2004.12989.pdf

深度学习技术的进步允许最近的工作在仅输入一个RGB图像的情况下重建单个对象的形状。基于此任务的通用编码器-解码器体系结构,论文提出了三个扩展:(1)以物理上正确的方式将本地2D信息传播到3D体积;(2)混合3D体积表示,它可以建立翻译等变模型,同时在不占用过多内存的情况下对精细的对象详细信息进行编码;(3)专为捕获整体物体几何形状而设计的重建损失。此外,论文还调整模型以解决从单个图像重建多个对象的艰巨任务。

5、Deep Reflectance Volumes: Relightable Reconstructions from Multi-View Photometric Images

Paper暂未开放

场景识别

1、ReferIt3D: Neural Listeners for Fine-Grained 3D Object Identification in Real-World Scenes

Paper暂未开放

3D检测与识别

1、RTM3D: Real-time Monocular 3D Detection from Object Keypoints for Autonomous Driving

文章链接:https://arxiv.org/pdf/2001.03343.pdf

源码链接:https://github.com/Banconxuan/RTM3D(即将开源)

论文提出了一种有效且准确的单目3D检测框架,文中的方法预测图像空间中3D边界框的九个透视关键点,然后利用3D和2D透视的几何关系恢复3D空间中的尺寸,位置和方向。通过这种方法,即使关键点的估计非常嘈杂,也可以稳定地预测对象的属性,这使得能够以较小的架构获得快速的检测速度。该方法是第一个用于单目图像3D检测的实时系统,同时在KITTI基准上达到了SOTA。

姿态估计

1、Self6D: Self-Supervised Monocular 6D Object Pose Estimation

文章链接:https://arxiv.org/pdf/2004.06468.pdf

针对深度学习单目姿态估计下的数据难获取这一缺点,论文提出了通过自监督学习方式进行单目6D姿态估计的方法,该方法消除了对带有注释的真实数据的需求。

2、End-to-End Estimation of Multi-Person 3D Poses from Multiple Cameras

文章链接:https://www.researchgate.net/publication/340644214_End-to-End_Estimation_of_Multi-Person_3D_Poses_from_Multiple_Cameras

论文提出了一种从多个摄像机视图估计多个人的3D姿势的方法。与之前需要基于嘈杂和不完整的2D姿势估计来建立跨视图对应关系的工作相反,论文提出了一种直接在 3 D空间运行的端到端解决方案。

3、Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View Geometry

Paper未开放

4、Towards Part-aware Monocular 3D Human Pose Estimation: An Architecture Search Approach

Paper未开放

5、Adaptive Computationally Efficient Network for Monocular 3D Hand Pose Estimation

Paper未开放

深度估计

1、Du^2Net: Learning Depth Estimation from Dual-Cameras and Dual-Pixels

文章链接:https://arxiv.org/pdf/2003.14299v1.pdf

计算方式的stereo已经达到了很高的准确性,但是由于存在遮挡,重复的纹理以及沿边缘的对应误差,会降低stereo效果。论文提出了一种基于神经网络的深度估计新方法,该方法将双摄像头的stereo与双像素传感器的stereo相结合,这在消费类摄像头上越来越普遍。网络使用新颖的架构来融合这两个信息源,并且可以克服纯双目立体声匹配的上述限制。论文的方法提供了具有锐利边缘的密集深度图,这对于计算摄影应用(如合成浅景深或3D照片)至关重要。目前进行的实验和与最先进方法的比较表明,论文的方法比以前的工作有了实质性的改进。

立体视觉

1、Learning Stereo from Single Images

Paper未开放

2、Domain-invariant Stereo Matching Networks

文章链接:https://arxiv.org/pdf/1911.13287.pdf

代码链接:https://github.com/feihuzhang/DSMNet

由于大量的领域差异(例如颜色,照明,对比度和纹理),最新的立体匹配网络难以推广到新的环境,本文旨在设计一种可以很好推广到陌生场景下的立体匹配网络(DSMNet)。

SFM相关

1、DeepSFM: Structure From Motion Via Deep Bundle Adjustment

文章链接:https://arxiv.org/pdf/1912.09697.pdf

2、Privacy Preserving Structure-from-Motion

Paper未开放

其它作品

1、DeepFit: 3D Surface Fitting by Neural Network Weighted Least Squares

文章链接:https://arxiv.org/pdf/2003.10826.pdf

论文提出了一种用于非结构化3D点云的表面拟合方法,称为DeepFit的方法并入了一个神经网络,以学习加权最小二乘多项式曲面拟合的逐点权重。

2、DeepHandMesh: Weakly-supervised Deep Encoder-Decoder Framework for High-fidelity Hand Mesh Modeling from a Single RGB Image

Paper未开放

3、Mask2CAD: 3D Shape Prediction by Learning to Segment and Retrieve

Paper未开放

本文仅做学术分享,如有侵权,请联系删文。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 3D视觉工坊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 点云相关
    • 1、Quaternion Equivariant Capsule Networks for 3D Point Clouds
      • 2、Intrinsic Point Cloud Interpolation via Dual Latent Space Navigation
        • 3、PointMixup: Augmentation for Point Clouds
          • 4、PointContrast: Unsupervised Pretraining for 3D Point Cloud Understanding
          • 三维重建
            • 1、Ladybird: Deep Implicit Field Based 3D Reconstruction with Sampling and Symmetry
              • 2、Deep Fashion3D: A Dataset and Benchmark for 3D Garment Reconstruction from Single-view Images
                • 3、Combining Implicit Function Learning and Parametric Models for 3D Human Reconstruction
                  • 4、Coherent full scene 3D reconstruction from a single RGB image
                    • 5、Deep Reflectance Volumes: Relightable Reconstructions from Multi-View Photometric Images
                    • 场景识别
                      • 1、ReferIt3D: Neural Listeners for Fine-Grained 3D Object Identification in Real-World Scenes
                      • 3D检测与识别
                        • 1、RTM3D: Real-time Monocular 3D Detection from Object Keypoints for Autonomous Driving
                        • 姿态估计
                          • 1、Self6D: Self-Supervised Monocular 6D Object Pose Estimation
                            • 2、End-to-End Estimation of Multi-Person 3D Poses from Multiple Cameras
                              • 3、Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View Geometry
                                • 4、Towards Part-aware Monocular 3D Human Pose Estimation: An Architecture Search Approach
                                  • 5、Adaptive Computationally Efficient Network for Monocular 3D Hand Pose Estimation
                                  • 深度估计
                                    • 1、Du^2Net: Learning Depth Estimation from Dual-Cameras and Dual-Pixels
                                    • 立体视觉
                                      • 1、Learning Stereo from Single Images
                                        • 2、Domain-invariant Stereo Matching Networks
                                        • SFM相关
                                          • 1、DeepSFM: Structure From Motion Via Deep Bundle Adjustment
                                            • 2、Privacy Preserving Structure-from-Motion
                                            • 其它作品
                                              • 1、DeepFit: 3D Surface Fitting by Neural Network Weighted Least Squares
                                                • 2、DeepHandMesh: Weakly-supervised Deep Encoder-Decoder Framework for High-fidelity Hand Mesh Modeling from a Single RGB Image
                                                  • 3、Mask2CAD: 3D Shape Prediction by Learning to Segment and Retrieve
                                                  相关产品与服务
                                                  图像处理
                                                  图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
                                                  领券
                                                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档