开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

OpenCV -从2d图像点正确地恢复姿态和地标位置

OpenCV是一个开源的计算机视觉库，它提供了一系列用于图像和视频处理的函数和算法。它是一种广泛使用的计算机视觉库，用于在计算机视觉领域进行图像处理、特征提取、目标识别和跟踪、摄像机标定、3D重建等任务。

OpenCV的优势包括：

开源免费：OpenCV是一个开源库，可以免费使用和修改，这使得它成为许多计算机视觉项目的首选。
跨平台支持：OpenCV可以在多个操作系统上运行，包括Windows、Linux、MacOS等，同时支持多种编程语言，如C++、Python、Java等，使开发者能够在不同平台上进行开发。
强大的图像处理功能：OpenCV提供了丰富的图像处理函数和算法，包括图像滤波、边缘检测、图像分割、形态学操作、颜色空间转换等，可以满足各种图像处理需求。
目标检测和跟踪：OpenCV提供了多种目标检测和跟踪算法，如Haar特征检测、HOG特征检测、卷积神经网络等，可以用于人脸识别、行人检测、车辆跟踪等应用。
三维重建和摄像机标定：OpenCV提供了用于三维重建和摄像机标定的函数和算法，可以从多个图像中恢复出场景的三维结构和摄像机的参数。
社区支持：OpenCV拥有庞大的开发者社区，提供了丰富的文档、教程和示例代码，开发者可以通过社区获取帮助和交流经验。

对于从2D图像正确地恢复姿态和地标位置的问题，可以使用OpenCV中的相机标定和姿态估计技术来解决。相机标定是通过对已知空间点的观察来计算相机的内部和外部参数，从而实现从像素坐标到真实世界坐标的转换。姿态估计是根据相机标定的结果和特征点在图像中的位置，计算相机在三维空间中的姿态。

以下是一些相关的腾讯云产品和产品介绍链接地址，可以用于支持相机标定和姿态估计的开发：

腾讯云图像识别：提供了多种图像处理和分析功能，包括图像识别、人脸识别、人脸融合等。可以用于检测和识别图像中的地标。
腾讯云弹性MapReduce：提供了大规模数据处理和分析的云服务，可用于处理和分析从相机获取的大量图像数据。
腾讯云人工智能计算服务：提供了深度学习和机器学习的云服务，包括图像识别、目标检测等功能，可用于姿态估计。

请注意，以上提到的腾讯云产品仅作为示例，其他厂商也可能提供类似的云服务。同时，具体选择哪个产品需要根据实际需求和项目要求来决定。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

一文了解动态场景中的SLAM的研究现状

常规的SLAM算法首先假设环境中所有物体均处于静止的状态。而一些能够在动态环境中运行的SLAM系统，只是将环境中的动态物体视为异常值并将他们从环境中剔除，再使用常规的SLAM算法进行处理。这严重影响SLAM在自动驾驶中的应用。

02

OpenCV 4基础篇| OpenCV简介

01

PL-VINS:实时基于点线的单目惯导SLAM系统

标题：PL-VINS: Real-Time Monocular Visual-Inertial SLAM with Point and Line

03

基于语义地图的单目定位用于自动驾驶车辆

文章：Monocular Localization with Semantics Map for Autonomous Vehicles

01

最新SOTA！隐式学习场景几何信息进行全局定位

全局视觉定位是指利用单张图像，根据已有的地图，估计相机的绝对姿态（位置和方向）。这种技术可以应用于机器人和增强/虚拟现实等领域。这篇文章的主要贡献是提出了一种利用姿态标签来学习场景的三维几何信息，并利用几何信息来估计相机姿态的方法。具体来说，作者设计了一个学习模型，它可以从图像中预测两种三维几何表示（X, Y, Z坐标），一种是相机坐标系下的，另一种是全局坐标系下的。然后，通过将这两种表示进行刚性对齐，就可以得到与姿态标签匹配的姿态估计。这种方法还可以引入额外的学习约束，比如最小化两种三维表示之间的对齐误差，以及全局三维表示和图像像素之间的重投影误差，从而提高定位精度。在推理阶段，模型可以实时地从单张图像中估计出场景的三维几何信息，并通过对齐得到姿态。作者在三个常用的视觉定位数据集上进行了实验，进行了消融分析，并证明了他们的方法在所有数据集上都超过了现有的回归方法的姿态精度，并且可以实时地从单张图像中估计出场景的三维几何信息，并通过对齐得到姿态。

02

从单幅图像到双目立体视觉的3D目标检测算法（长文）

经典的计算机视觉问题是通过数学模型或者统计学习识别图像中的物体、场景，继而实现视频时序序列上的运动识别、物体轨迹追踪、行为识别等等。然而，由于图像是三维空间在光学系统的投影，仅仅实现图像层次的识别是不够的，这在无人驾驶系统、增强现实技术等领域表现的尤为突出，计算机视觉的更高层次必然是准确的获得物体在三维空间中的形状、位置、姿态，通过三维重建技术实现物体在三维空间的检测、识别、追踪以及交互。近年来，借助于二维图像层面的目标检测和识别的性能提升，针对如何恢复三维空间中物体的形态和空间位置，研究者们提出了很多有效的方法和策略。

02

OA-SLAM：在视觉SLAM中利用物体进行相机重定位

文章：OA-SLAM: Leveraging Objects for Camera Relocalization in Visual SLAM

02

用 Python 实现抖音尬舞机

如今说到体感游戏，大家一定都不陌生，比如微软的 Kinect、任天堂的 Switch，都曾是游戏业的革命性产品。而另一款网红产品—抖音，也在去年底上线过一个“尬舞机”的音乐体感游戏（现在成了隐藏功能）：

02

基于简化点云地图的语义边缘对齐的单目定位方法

标题：Compact 3D Map-Based Monocular Localization Using Semantic Edge Alignment

06

汇总|3D人脸重建算法

项目链接：http://cvlab.cse.msu.edu/project-nonlinear-3dmm.html

02

自动驾驶车辆在结构化场景中基于HD-Map由粗到精语义定位

文章：Coarse-to-fine Semantic Localization with HD Map for Autonomous Driving in Structural Scenes

03

【世界最大人脸对齐数据集】ICCV 2017：距离解决人脸对齐已不远

【新智元导读】在一篇已经被ICCV 2017接收的论文中，诺丁汉大学的研究人员提出了他们号称是迄今最大3D人脸对齐数据集，以及精准实现2D、3D以及2D到3D人脸对齐的网络。研究人员用《我们距离解决2D&3D人脸对齐问题还有多远》为题，首次调查了在所有现有2D人脸对齐数据集和新引入的大型3D数据集上，距离达到接近饱和性能（saturating performance）还有多远。 ImageNet百万级精准标记数据集开启了图像识别新时代，人们也由此意识到，数据跟算法同样重要。为了构建更好的模型和算法，越来越多

09

谷歌AI良心开源：一部手机就能完成3D目标检测，还是实时的那种

这就是谷歌AI今天发布的MediaPipe Objectron，一个可以实时3D目标检测的pipeline。

00

手眼标定_全面细致的推导过程

第一步：眼睛观察到三维世界，并将其转换到视网膜平面（三维空间转换到二维平面）传送信息给大脑；

02

二维已经 OUT 了？3DPose 实现三维人体姿态识别真香 | 代码干货

作者|李秋键出品|AI科技大本营(ID:rgznai100) 引言人体姿态估计是计算机视觉领域很多研究工作的基础，也是研究的热点问题，在行为识别、人机交互、姿态跟踪等领域有着广泛的应用前景。按照人体姿态维度的差异，可以将人体姿态估计任务分为二维人体姿态估计和三维人体姿态估计。2D人体姿态估计的目标是定位并识别出人体关键点，将这些关键点按照关节顺序相连形成在图像二维平面的投影，从而得到人体骨架。3D人体姿态估计的主要任务是预测出人体关节点的三维坐标位置和角度等信息。在实际应用中，由于3D姿态估计在2D

02

RD-VIO: 动态环境下移动增强现实的稳健视觉惯性里程计

文章：RD-VIO: Robust Visual-Inertial Odometry for Mobile Augmented Reality in Dynamic Environments

01

从不同场景地图的视角对单目相机进行重定位的方案综述

文章：A Survey on Monocular Re-Localization: From the Perspective of Scene Map Representation

01

代码开源！在大型户外环境中基于路标的视觉语义SLAM

标题：Visual Semantic SLAM with Landmarks for Large-Scale Outdoor Environment

02

maplab 2.0 多模态模块化建图框架

文章：maplab 2.0 – A Modular and Multi-Modal Mapping Framework

02

一个通用的多相机视觉SLAM框架的设计和评估

文章：Design and Evaluation of a Generic Visual SLAM Framework for Multi-Camera Systems

03

实用技巧 | 使用OpenCV进行模糊检测

可能这就是所谓的举一反三吧，其实相机自动对焦的一种较为简单的实现就是，相对于目标物体，前后移动相机并检测当前图像的清晰（模糊）度，选择一个最清晰的位置。废话不多说了，看看文章是如何实现的吧。

02

视觉导航定位系统工作原理及过程

当今,由于数字图像处理和计算机视觉技术的迅速发展,越来越多的研究者采用摄像机作为全自主用移动机器人的感知传感器。这主要是因为原来的超声或红外传感器感知信息量有限,鲁棒性差,而视觉系统则可以弥补这些缺点。而现实世界是三维的，而投射于摄像镜头（CCD/CMOS）上的图像则是二维的，视觉处理的最终目的就是要从感知到的二维图像中提取有关的三维世界信息。

03

使用OpenCV进行模糊检测（拉普拉斯算子）

这只超可爱、超活跃家养小猎犬可能是有史以来拍照次数最多的狗。从8周大我们得到它的时候，到现在，不到3年的时间，我们已经收集了6000多张狗狗的照片。

01

DOPE:基于蒸馏网络的全身三维姿态估计

本论文提出一种检测和估计全身三维人体姿态的方法（身体，手，人脸），该方法的挑战主要在于带标签的3D全身姿态。大多数之前的工作将标注好的数据单独应用于身体，人手，或者人脸当中。在这项工作中，本文提出利用这些数据集来训练各个部分的独立专家模型，即身体、手和脸的模型，并将他们的知识提取到一个单一的深度网络中，用于全身的2D-3D位姿检测。在实际应用中，针对一幅有部分标注或没有标注的训练图像，各部分专家模型分别对其二维和三维关键点子集进行检测，并将估计结果结合起来得到全身伪真实标注姿态。蒸馏损失引导整个身体的预测结果尽量模仿专家模型的输出。

02

基于机器学习随机森林方式的姿态识别算法

由于是基于像素级的训练，所以需要每个像素都需要标签，这个标签包括每个像素所属的类别以及对应的三维空间坐标。

01

Python+OpenCV+OpenPose实现人体姿态估计（人体关键点检测）

人体姿态估计（Human Posture Estimation），是通过将图片中已检测到的人体关键点正确的联系起来，从而估计人体姿态。

05

针对自主泊车的多相机视觉惯导同时定位与建图方案

文章：Multi-Camera Visual-Inertial Simultaneous Localization and Mapping for Autonomous Valet Parking

03

CVPR2021：单目实时全身动作捕捉（清华大学）

Monocular Real-time Full Body Capture with Inter-part Correlations

03

基于点线特征的激光雷达+单目视觉里程计

标题：Lidar-Monocular Visual Odometry using Point and Line Features

02

基于点线特征的激光雷达单目视觉里程计

论文阅读模块将分享点云处理，SLAM，三维视觉，高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享，欢迎各位加入我，我们一起每天一篇文章阅读，开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。

01

OpenCV4.5.1 | 使用一行代码将图像匹配性能提高14%

opencv4.5.1中最令人兴奋的特性之一是BEBLID（Boosted effective Binary Local Image Descriptor），它是一种新的描述符，能够在减少执行时间的同时提高图像匹配精度！本文将向你展示一个具体的例子，所有源代码都存储在此GitHub存储库中：

03

浙江大学提出的RD-VIO: 动态环境中稳健视觉惯性里程计增强现实技术

文章：RD-VIO: Robust Visual-Inertial Odometry for Mobile Augmented Reality in Dynamic Environments

01

3D鸟类重建—数据集、模型以及从单视图恢复形状

代码、项目、论文地址：在公众号「计算机视觉工坊」，后台回复「3D鸟类重建」，即可直接下载。

01

ECCV 2020 | 基于分割一致性的单目自监督三维重建

本文主要从二维图像及其轮廓的集合中，学习一个自监督的、单视图的三维重建模型，预测目标物体的3D网格形状、纹理和相机位姿。提出的方法不需要3D监督、注释的关键点、物体的多视图或者一个先验的网格模板。关键之处在于，物体可以表示为可形变部分的集合，在同一类别的不同实例中，每个部分在语义上是一致的。

03

基于对应点的6D姿态识别

最近读取了一些针对Corresponding-based方法的6D姿态识别paper，在这里分享下思路。

01

大盘点|6D姿态估计算法汇总(上)

主要思想：用于从RGB-D图像中估计一组已知对象的6D位姿，分别处理两个数据源，并使用一种新的dense fusion network来提取像素级的 dense feature embedding，并从中估计姿态。实验结果表明，该方法在YCB-Video和Linemod两种数据集上均优于现有的方法。论文还将所提出的方法应用到一个真实的机器人上，根据所估计的姿态来抓取和操纵物体。

02

5_相机标定2_calibrateCamera()与内外参

https://docs.opencv.org/4.8.0/d4/d94/tutorial_camera_calibration.html

01

DSP-SLAM：具有深度形状先验的面向对象SLAM

文章：DSP-SLAM: Object Oriented SLAM with Deep Shape Priors

03

OnePose: 无CAD模型的one-shot物体姿态估计（CVPR 2022）

OnePose: One-Shot Object Pose Estimation without CAD Models

02

Openpose+Tensorflow 这样实现人体姿态估计 | 代码干货

人体姿态估计指从单个 RGB 图像中精确地估计出人体的位置以及检测骨骼关键点的位置。人体姿态估计是计算机视觉领域的研究热点，是诸多计算机视觉任务的基础，如动作分类、异常行为检测、自动驾驶等。

09

PLV-IEKF：基于点、线，消失点一致性的视觉惯性里程计方案

文章：PLV-IEKF: Consistent Visual-Inertial Odometry using Points, Lines, and Vanishing Points

01

汇总 | OpenCV4中的非典型深度学习模型

前面给大家分别汇总了OpenCV中支持的图像分类与对象检测模型，视觉视觉任务除了分类与检测还有很多其他任务，这里我们就来OpenCV中支持的非分类与检测的视觉模型汇总一下。注意一点，汇总支持的模型都是OpenCV4.4 Github上已经提供的，事实上除了官方的提供的模型，读者还可以自己探索更多非官方模型支持。这里的汇总模型主要来自OpenCV社区官方测试过的。

02

从单幅图像到双目立体视觉的3D目标检测算法

经典的计算机视觉问题是通过数学模型或者统计学习识别图像中的物体、场景，继而实现视频时序序列上的运动识别、物体轨迹追踪、行为识别等等。然而，由于图像是三维空间在光学系统的投影，仅仅实现图像层次的识别是不够的，这在无人驾驶系统、增强现实技术等领域表现的尤为突出，计算机视觉的更高层次必然是准确的获得物体在三维空间中的形状、位置、姿态，通过三维重建技术实现物体在三维空间的检测、识别、追踪以及交互。近年来，借助于二维图像层面的目标检测和识别的性能提升，针对如何恢复三维空间中物体的形态和空间位置，研究者们提出了很多有效的方法和策略。

04

Ground-VIO：在线标定相机-地面参数的单目视觉惯性里程计

文章：Ground-VIO: Monocular Visual-Inertial Odometry with Online Calibration of Camera-Ground Geometric Parameters

02

一种实时轻量级3D人脸对齐方法

论文链接： https://xueshu.baidu.com/usercenter/paper/show?paperid=1e090pe0h36k0m002a7q06d0at215203&site=x

02

ECCV 2020 | PHOSA：一种基于单目图像的人-物重建方法

作者提出了一种能够推断出人类和物体的形状和空间排列的方法，只需要一张在自然环境中捕捉的图像，且不需要任何带有3D监督的数据集。该方法的主要观点是，将人类和物体结合起来考虑，这样会产生“三维常识”，可以用来消除歧义。验证表明，该方法可以极大地减少物体的三维空间，达到更好的效果，作者在含有人类和大型物体的图像上面展示了该方法(如自行车、摩托车和冲浪板)。最后作者分析了该方法在恢复人类和物体之间的空间排列方面的能力，并概述了在这个相对未被探索的领域中仍存在的挑战。

03

ROS示例----TIAGo教程

TIAGo机器人在机器人/ TIAGo /教程中提供了一套全面的教程。教程使用Gazebo模拟器，目前包含如何使用OpenCV，PCL，自主导航，MoveIt的教程！和人机器人互动。

03

简单明了，一文入门视觉SLAM

【导读】SLAM是“Simultaneous Localization And Mapping”的缩写，可译为同步定位与建图。最早，SLAM 主要用在机器人领域，是为了在没有任何先验知识的情况下，根据传感器数据实时构建周围环境地图，同时根据这个地图推测自身的定位。因此本文以简单清晰的文字为大家介绍了视觉 V-SLAM。

02

交互式相机标定的高效位姿选择方法

平面图案标定姿势的选择很少被考虑——但标定精度很大程度上取决于它。本文提出了一种姿态选择方法，可以找到一个紧凑和鲁棒的标定姿态集，并适合于交互式标定。奇异的姿态会导致解决方案不可靠，而减少姿态的不确定度对标定有利的。为此，我们使用不确定性传播原理。

02

基于图像语义的视觉同步定位和建图综述：面向应用的移动机器人自主导航解决方案

论文名称: A survey of image semantics-based visual simultaneous localization and mapping Application-oriented solutions to autonomous navigation of mobile robots 作者: Linlin Xia, Jiashuo Cui, Ran Shen, Xun Xu, Yiping Gao and Xinying Li

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭