如何在Autodesk Forge中获取相机位置的中心？ - 腾讯云开发者社区

我们的手机屏幕是一个2D的平面，所以也没办法直接显示3D的信息，因此我们看到的所有3D效果都是3D在2D平面的投影而已，而本文中的Camera主要作用就是这个，将3D信息转换为2D平面上的投影，实际上这个类更像是一个操作Matrix的工具类，使用Camera和Matrix可以在不使用OpenGL的情况下制作出简单的3D效果。

OA-SLAM：在视觉SLAM中利用物体进行相机重定位

文章：OA-SLAM: Leveraging Objects for Camera Relocalization in Visual SLAM

您找到你想要的搜索结果了吗？

是的

没有找到

深入研究自监督单目深度估计：Monodepth2

BAD SLAM | 直接法实时BA+RGBD基准数据集（CVPR2019）

本文解读的论文为发表于CVPR 2019的 "Schops, Thomas, Torsten Sattler, and Marc Pollefeys. Bad slam: Bundle adjusted direct rgb-d slam. Proceedings of the IEEE conference on computer vision and pattern recognition. 2019."

基于 HTML5 WebGL 的楼宇智能化集成系统（一）

随着现代通信技术、计算机技术、控制技术的飞速发展，智能建筑已经成为现代建筑发展的主流。智能建筑是以建筑物为平台，兼备信息设施系统、信息化应用系统、建筑设备管理系统、公共安全系统等。集结构、系统、服务、管理及其优化组合为一体，向人们提供一个安全、高效、便携、节能、环保、健康的建筑环境。

Unity Cinemachine插件全功能详解

实现电影级别的分镜，推拉式镜头等，需要2017以上的版本才能使用，配合TimeLine一起使用，和Animator一起.

简单四步学会在数字孪生可视化场景中创建小地图！

众所周知，小地图在游戏中是至关重要的，小地图用于显示周围环境信息。在数字孪生可视化场景中小地图也是经常应用于场景中的，用来显示地图或者当前场景的视角。首先，小地图是以主角为中心的。其次，小地图上应该用图标来代替真实的人物或者物体模型，因为小地图通常很小，可能无法看清真实的模型。

谷歌AI良心开源：一部手机就能完成3D目标检测，还是实时的那种

这就是谷歌AI今天发布的MediaPipe Objectron，一个可以实时3D目标检测的pipeline。

国防科技大学提出ROSEFusion，实现快速相机移动下的高精度在线RGB-D重建

机器之心专栏国防科技大学徐凯教授团队近日，国防科技大学徐凯教授团队提出了基于随机优化求解快速移动下的在线 RGB-D 重建方法 ROSEFusion，在无额外硬件辅助的条件下，仅依靠深度信息，实现了最高 4 m/s 线速度、6 rad/s 角速度相机移动下的高精度在线三维重建。自 2011 年 KinectFusion 问世以来，基于 RGB-D 相机的实时在线三维重建一直是 3D 视觉和图形领域的研究热点。10 年间涌现出了大量优秀的方法和系统。如今，在线 RGB-D 重建已在增强现实、机器人等领

Colmap-PCD：一种用于图像到点云配准的开源工具

文章：Colmap-PCD: An Open-source Tool for Fine Image-to-point cloud Registration

BAD SLAM | 直接法实时BA+RGBD基准数据集（CVPR2019）

论文解读：BAD SLAM | 直接法实时BA+RGBD基准数据集（CVPR2019）

基于特征点的视觉全局定位技术

作者简介：英年早肥，美团无人配送平台，地图与定位组成员，负责视觉定位、里程计相关算法，致力于在流浪地球前实现自动驾驶

优化知多少之简述SLAM中的优化

在学习SLAM的过程中,我们会遇到各种BA问题,关于优化问题,有局部优化、全局优化、非线性优化、图优化、位姿图优化、BA优化等,那这些东西到底是什么意思? BA BA全称Bundle Adjustme

基础渲染系列（一）图形学的基石——矩阵

这是基础渲染课程系列的第一部分，主要涵盖变换矩阵相关的内容。如果你还不清楚Mesh是什么或者怎么工作的，可以转到Mesh Basics 相关的章节去了解（译注：Mesh Basics系列皆已经翻译完毕，但与本系列主题关联不大，讲完4个渲染系列之后，再放出来）。这个系列会讲，这些Mesh是如何最终变成一个像素呈现在显示器上的。

南加大提出NeROIC：还有什么不能渲染的？重建效果太强悍了

大家好，我是阿潘，今天给大家分享一篇最新的成果NeROIC，号称可以从在线图像集合获取对象表示的新方法，从具有不同相机、照明和背景的照片中捕获任意对象的高质量几何和材料属性！

SIGGRAPH 2023 | 6个惯性传感器和1个手机实现人体动作捕捉、定位与环境重建

本文则试图打开惯性动作捕捉的「眼睛」。通过额外佩戴一个手机相机，我们的算法便有了「视觉」。它可以在捕获人体运动的同时感知环境信息，进而实现对人体的精确定位。该项研究来自清华大学徐枫团队，已被计算机图形学领域国际顶级会议SIGGRAPH2023接收。

SIGGRAPH | 6个惯性传感器和1个手机实现人体动作捕捉、定位与环境重建

机器之心专栏机器之心编辑部近年来，基于惯性的人体动作捕捉技术迅速发展。它们通过在人体上穿戴惯性传感器，实时测量人体的运动信息。然而，这就好比一个人在蒙着眼睛走路——我们可以感受到身体的运动，但随着时间的累积，我们越来越难以确定自己的位置。本文则试图打开惯性动作捕捉的「眼睛」。通过额外佩戴一个手机相机，我们的算法便有了「视觉」。它可以在捕获人体运动的同时感知环境信息，进而实现对人体的精确定位。该项研究来自清华大学徐枫团队，已被计算机图形学领域国际顶级会议SIGGRAPH2023接收。论文地址：htt

基于相交线的立体平面SLAM

标题：Stereo Plane SLAM Based on Intersecting Lines

OpenGL 学习系列---观察矩阵

在 OpenGL 投影矩阵这篇文章中，讲述了 OpenGL 坐标系统中的投影矩阵，有两种类型的投影矩阵，分别是正交投影和透视投影。

VDO-SLAM ：一种动态目标感知的视觉SLAM系统

（VDO-SLAM ：A Visual Dynamic Object-aware SLAM System）

如何使用 SwiftUI 中新地图框架 MapKit

了解 iOS 17 中的 MapKit 后，我们会发现 Apple 引入了更适合 SwiftUI 的 API。

基于道路标线的城市环境单目定位

文章：Monocular Localization in Urban Environments using Road Markings

第167期：threejs最简单的例子

这部分的目的是简单介绍threejs的开发流程，从创建场景、设置相机、添加几何体到将几何体渲染到节界面上。同时引出几个在开发过程中容易忽略的概念，在后面的小节中将做详细的介绍。

【SLAM】视觉SLAM：一直在入门，从未到精通

上周的组会上，我给研一的萌新们讲解什么是SLAM，为了能让他们在没有任何基础的情况下大致听懂，PPT只能多图少字没公式，这里我就把上周的组会汇报总结一下。

ECCV 2018 | 国防科大、普林斯顿提出共面性检测网络：助力三维场景重建

共面性检测网络为解决这一问题提供了新的思路，并能够显著提升三维场景重建的质量。目前这项研究工作已被欧洲计算机视觉大会 (ECCV 2018) 收录，并被邀请赴会进行口头报告 (Oral Presentation)。

基于深度学习的单目深度估计综述

深度估计是计算机视觉领域的一个基础性问题，其可以应用在机器人导航、增强现实、三维重建、自动驾驶等领域。而目前大部分深度估计都是基于二维RGB图像到RBG-D图像的转化估计，主要包括从图像明暗、不同视角、光度、纹理信息等获取场景深度形状的Shape from X方法，还有结合SFM(Structure from motion)和SLAM(Simultaneous Localization And Mapping)等方式预测相机位姿的算法。其中虽然有很多设备可以直接获取深度，但是设备造价昂贵。也可以利用双目进行深度估计，但是由于双目图像需要利用立体匹配进行像素点对应和视差计算，所以计算复杂度也较高，尤其是对于低纹理场景的匹配效果不好。而单目深度估计则相对成本更低，更容易普及。

LaneDetection

（1）选择感兴趣的区域（ROI也就是车道线存在的区域）：我们利用架好相机的特点，使得相机拍摄的车道线位于图像的下半部分，也就是图像的下半部分是道路。

【手眼标定篇】九点标定

4点法、9点法、N点法都可以将图像坐标与机械手坐标联系起来。综合考虑调试难度、标定精度等因素，9点法标定是工业上使用广泛的二维手眼标定，常用于从固定平面抓取对象进行装配等工业应用场景。

ICCV 2021 | BA NeRF 神经辐射场 (BARF)

Neural Radiance Fields (NeRF) 最近在计算机视觉领域获得了极大的关注，它提供了一种崭新的合成真实世界场景新视角的方法。然而，NeRF的一个局限性是它需要准确的相机位姿来学习场景表征。本文提出了一种 Bundle-Adjusting Neural Radiance Fields（BARF）算法，用于从不够准确（甚至是未知）的相机姿势中训练NeRF，可用于同时学习3D表征以及完成相机注册。本文从理论上建立了与经典图像对齐（image alignment）之间的联系，并阐明从粗到细的相机注册也适用于NeRF。此外，本文还发现，在NeRF中简单地使用位置编码对合成目标有负面影响（本文有改进）。在合成和真实世界数据上的实验表明，BARF可以有效地优化神经场景表征，并同时解决摄像机的姿势的错位。这使得视频序列的视图合成和来自未知摄像机姿势的定位成为可能，这为视觉定位系统（如SLAM）开辟了新的途径，也为密集的3D重建提供了潜在的应用。

苹果发布 AI 生成模型 GAUDI，文字生成 3D 场景

前有DALL.E文本生成图像，现有将文字变成 3D场景。近日，苹果 AI 团队发布最新 AI 模型 GAUDI，它是基于 3D 场景的神经架构 NeRFs，可以根据文字生成 3D 室内场景。

基于WebGL无插件虚拟场景漫游关键技术（完整版）ThingJS

如果要构建一个具有交互性和拓展性的沉浸式漫游场景，常用到3DSMAX、three.js等软件技术，学习门槛较高；ThingJS可视化组件更加轻量化，B/S架构下的3D可视化应用构建更轻松，为不少企业客户降低了项目开发成本。

MSCKF-Based Visual-Wheel Odometry 轮速视觉融合里程计

Sliding Windows Filter（SWF）在VIO、SLAM这个领域应用非常广，比如MSCKF、OKVIS、VINS-Mono等等，几乎可以说是VIO的标配。

Unity Shader Graph 制作 Fade 淡入淡出效果

当相机与物体的距离越来越近，达到指定值时，我们让物体逐渐淡出，当相机与物体拉开距离后，再让其淡入，来处理当相机靠近物体时的穿模情况，效果图：

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐