首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

真实场景的虚拟视点合成(View Synthsis)详解

上一篇博客中介绍了从拍摄图像到获取视差图以及深度图的过程,现在开始介绍利用视差图或者深度图进行虚拟视点的合成。虚拟视点合成是指利用已知的参考相机拍摄的图像合成出参考相机之间的虚拟相机位置拍摄的图像,能够获取更多视角下的图片,在VR中应用前景很大。   视差图可以转换为深度图,深度图也可以转换为视差图。视差图反映的是同一个三维空间点在左、右两个相机上成像的差异,而深度图能够直接反映出三维空间点距离摄像机的距离,所以深度图相较于视差图在三维测量上更加直观和方便。 利用视差图合成虚拟视点 利用深度图合成虚拟视

03

SIGGRAPH | 6个惯性传感器和1个手机实现人体动作捕捉、定位与环境重建

机器之心专栏 机器之心编辑部 近年来,基于惯性的人体动作捕捉技术迅速发展。它们通过在人体上穿戴惯性传感器,实时测量人体的运动信息。然而,这就好比一个人在蒙着眼睛走路——我们可以感受到身体的运动,但随着时间的累积,我们越来越难以确定自己的位置。 本文则试图打开惯性动作捕捉的「眼睛」。通过额外佩戴一个手机相机,我们的算法便有了「视觉」。它可以在捕获人体运动的同时感知环境信息,进而实现对人体的精确定位。该项研究来自清华大学徐枫团队,已被计算机图形学领域国际顶级会议SIGGRAPH2023接收。 论文地址:htt

05

基于深度学习的单目深度估计综述

深度估计是计算机视觉领域的一个基础性问题,其可以应用在机器人导航、增强现实、三维重建、自动驾驶等领域。而目前大部分深度估计都是基于二维RGB图像到RBG-D图像的转化估计,主要包括从图像明暗、不同视角、光度、纹理信息等获取场景深度形状的Shape from X方法,还有结合SFM(Structure from motion)和SLAM(Simultaneous Localization And Mapping)等方式预测相机位姿的算法。其中虽然有很多设备可以直接获取深度,但是设备造价昂贵。也可以利用双目进行深度估计,但是由于双目图像需要利用立体匹配进行像素点对应和视差计算,所以计算复杂度也较高,尤其是对于低纹理场景的匹配效果不好。而单目深度估计则相对成本更低,更容易普及。

02

ICCV 2021 | BA NeRF 神经辐射场 (BARF)

Neural Radiance Fields (NeRF) 最近在计算机视觉领域获得了极大的关注,它提供了一种崭新的合成真实世界场景新视角的方法。然而,NeRF的一个局限性是它需要准确的相机位姿来学习场景表征。本文提出了一种 Bundle-Adjusting Neural Radiance Fields(BARF)算法,用于从不够准确(甚至是未知)的相机姿势中训练NeRF,可用于同时学习3D表征以及完成相机注册。本文从理论上建立了与经典图像对齐(image alignment)之间的联系,并阐明从粗到细的相机注册也适用于NeRF。此外,本文还发现,在NeRF中简单地使用位置编码对合成目标有负面影响(本文有改进)。在合成和真实世界数据上的实验表明,BARF可以有效地优化神经场景表征,并同时解决摄像机的姿势的错位。这使得视频序列的视图合成和来自未知摄像机姿势的定位成为可能,这为视觉定位系统(如SLAM)开辟了新的途径,也为密集的3D重建提供了潜在的应用。

02
领券