首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

从单幅图像到双目立体视觉的3D目标检测算法(长文)

经典的计算机视觉问题是通过数学模型或者统计学习识别图像中的物体、场景,继而实现视频时序序列上的运动识别、物体轨迹追踪、行为识别等等。然而,由于图像是三维空间在光学系统的投影,仅仅实现图像层次的识别是不够的,这在无人驾驶系统、增强现实技术等领域表现的尤为突出,计算机视觉的更高层次必然是准确的获得物体在三维空间中的形状、位置、姿态,通过三维重建技术实现物体在三维空间的检测、识别、追踪以及交互。近年来,借助于二维图像层面的目标检测和识别的性能提升,针对如何恢复三维空间中物体的形态和空间位置,研究者们提出了很多有效的方法和策略。

02

从单幅图像到双目立体视觉的3D目标检测算法

经典的计算机视觉问题是通过数学模型或者统计学习识别图像中的物体、场景,继而实现视频时序序列上的运动识别、物体轨迹追踪、行为识别等等。然而,由于图像是三维空间在光学系统的投影,仅仅实现图像层次的识别是不够的,这在无人驾驶系统、增强现实技术等领域表现的尤为突出,计算机视觉的更高层次必然是准确的获得物体在三维空间中的形状、位置、姿态,通过三维重建技术实现物体在三维空间的检测、识别、追踪以及交互。近年来,借助于二维图像层面的目标检测和识别的性能提升,针对如何恢复三维空间中物体的形态和空间位置,研究者们提出了很多有效的方法和策略。

04

南开提出 Range-View | 激光雷达技术新进展在自动驾驶等多任务中的应用

激光雷达测距传感器在安全关键型应用中(例如,自动驾驶中的目标检测和全景分割)发挥着至关重要的作用,它可以在不考虑光照条件的情况下提供精确的3D环境测量。然而,激光雷达点云本质上是非均匀的、无序的且稀疏的,这禁止了高度优化算子(如卷积)的直接应用。解决此问题的一种方法是在点云中首先建立一个邻域结构,通过昂贵的半径搜索或最近邻搜索,然后在局部邻域中应用性能卷积算子[5, 23, 27, 36]。另一种方法是通过对输入点进行量化创建规则的 Voxel 栅格[8, 35, 41, 42, 43]或 Voxel 柱[15, 16, 26, 39, 43],这不可避免地会导致信息丢失。尽管这些算法取得了巨大成功,但利用点集和 Voxel 栅格的算法通常需要繁重的计算,这给在实时自主系统中扩展它们带来了挑战。相比之下,距离图像以无损的方式将3D数据组织成结构化的2D视觉表示。因此,距离图像无疑是所有激光雷达点云数据表示中最为紧凑和高效的。

01

BMVC 2018 | 最佳学生论文:EPFL&FAIR提出QuaterNet,更好地解决人类动作建模问题

对人类动作进行建模对于许多应用都很重要,包括动作识别 [12, 34]、动作检测 [49] 及计算机图形学 [22] 等。最近,神经网络被用于 3D 骨骼关节部位序列的长 [22, 23] 、短 [14, 37] 期预测。神经方法在其他模式识别任务中非常成功 [5, 20, 29]。人类动作是一种带有高级内在不确定性的随机序列过程。给定一个观察的姿势序列,未来的丰富姿势序列与之相似。因此,内在不确定性意味着,即使模型足够好,在预测未来姿势的一个长序列时,相隔时间较长的未来预测不一定能够匹配推断记录。因此,相关研究通常将预测任务分为长期预测和短期预测。短期任务通常被称为预测任务,可以通过距离度量将预测与参考记录进行比较来定量评估。长期任务通常被称为生成任务,更难定量评估。在这种情况下,人类评估至关重要。

01

【京准分享】GPS北斗共视授时中的多径效应分析

在国防建设、国民经济和基础科学研究中,离不开时间频率的作用,它也是一个重要的基本物理量。精确度高的时间频率对我国的通信事业以及国防建设等起着重要的意义。GPS/北斗共视授时作为目前时间频率远距离量值传递的主要方法之一,传递不确定度可达几个纳秒。该技术也是目前国际计量局(BIPM)用于国际原子时合作的基本手段之一。 众所周知,GPS北斗授时具有很高的精度,但也有卫星钟差。GPS北斗共视授时却可以消除,但不能完全消除非共同的误差,这些误差成为影响GPS北斗共视测量精度的主要因素。这些限制性因素主要包括:对流层延迟误差、电离层时延误差、卫星信号多径干扰误差、接收机位置误差、几何时延误差以及接收机内部误差等。 本文详细研究了共视授时技术,阐述了基本原理,给出了数学模型,同时分析了共视授时的主要误差之一——多径干扰误差,在该基础上分析了目前抗多径的方法,再探讨了GPS北斗共视授时中具体抗多径干扰的方案。该结论对提高共视授时实验的精确性有一定的参考价值。

00
领券