计算机视觉工坊

127 篇文章
9.4K 次阅读
23 人订阅

全部文章

计算机视觉

PointTrackNet:一种用于点云三维目标检测和跟踪的端到端网络

当前基于机器学习的多目标跟踪(MOT)框架在3-D点云跟踪场景中变得越来越流行。大多数传统的跟踪方法都使用滤波器(例如,卡尔曼滤波器或粒子滤波器)来按时间顺序预...

4810
计算机视觉

分布式深度学习最佳入门(踩坑)指南

本文主要介绍了分布式深度学习的各框架以及一些分布式深度学习训练中的常见问题,如:docker及ssh环境问题、nccl多机通信问题等。

11820
计算机视觉

EF-Net一种适用于双流SOD的有效检测模型(Pattern Recognition)

显著目标检测(SOD)在计算机视觉领域得到了广泛的关注。但面临低质量的深度图,现有模型的检测结果都不是很理想。为了解决这一问题,该文提出了一种新型多模态增强融合...

7110
计算机视觉

一文详解ORB-SLAM3中的地图管理

想要理解ORB-SLAM3的地图管理,仅看ORB-SLAM3的论文[3]是不够的,因为很多细节出现在之前的ORB-SLAM1/2[1][2],以及ORB-Atl...

3910
计算机视觉

C++实现yolov5的OpenVINO部署

本文编辑的时间是2020年12月3日,官方最新的releases是v3.1,在v3.0的版本中,官网有如下的声明

5710
计算机视觉

ACM ICMR 2021雷达目标检测挑战赛(ROD2021)

ACM ICMR 2021雷达目标检测挑战赛(ROD2021),主要任务是在无人驾驶应用背景下,基于车载雷达频谱图(RF Images)检测常见道路目标。

5620
计算机视觉

综述:图像滤波常用算法实现及原理解析

来源丨https://zhuanlan.zhihu.com/p/279602383

4820
计算机视觉

无需NMS的目标检测,OneNet

目标检测是计算机视觉领域的基础性任务之一,并且赋能大量的下游应用。当前目标检测器存在的一大挑战是标签分配问题。特别地,如何定义每个目标的正样本和背景的负样本始终...

5630
计算机视觉

Papers with Code 2020 全年回顾(顶流论文+顶流代码+Benchmarks)

2020年Papers with Code 中最顶流的论文,代码和benchmark。

3210
计算机视觉

格雷码编码+解码+实现(Python)

01 二值码 02 格雷码编码 2.1 编码优点 2.2 编码生成 2.3 递归生成 2.4 二值码转换 2.5 编码图 03 格雷码投影 3.1 投影图案生成...

2910
计算机视觉

3D相机的数据处理方式

在上一篇中,我们介绍了什么是3D相机。但是对于初次接触3D相机的同学,可能首先面临的问题是如何处理3D相机得到的数据。3D相机的数据分为两种方式:三维点云数据方...

6120
计算机视觉

使用Python+OpenCV+yolov5实现行人目标检测

目标检测支持许多视觉任务,如实例分割、姿态估计、跟踪和动作识别,这些计算机视觉任务在监控、自动驾驶和视觉答疑等领域有着广泛的应用。随着这种广泛的实际应用,目标检...

4610
计算机视觉

基于尺寸划分的RGB显著物体检测方法

SDCNet: Size Divide and Conquer Network for Salient Object Detection

5510
计算机视觉

相位偏折术原理概述

相位偏折术是一个比较冷门的方向,主要用于测量镜面物体。一直以来,干涉法都是测量镜面最佳方法,精度可以达到波长的几百分之一,但是有一些局限性:

6520
计算机视觉

多视图立体匹配论文分享:P-MVSNet

论文题目:P-MVSNet: Learning Patch-wise Matching Confidence Aggregation for Multi-Vie...

7220
计算机视觉

结构光相移法-多频外差原理+实践(上)

结构光法原理其实是跟双目视觉一样的,都是要确定对应“匹配点”,利用“视差”三角关系计算距离,所不同的是:

6310
计算机视觉

基于MAP-MRF的视差估计

此篇文章作为本人对马尔科夫随机场等概率模型在立体视觉的应用的首篇记录,包含了本人对马尔科夫场理论的浅显理解和最大后验概率估计方法的理解。囿于本人学术水平,此篇文...

4710
计算机视觉

用于类别级物体6D姿态和尺寸估计的标准化物体坐标空间

本文的目的是估计RGB-D图像中未见过的对象实例的6D姿态和尺寸。与“实例级”6D姿态估计任务相反,我们的问题假设在训练或测试期间没有可用的精确对象CAD模型。...

5830
计算机视觉

用于视频超分辨率的可变形三维卷积

方法:提出了一个利用可变形3D卷积(D3D)的可变形三维卷积网络(D3Dnet)来整合视频的时空信息

6710
计算机视觉

ORB-SLAM3 单目地图初始化(终结篇)

请阅读本文之前最好把ORB-SLAM3的单目初始化过程再过一遍(ORB-SLAM3 细读单目初始化过程(上)、超详细解读ORB-SLAM3单目初始化(下篇)),...

9420

扫码关注云+社区

领取腾讯云代金券