首页
学习
活动
专区
工具
TVP
发布

计算机视觉life

专栏作者
115
文章
184034
阅读量
120
订阅数
SLAM 深度估计 三维重建 标定 传感器融合
经常有粉丝问视觉/激光/SLAM、三维重建等方向的学习路线,这里我再总结给大家,如下所示:
用户1150922
2022-05-10
1.1K0
详解深度学习三维重建网络:MVSNet、PatchMatchNet、JDACS-MS
三维重建是指用相机拍摄真实世界的物体、场景,并通过 计算机视觉技术进行处理,从而得到物体的三 维模型。下图就是三维重建重建结果:
用户1150922
2022-05-10
7470
观点 | SLAM会被深度学习取代吗?
今天和大家聊一个有趣的话题:SLAM是否会被深度学习取代。据说卡内基梅隆大学机器人研究所的计算机视觉课程,分成了两部分,一个是基于学习的方法,一个是基于几何的方法。作为一个SLAMer,深深的感受到最近几年SLAM的快速发展,以前很多人说起计算机视觉,基本就和深度学习视觉算法划上了等号,如今SLAM也有自己的一席之地了。几何方法和学习方法,已经成为现代计算机视觉的两根支柱。
用户1150922
2021-12-07
7050
即将开源 基于动态不变性感知的多模态视觉位置识别
原文链接:即将开源!基于动态不变性感知的多模态视觉位置识别 论文题目:Multi-modal Visual Place Recognition in Dynamics-Invariant Perception Space
用户1150922
2021-12-07
5350
我们急需三维激光数据的语义分割吗?
我们急需三维激光数据的语义分割吗? 今天给大家分享一篇论文,论文名称: Are We Hungry for 3D LiDAR Data for Semantic Segmentation? 作者:
用户1150922
2020-09-10
1.7K0
基于双目深度估计的深度学习技术研究
英文标题: A Survey on Deep Learning Techniques for Stereo-based Depth Estimation 论文地址: https://arxiv.org/abs/2006.02535
用户1150922
2020-09-10
2.2K0
基于图像语义的视觉同步定位和建图综述:面向应用的移动机器人自主导航解决方案
论文名称: A survey of image semantics-based visual simultaneous localization and mapping Application-oriented solutions to autonomous navigation of mobile robots 作者: Linlin Xia, Jiashuo Cui, Ran Shen, Xun Xu, Yiping Gao and Xinying Li
用户1150922
2020-09-10
1.4K0
Image-based 3D Object Reconstruction: State-of-the-Art and Trends in the Deep Learning Era
摘要:三维重建是计算机视觉计算机图形学和机器学习等领域几十年来一个不适定问题。从2015年开始使用CNN解决基于图像的三维重建(image-based 3D reconstruction)有了极大的关注并且展示出强大的性能。在新时代的快速发展下,我们提供了这一领域详细的调研。本文章专注于从RGB图像估计三维物体形状的深度学习方法。除此之外我们还回顾了关于特定物体(如人脸)的近期研究。我们一些重要论文性能的分析和比较,总结这一领域的现有问题并讨论未来研究的方向。
用户1150922
2020-09-10
1.9K0
基于深度学习的影像深度重建综述
论文名称:A Survey on Deep Learning Architectures for Image-based Depth Reconstruction
用户1150922
2020-09-10
1.1K0
目标检测
图片分类任务我们已经熟悉了,就是算法对其中的对象进行分类。而今天我们要了解构建神经网络的另一个问题,即目标检测问题。这意味着,我们不仅要用算法判断图片中是不是一辆汽车, 还要在图片中标记出它的位置, 用边框或红色方框把汽车圈起来, 这就是目标检测问题。 其中“定位”的意思是判断汽车在图片中的具体位置。
用户1150922
2019-07-10
1.3K0
原来CNN是这样提取图像特征的。。。
深度学习对外推荐自己的一个很重要的点——深度学习能够自动提取特征。本文主要介绍卷积层提取特征的原理过程,文章通过几个简单的例子,展示卷积层是如何工作的,以及概述了反向传播的过程,将让你对卷积神经网络CNN提取图像特征有一个透彻的理解。那么我们首先从最基本的数学计算——卷积操作开始。
用户1150922
2019-05-27
1.4K0
什么是多模态机器学习?
每一种信息的来源或者形式,都可以称为一种模态。例如,人有触觉,听觉,视觉,嗅觉;信息的媒介,有语音、视频、文字等;多种多样的传感器,如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。
用户1150922
2019-05-27
5K0
实战 | 源码入门之Faster RCNN
从train.py中的主要函数可以看出,主要的步骤涉及训练数据和测试数据的预处理,网络模型的构建(Faster RCNN),然后就是迭代训练,这也是通用的神经网络搭建和训练的过程。在Faster Rcnn网络模型中主要包含Extractor、RPN和RoIhead三部分。网络中Extractor主要是利用CNN进行特征提取,网络采用的VGG16;RPN是候选区网络,为RoIHead模块提供可能存在目标的候选区域(rois);RoIHead主要负责rois的分类和微调。整体的框架图如下图所示:
用户1150922
2019-05-27
1.1K0
从零开始一起学习SLAM | 为什么要学SLAM?
在《零基础小白,如何入门计算机视觉?》中我提到过,计算机视觉的研究目前主要分为两大方向:基于学习的方法和基于几何的方法。其中基于学习的方法最火的就是深度学习,而基于几何方法最火的就是视觉SLAM。
用户1150922
2019-05-26
1K0
零基础小白,如何入门计算机视觉?
计算机视觉是人工智能技术的一个重要领域,打个比方(不一定恰当),我认为计算机视觉是人工智能时代的眼睛,可见其重要程度。计算机视觉其实是一个很宏大的概念,下图是有人总结的计算机视觉所需要的技能树。
用户1150922
2019-05-26
1.5K1
Facebook Surround360 学习笔记--(2)算法原理
本文介绍了Surround 360开源全景拍摄和拼接软件,它通过使用17台相机同时拍摄,并利用其独特的算法将拍摄到的图片合成为一张完整的全景图。该软件具有高速处理、高精度的特点,能够生成高质量的3D全景图,使用户能够体验到身临其境的感觉。同时,该软件的源代码已经上传到GitHub上,供用户自由使用和研究。"
用户1150922
2018-01-08
1.8K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档