首页
学习
活动
专区
工具
TVP
发布

CVer

专栏作者
386
文章
550192
阅读量
194
订阅数
英伟达的这款炼丹神器太强了!
众所周知,深度学习的训练比较玄学,大家经常调侃就像"炼丹"一样。如果你有个好工具,科学"炼丹"的效率就会显著提升!
Amusi
2022-06-14
7310
CVPR 2022 | 南大提出:Structured Sparse R-CNN:单阶段端到端场景图生成器
本文介绍我们在场景图生成 (Scene Graph Generation, SGG) 领域的工作——Structured Sparse R-CNN for Direct Scene Graph Generation。本工作将端到端稀疏目标检测器引入场景图生成领域,并提出了相应的关系建模组件和训练策略。该模型在 Visual Genome, Open Image V4/V6 数据集上取得了 SOTA 效果。论文和代码及模型已经开源:
Amusi
2022-04-18
8580
CVPR 2022 Oral | 目标检测新工作!南大开源AdaMixer:快速收敛的基于查询的目标检测器
AdaMixer: A Fast-Converging Query-Based Object Detector
Amusi
2022-04-18
1K0
CVPR 2022 | 即插即用!华南理工开源VISTA:双跨视角空间注意力机制实现3D目标检测SOTA
LiDAR (激光雷达)是一种重要的传感器,被广泛用于自动驾驶场景中,以提供物体的精确 3D 信息。因此,基于 LiDAR 的 3D 目标检测引起了广泛关注。许多 3D 目标检测算法通过将无序和不规则的点云进行体素化,随后利用卷积神经网络处理体素数据。然而,3D 卷积算子在计算上效率低下且容易消耗大量内存。为了缓解这些问题,一系列工作利用稀疏 3D 卷积网络作为 3D 骨干网络来提取特征。如图 1 所示,这些工作将 3D 特征图投影到鸟瞰图 (BEV) 或正视图 (RV) 中,并且使用各种方法从这些 2D 特征图生成对象候选 (Object Proposals)。
Amusi
2022-04-18
1.2K0
何恺明团队新作ViTDet:用于目标检测的视觉Transformer主干网络
做目标检测就一定需要 FPN 吗?昨天,来自 Facebook AI Research 的 Yanghao Li、何恺明等研究者在 arXiv 上上传了一篇新论文,证明了将普通的、非分层的视觉 Transformer 作为主干网络进行目标检测的可行性。他们希望这项研究能够引起大家对普通主干检测器的关注。
Amusi
2022-04-18
7390
CVPR 2022 | 即插即用!南洋理工&商汤开源SAM-DETR: 利用语义对齐匹配实现快速收敛的DETR
导读:在CVPR 2022上,新加坡南洋理工大学和商汤研究院的科研团队提出了SAM-DETR —— 利用语义对齐匹配加速DETR检测器收敛。它仅引入一个简单的即插即用的模块,通过采样“目标显著点”的特征使object query和图像特征的语义对齐,使DETR能够在MS-COCO数据集上迅速收敛。由于此方法即插即用的特性,SAM-DETR可以轻易地与现有的其他加速收敛的方法结合,实现更好的结果。根据作者已开源的代码,在MS-COCO数据集上,仅用ResNet-50,所提出的方法能在12 epoch内达到42.8% AP的检测精度,并能在50 epoch内达到47.1% AP的检测精度。
Amusi
2022-04-18
7430
ICLR 2022 | 首次实现用MLP做检测和分割!上科大和腾讯开源AS-MLP:一种轴向位移的MLP框架
AS-MLP: An Axial Shifted MLP Architecture for Vision
Amusi
2022-03-23
9230
ICCV 2021 UVO Challenge 双冠军比赛复盘
这次带队参加了ICCV2021的UVO(Unidentified Video Objects) Challenge,本次比赛共有两个赛道,分别为基于图片的开放世界实例分割和基于视频的开放世界实例分割。我们运气不错,拿下了本次比赛两个赛道的冠军。以下为本次比赛介绍和我们的方法简介。
Amusi
2021-11-02
5590
深入探究CNN和Transformer,哪种预训练模型的可迁移性更好?
一文献给还在ConvNets和Transformer之间犹豫的小伙伴们:也许是时候倒向Vision Transformer预训练模型了!
Amusi
2021-09-30
1.2K0
超越PVT!南大提出ResT:高效多尺度的视觉Transformer
本文提出一种高效多尺度Vision Transformer:ResT,它可作为图像中识别的通用骨干架构。不同于现有采用固定分辨率+标准Transformer模块的Transformer模型,它有这样几个优势:
Amusi
2021-06-09
1.2K0
超越YOLOv5还不够!这个目标检测开源项目又上新了
作为目标检测领域的扛把子,PaddleDetection当然不仅仅提供通用目标检测算法,还拥有多个业界先进、实用的关键点检测和多目标跟踪算法。除了可以准确识别、定位目标,还可以对移动的目标进行连续跟踪、分析路径,甚至进行姿态、行为分析!
Amusi
2021-06-09
2.1K1
Twins:重新思考视觉Transformer中的空间注意力机制
Twins: Revisiting the Design of Spatial Attention in Vision Transformers
Amusi
2021-05-10
1.2K0
CNN+Transformer!谷歌提出BoTNet:新主干网络!在ImageNet上达84.7%准确率!
现在几乎所有大厂、高校都有团队在研究视觉Transformer的工作,这里Amusi 建议大家不管你有没有想到应用的方向和场景,但都要学习一下Transformer相关知识点。
Amusi
2021-02-25
7580
一文梳理缺陷检测方法
近年来,随着深度学习的快速发展,基于卷积神经网络(CNN)的计算机视觉技术在工业领域得到了广泛的应用。目前,机器视觉表面缺陷检测是CNN在工业上最成熟的应用之一。接下来我们将介绍深度学习在表面缺陷检测领域的概述。
Amusi
2021-01-28
5.2K0
CenterFusion:雷达和摄像头融合的3D目标检测方法,代码已开源!
以前提到过此文(在想法中),WACV‘2021录取:“CenterFusion: Center-based Radar and Camera Fusion for 3D Object Detection“,作者来自田纳西大学。
Amusi
2021-01-28
2.2K0
NeurIPS 2020 | 基于细粒度动态网络的目标检测器
本工作第一次将动态网络引入到目标检测任务中,并设计了基于细粒度动态网络的FPN head和新型的门控函数。从而实现了根据每个目标中不同的子区域(sub-regions)的特性分配不同FPN层级的特征。同时利用空间稀疏卷积,在达到更高检测性能的同时,显著地降低计算复杂度。
Amusi
2021-01-28
9130
目标检测新范式!港大同济伯克利提出Sparse R-CNN,代码刚刚开源!
Sparse R-CNN: End-to-End Object Detection with Learnable Proposals
Amusi
2020-11-30
6790
理解卷积神经网络中的自注意力机制
卷积神经网络(CNN)广泛应用于深度学习和计算机视觉算法中。虽然很多基于CNN的算法符合行业标准,可以嵌入到商业产品中,但是标准的CNN算法仍然有局限性,在很多方面还可以改进。这篇文章讨论了语义分割和编码器-解码器架构作为例子,阐明了其局限性,以及为什么自注意机制可以帮助缓解问题。
Amusi
2020-11-11
1.1K0
旷视提出MegDetV2:目标检测/实例分割系统
在COCO 2019/2020 挑战赛中获得最佳结果!该方案包含RPN++、High-IoU等创新点,以及大量tricks,强烈推荐学习!
Amusi
2020-11-04
4440
46.1 mAP!MimicDet:缩小一阶段和两阶段目标检测之间的差距 | ECCV 2020
这是一种通过直接模仿两阶段特征来训练一阶段检测器的新颖高效框架,旨在缩小一阶段和两阶段检测器之间的精度差距。在COCO上,基于ResNeXt-101可达46.1 mAP!
Amusi
2020-09-29
1.2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档