腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
CVer
专栏作者
举报
386
文章
550192
阅读量
194
订阅数
订阅专栏
申请加入专栏
全部文章
https
深度学习
网络安全
神经网络
机器学习
人工智能
编程算法
图像识别
github
图像处理
git
其他
开源
linux
卷积神经网络
人脸识别
python
tensorflow
学习方法
监督学习
tcp/ip
api
缓存
opencv
pytorch
mask
ide
文字识别
游戏
kernel
go
css
html
批量计算
存储
自动驾驶
java
node.js
访问管理
腾讯云测试服务
网站
http
无人驾驶
强化学习
大数据
backbone
network
NLP 服务
.net
硬件开发
数据库
sql
shell
面向对象编程
迁移学习
微信
安全
机器人
windows
智能推荐平台
block
channel
data
epoch
scale
self
token
搜索
对象存储
云硬盘
区块链
数字货币
xcode
c++
php
javascript
jquery
单片机
嵌入式
flask
svn
unix
云直播
短视频
SSL 证书
数据加密服务
人脸核身
视频处理
DevOps 解决方案
高性能计算
渲染
vr 视频解决方案
容器
自动化
正则表达式
numpy
keras
cdn
udp
小程序
数据分析
数据结构
腾讯云开发者社区
sdk
迁移
测试服务
action
alignment
audio
binary
branch
chatgpt
counting
fs
gallery
graph
instance
label
layer
local
localization
map
max
methods
min
model
nas
object
pascal
patch
pixel
precision
procedure
ps
scaling
search
set
shared
size
transformation
types
video
youtube
百度
架构
自然语言处理
搜索文章
搜索
搜索
关闭
英伟达的这款炼丹神器太强了!
https
深度学习
网络安全
图像识别
图像处理
众所周知,深度学习的训练比较玄学,大家经常调侃就像"炼丹"一样。如果你有个好工具,科学"炼丹"的效率就会显著提升!
Amusi
2022-06-14
731
0
CVPR 2022 | 南大提出:Structured Sparse R-CNN:单阶段端到端场景图生成器
图像识别
本文介绍我们在场景图生成 (Scene Graph Generation, SGG) 领域的工作——Structured Sparse R-CNN for Direct Scene Graph Generation。本工作将端到端稀疏目标检测器引入场景图生成领域,并提出了相应的关系建模组件和训练策略。该模型在 Visual Genome, Open Image V4/V6 数据集上取得了 SOTA 效果。论文和代码及模型已经开源:
Amusi
2022-04-18
858
0
CVPR 2022 Oral | 目标检测新工作!南大开源AdaMixer:快速收敛的基于查询的目标检测器
图像处理
编程算法
linux
图像识别
AdaMixer: A Fast-Converging Query-Based Object Detector
Amusi
2022-04-18
1K
0
CVPR 2022 | 即插即用!华南理工开源VISTA:双跨视角空间注意力机制实现3D目标检测SOTA
图像处理
测试服务
腾讯云测试服务
图像识别
LiDAR (激光雷达)是一种重要的传感器,被广泛用于自动驾驶场景中,以提供物体的精确 3D 信息。因此,基于 LiDAR 的 3D 目标检测引起了广泛关注。许多 3D 目标检测算法通过将无序和不规则的点云进行体素化,随后利用卷积神经网络处理体素数据。然而,3D 卷积算子在计算上效率低下且容易消耗大量内存。为了缓解这些问题,一系列工作利用稀疏 3D 卷积网络作为 3D 骨干网络来提取特征。如图 1 所示,这些工作将 3D 特征图投影到鸟瞰图 (BEV) 或正视图 (RV) 中,并且使用各种方法从这些 2D 特征图生成对象候选 (Object Proposals)。
Amusi
2022-04-18
1.2K
0
何恺明团队新作ViTDet:用于目标检测的视觉Transformer主干网络
图像识别
做目标检测就一定需要 FPN 吗?昨天,来自 Facebook AI Research 的 Yanghao Li、何恺明等研究者在 arXiv 上上传了一篇新论文,证明了将普通的、非分层的视觉 Transformer 作为主干网络进行目标检测的可行性。他们希望这项研究能够引起大家对普通主干检测器的关注。
Amusi
2022-04-18
739
0
CVPR 2022 | 即插即用!南洋理工&商汤开源SAM-DETR: 利用语义对齐匹配实现快速收敛的DETR
图像识别
导读:在CVPR 2022上,新加坡南洋理工大学和商汤研究院的科研团队提出了SAM-DETR —— 利用语义对齐匹配加速DETR检测器收敛。它仅引入一个简单的即插即用的模块,通过采样“目标显著点”的特征使object query和图像特征的语义对齐,使DETR能够在MS-COCO数据集上迅速收敛。由于此方法即插即用的特性,SAM-DETR可以轻易地与现有的其他加速收敛的方法结合,实现更好的结果。根据作者已开源的代码,在MS-COCO数据集上,仅用ResNet-50,所提出的方法能在12 epoch内达到42.8% AP的检测精度,并能在50 epoch内达到47.1% AP的检测精度。
Amusi
2022-04-18
743
0
ICLR 2022 | 首次实现用MLP做检测和分割!上科大和腾讯开源AS-MLP:一种轴向位移的MLP框架
图像识别
机器学习
神经网络
深度学习
人工智能
AS-MLP: An Axial Shifted MLP Architecture for Vision
Amusi
2022-03-23
923
0
ICCV 2021 UVO Challenge 双冠军比赛复盘
图像识别
编程算法
https
网络安全
这次带队参加了ICCV2021的UVO(Unidentified Video Objects) Challenge,本次比赛共有两个赛道,分别为基于图片的开放世界实例分割和基于视频的开放世界实例分割。我们运气不错,拿下了本次比赛两个赛道的冠军。以下为本次比赛介绍和我们的方法简介。
Amusi
2021-11-02
559
0
深入探究CNN和Transformer,哪种预训练模型的可迁移性更好?
图像识别
一文献给还在ConvNets和Transformer之间犹豫的小伙伴们:也许是时候倒向Vision Transformer预训练模型了!
Amusi
2021-09-30
1.2K
0
超越PVT!南大提出ResT:高效多尺度的视觉Transformer
图像识别
本文提出一种高效多尺度Vision Transformer:ResT,它可作为图像中识别的通用骨干架构。不同于现有采用固定分辨率+标准Transformer模块的Transformer模型,它有这样几个优势:
Amusi
2021-06-09
1.2K
0
超越YOLOv5还不够!这个目标检测开源项目又上新了
神经网络
深度学习
人工智能
编程算法
图像识别
作为目标检测领域的扛把子,PaddleDetection当然不仅仅提供通用目标检测算法,还拥有多个业界先进、实用的关键点检测和多目标跟踪算法。除了可以准确识别、定位目标,还可以对移动的目标进行连续跟踪、分析路径,甚至进行姿态、行为分析!
Amusi
2021-06-09
2.1K
1
Twins:重新思考视觉Transformer中的空间注意力机制
https
网络安全
图像识别
Twins: Revisiting the Design of Spatial Attention in Vision Transformers
Amusi
2021-05-10
1.2K
0
CNN+Transformer!谷歌提出BoTNet:新主干网络!在ImageNet上达84.7%准确率!
图像识别
机器学习
神经网络
深度学习
人工智能
现在几乎所有大厂、高校都有团队在研究视觉Transformer的工作,这里Amusi 建议大家不管你有没有想到应用的方向和场景,但都要学习一下Transformer相关知识点。
Amusi
2021-02-25
758
0
一文梳理缺陷检测方法
图像识别
机器学习
人工智能
学习方法
深度学习
近年来,随着深度学习的快速发展,基于卷积神经网络(CNN)的计算机视觉技术在工业领域得到了广泛的应用。目前,机器视觉表面缺陷检测是CNN在工业上最成熟的应用之一。接下来我们将介绍深度学习在表面缺陷检测领域的概述。
Amusi
2021-01-28
5.2K
0
CenterFusion:雷达和摄像头融合的3D目标检测方法,代码已开源!
图像处理
https
图像识别
linux
编程算法
以前提到过此文(在想法中),WACV‘2021录取:“CenterFusion: Center-based Radar and Camera Fusion for 3D Object Detection“,作者来自田纳西大学。
Amusi
2021-01-28
2.2K
0
NeurIPS 2020 | 基于细粒度动态网络的目标检测器
图像识别
本工作第一次将动态网络引入到目标检测任务中,并设计了基于细粒度动态网络的FPN head和新型的门控函数。从而实现了根据每个目标中不同的子区域(sub-regions)的特性分配不同FPN层级的特征。同时利用空间稀疏卷积,在达到更高检测性能的同时,显著地降低计算复杂度。
Amusi
2021-01-28
913
0
目标检测新范式!港大同济伯克利提出Sparse R-CNN,代码刚刚开源!
机器学习
神经网络
深度学习
人工智能
图像识别
Sparse R-CNN: End-to-End Object Detection with Learnable Proposals
Amusi
2020-11-30
679
0
理解卷积神经网络中的自注意力机制
图像识别
机器学习
神经网络
深度学习
人工智能
卷积神经网络(CNN)广泛应用于深度学习和计算机视觉算法中。虽然很多基于CNN的算法符合行业标准,可以嵌入到商业产品中,但是标准的CNN算法仍然有局限性,在很多方面还可以改进。这篇文章讨论了语义分割和编码器-解码器架构作为例子,阐明了其局限性,以及为什么自注意机制可以帮助缓解问题。
Amusi
2020-11-11
1.1K
0
旷视提出MegDetV2:目标检测/实例分割系统
图像识别
在COCO 2019/2020 挑战赛中获得最佳结果!该方案包含RPN++、High-IoU等创新点,以及大量tricks,强烈推荐学习!
Amusi
2020-11-04
444
0
46.1 mAP!MimicDet:缩小一阶段和两阶段目标检测之间的差距 | ECCV 2020
图像识别
这是一种通过直接模仿两阶段特征来训练一阶段检测器的新颖高效框架,旨在缩小一阶段和两阶段检测器之间的精度差距。在COCO上,基于ResNeXt-101可达46.1 mAP!
Amusi
2020-09-29
1.2K
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档