首页
学习
活动
专区
工具
TVP
发布

CVer

专栏作者
386
文章
551142
阅读量
194
订阅数
CVPR 2022 Oral | 目标检测新工作!南大开源AdaMixer:快速收敛的基于查询的目标检测器
AdaMixer: A Fast-Converging Query-Based Object Detector
Amusi
2022-04-18
1K0
CVPR 2022 Oral | 从图形学顶会到视觉顶会:一份改良何恺明早期工作的图像拼接矩形化新基准
https://github.com/nie-lang/DeepRectangling
Amusi
2022-04-18
8850
CVPR 2022 | 即插即用!助力自监督涨点的ContrastiveCrop开源了!
自SimCLR、MoCo等自监督里程碑工作发表以来,对比学习已经在视觉领域引起了极大的关注和广泛的研究。在诸多下游任务上,对比学习预训练的模型已达到甚至超越有监督预模型的迁移训练结果。目前主流的对比学习方法均采用孪生网络(Siamese network)的架构,这不可避免地带来一个问题,就是如何选取作为孪生网络输入的训练样本对。
Amusi
2022-03-23
4980
可以这样理解视觉Transformer模型中patch交互的关系
随着计算机视觉领域的不断发展,基础视觉任务研究中受自然语言处理(NLP)的模型结构设计(Transformer-based model)的启发,视觉任务与Transformer网络模型结构相结合,通过引入自注意力机制等结构来探索和优化Transformer网络在视觉任务当中的应用,在目标检测、分割和跟踪等多项视觉任务中获得比较有竞争力的优势。同时,针对基础视觉任务的研究中,引入可解释性分析能够通过多个角度对现有模型形成更加深层的理解,能够促使研究人员进一步探索其中有效的建模过程。
Amusi
2022-03-22
5790
CV新时代已经来临
自ViT问世以来,CV开始进入膨胀期,也迎来了新一轮的红利,开始了类似于NLP中Transformer的发展趋势。从CNN开始彻底走向ViT,从supervised到self-supervised,再到大数据预训练,ViT的变种不断增加,带来的性能也在持续提升。
Amusi
2021-12-01
4410
涨点神器!南航提出AFF:注意力特征融合,即插即用!可用于分类、检测和分割等
https://openaccess.thecvf.com/content/WACV2021/html/Dai_Attentional_Feature_Fusion_WACV_2021_paper.html
Amusi
2021-11-02
6.1K0
CVPR 2021 | 强化学习太脆弱?VAI: 用注意力和不变性来让像素输入的强化学习更加稳定
Unsupervised Visual Attention and Invariance for Reinforcement Learning
Amusi
2021-08-10
9330
ICCV 2021 Oral|涨点神器!RS Loss:目标检测和实例分割的新损失函数
本文作者提出了一种用于目标检测和实例分割任务的Rank & Sort Los),能够简化原来模型训练的复杂性,并能使得模型达到更好的performance。
Amusi
2021-08-10
3K0
无卷积!谷歌提出ViViT:视频视觉Transformer
本文讨论了两种直观的输入方式,一种为不同帧之间图像直接按照ViT的处理,转换为tokens,然后按照frames的顺序进行组合,另一种则将多帧直接进行组合,同时获取时间,空间上的一个token,这样能更有效融合时空信息
Amusi
2021-05-10
1.1K0
仅需2张图!AI便可生成完整运动过程
先输入一个视频序列 I ,它由N个帧组织,每一帧都有一个掩膜Mi来划分感兴趣的区域。
Amusi
2021-05-10
4990
顶刊TPAMI 2020 | 一文打尽无监督多类域适应:理论,算法与实践
本文介绍我们最近的一篇TPAMI工作:Unsupervised Multi-Class Domain Adaptation: Theory, Algorithms, and Practice。
Amusi
2021-01-28
9190
ICLR 2021 | 自解释神经网络—Shapley Explanation Networks
TL;DR:我们将特征的重要值直接写进神经网络,作为层间特征,这样的神经网络模型有了新的功能:
Amusi
2021-01-28
7590
CenterFusion:雷达和摄像头融合的3D目标检测方法,代码已开源!
以前提到过此文(在想法中),WACV‘2021录取:“CenterFusion: Center-based Radar and Camera Fusion for 3D Object Detection“,作者来自田纳西大学。
Amusi
2021-01-28
2.2K0
95 FPS!超快速3D目标检测网络开源了!SFA3D:基于LiDAR的实时、准确的3D目标检测模型
Amusi 发现了一个超快速3D目标检测网络!SFA3D:基于LiDAR的实时、准确的3D目标检测模型,在GTX 1080 Ti上速度高达95 FPS!代码现已开源!
Amusi
2020-11-19
2.7K0
清华&华为提出AABO:自适应最优化Anchor设置,性能榨取的最后一步 | ECCV 2020 Spotlight
论文提出超参数优化方法AABO,该方法核心基于贝叶斯优化和Sub-Sample方法,能够自适应的搜索最优的anchor设置。从实验结果来看,AABO能够仅通过anchor设置优化,为SOTA目标检测方法带来1.4%~2.4%的性能提升
Amusi
2020-09-23
8330
编程神器来了!写代码、搜问题,全部都在「终端」完成!是时候入手了
最常见的方法是去论坛询问、谷歌搜索,需要反复在网页和编译器页面切换,即使有两个很大的分屏,生产力也会受到影响。
Amusi
2020-09-23
5890
旷视15篇论文入选ECCV 2020(含目标检测/NAS/人体姿态估计等)
8月23-28日,全球计算机视觉三大顶会之一,两年一度的 ECCV 2020(欧洲计算机视觉国际会议)即将召开。受到疫情影响,今年的 ECCV 将以线上形式举办。据官方统计,本次大会有效投稿5025篇,其中有1361篇被接收,录用率为27%,较上届31.8%有所下降。其中,Oral 论文104篇(占总投稿数2%),Spotlight 论文161篇(本届新增,占总投稿数5%),其余为 Poster。
Amusi
2020-08-24
9550
快把卷积神经网络中的平移不变性带回来!
这篇博客主要是我读论文《Making Convolutional Networks Shift-Invariant Again》的读书笔记,夹杂了自己直白和幼稚的理解。因为我相信所有的创意无论最后的结果多么复杂,最初的想法一定都是直观的。
Amusi
2020-07-17
1K0
ECCV 2020 | 利用单帧标注进行视频时序动作检测
论文题目: SF-Net: Single-Frame Supervision for Temporal Action Localization
Amusi
2020-07-17
1K0
一文看尽15种语义分割损失函数(含代码解析)
https://github.com/shruti-jadon/Semantic-Segmentation-Loss-Functions
Amusi
2020-07-07
13.3K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档