首页
学习
活动
专区
工具
TVP
发布

CVer

专栏成员
386
文章
589424
阅读量
194
订阅数
英伟达的这款炼丹神器太强了!
众所周知,深度学习的训练比较玄学,大家经常调侃就像"炼丹"一样。如果你有个好工具,科学"炼丹"的效率就会显著提升!
Amusi
2022-06-14
8060
CVPR 2022 | 上交&腾讯&港中文开源FAME:助力视频表征学习运动感知的数据增强
CVPR 2022 | 上海交大&腾讯AI Lab&港中文开源FAME:助力视频表征学习运动感知的数据增强
Amusi
2022-06-13
8580
CVPR 2022 Oral|港中文开源PoseC3D:基于3D-CNN的骨骼动作识别框架
PoseC3D是一种基于 3D-CNN 的骨骼行为识别框架,同时具备良好的识别精度与效率,在包含 FineGYM, NTURGB+D, Kinetics-skeleton 等多个骨骼行为数据集上达到了SOTA。不同于传统的基于人体 3 维骨架的GCN方法,PoseC3D 仅使用 2 维人体骨架热图堆叠作为输入,就能达到更好的识别效果。
Amusi
2022-04-18
2.5K0
网易互娱AI Lab视频动捕技术iCap被CVPR 2022接收!
动作捕捉技术在影视和游戏行业已得到广泛的应用,其中最常用的技术方案是光学动作捕捉。光学动捕需要演员穿着紧身动捕服,并且在身上粘贴光学标记点,在配置好光学动捕设备的场地进行表演和动作录制。光学动捕设备通常价格不菲,同时还需要固定的室内场地,使用成本和门槛较高,很多小型动画工作室只能望而却步。如果可以从手机拍摄的视频中高精度地捕捉人物动作,那将是动画师的福音。
Amusi
2022-04-18
1.3K0
CVPR 2022 Oral | 目标检测新工作!南大开源AdaMixer:快速收敛的基于查询的目标检测器
AdaMixer: A Fast-Converging Query-Based Object Detector
Amusi
2022-04-18
1.2K0
CVPR 2022 | 谷歌提出mip-NeRF 360:全景NeRF越来越丝滑!
前段时间,CVPR 2022 公布了今年的论文接收结果,同时也意味着投稿的论文终于熬过了静默期。不少作者都感叹:终于可以在社交媒体上聊聊我们的论文了!
Amusi
2022-04-18
2.8K0
CVPR 2022 | 即插即用!华南理工开源VISTA:双跨视角空间注意力机制实现3D目标检测SOTA
LiDAR (激光雷达)是一种重要的传感器,被广泛用于自动驾驶场景中,以提供物体的精确 3D 信息。因此,基于 LiDAR 的 3D 目标检测引起了广泛关注。许多 3D 目标检测算法通过将无序和不规则的点云进行体素化,随后利用卷积神经网络处理体素数据。然而,3D 卷积算子在计算上效率低下且容易消耗大量内存。为了缓解这些问题,一系列工作利用稀疏 3D 卷积网络作为 3D 骨干网络来提取特征。如图 1 所示,这些工作将 3D 特征图投影到鸟瞰图 (BEV) 或正视图 (RV) 中,并且使用各种方法从这些 2D 特征图生成对象候选 (Object Proposals)。
Amusi
2022-04-18
1.4K0
CVPR 2022 | 商汤&南洋理工开源PTTR:基于Transformer的3D点云目标跟踪网络
导读:在CVPR 2022上,商汤研究院团队提出了基于Transformer的3D点云跟踪模型PTTR。PTTR首先在特征提取阶段提出利用特征关联进行采样以保存更多跟被跟踪物体相关的点,然后设计了点云关联Transformer模块进行点云特征匹配。最后,PTTR提出一个轻量化的预测修正模块来进一步提升预测的准确性。实验结果显示PTTR在多个数据集上获得显著精度提升。
Amusi
2022-04-18
5770
CVPR 2022 | 美图&北航提出DAS:精准的多人3D人体姿态估计新网络!速度大大提升!
多人 3D 人体姿态估计是当前的一个热点研究课题,也具有广泛的应用潜力。在计算机视觉中,基于单张 RGB 图片的多人 3D 人体姿态估计问题通常通过自顶向下或是自底向上的两阶段方法来解决,然而两阶段的方法需忍受大量的冗余计算以及复杂的后处理,其低效率深受诟病。此外,已有方法缺少对人体姿态数据分布的认知,从而无法准确地求解从 2D 图片到 3D 位置这一病态问题,以上两点限制了已有方法在实际场景中的应用。
Amusi
2022-04-18
7030
CVPR 2022 | 惊呆了!只用一张图+相机走位,AI就能脑补周围环境!
主页: https://xrenaa.github.io/look-outside-room/
Amusi
2022-04-18
3770
CVPR 2022 | 清华提出Point-BERT: 基于掩码建模的点云自注意力模型预训练
在这里和大家分享一下我们被CVPR 2022录用的工作“Point-BERT: Pre-training 3D Point Cloud Transformers with Masked Point Modeling”
Amusi
2022-04-18
7070
CVPR 2022 | 这个CV数据集生成器火了!谷歌开源Kubric:支持13类复杂CV任务
为了解决这些问题,来自谷歌、MIT、DeepMind、MILA和剑桥大学等11家机构的34名研究人员,联手打造了一个名叫Kubric的数据集生成器,不仅能自己渲染,而且图像效果也非常真实。
Amusi
2022-04-18
4210
3D点云识别安全吗? 学界提出健壮性分析数据集:ModelNet40-C
论文:Benchmarking Robustness of 3D Point Cloud Recognition Against Common Corruptions
Amusi
2022-03-23
5300
腾讯优图提出Evo-ViT:高性能Transformer加速方法
Evo-ViT: Slow-Fast Token Evolution for Dynamic Vision Transformer
Amusi
2021-08-12
1.3K1
动作检测/定位/解析三大赛道!ICCV 2021 DeeperAction挑战赛来了
本次 ICCV 2021的DeeperAction挑战赛旨在推动人类动作理解领域研究从传统的动作识别转向更深入的动作理解任务,希望模型能够在不同视频中对人类动作的进行定位和详细理解。具体来说,组织者提出了三个基于不同任务下的具有高质量标注的视频数据集,并在此基础上组织了针对动作理解任务的三个赛道的挑战赛,欢迎大家踊跃参赛!
Amusi
2021-06-09
5890
刚刚!AMD发布超分辨率新技术FSR:N卡也能用
刚刚在台北 ComputeX 展会上,AMD 原本被认为日常走过场的主题演讲却让很多硬件媒体高呼「惊讶」,这家公司发布的新产品和技术成为了人们热议的话题。
Amusi
2021-06-09
9840
无卷积!谷歌提出ViViT:视频视觉Transformer
本文讨论了两种直观的输入方式,一种为不同帧之间图像直接按照ViT的处理,转换为tokens,然后按照frames的顺序进行组合,另一种则将多帧直接进行组合,同时获取时间,空间上的一个token,这样能更有效融合时空信息
Amusi
2021-05-10
1.3K0
AAAI 2021 3D目标检测论文大盘点(CIA-SSD/Voxel R-CNN等)
CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud
Amusi
2021-01-28
4380
CenterFusion:雷达和摄像头融合的3D目标检测方法,代码已开源!
以前提到过此文(在想法中),WACV‘2021录取:“CenterFusion: Center-based Radar and Camera Fusion for 3D Object Detection“,作者来自田纳西大学。
Amusi
2021-01-28
2.4K0
95 FPS!超快速3D目标检测网络开源了!SFA3D:基于LiDAR的实时、准确的3D目标检测模型
Amusi 发现了一个超快速3D目标检测网络!SFA3D:基于LiDAR的实时、准确的3D目标检测模型,在GTX 1080 Ti上速度高达95 FPS!代码现已开源!
Amusi
2020-11-19
2.8K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档