首页
学习
活动
专区
工具
TVP
发布

CVer

专栏作者
386
文章
555008
阅读量
194
订阅数
最强AI!三大维度、70项指标、3728道考题,文心3.5再拿第一!
7月25日消息,中文通用大模型综合性基准SuperClue发布了最新中文大语言模型排行榜。榜单结果显示,百度文心一言总分超GPT-3.5-Turbo,领跑国内大模型。
Amusi
2023-07-25
3350
英伟达的这款炼丹神器太强了!
众所周知,深度学习的训练比较玄学,大家经常调侃就像"炼丹"一样。如果你有个好工具,科学"炼丹"的效率就会显著提升!
Amusi
2022-06-14
7420
复旦提出ObjectFormer,收录CVPR 2022!图像篡改检测新工作!
本文中,复旦大学以人为本人工智能研究中心提出了ObjectFormer,借助视觉Transformer的优势建模物体层面的视觉不一致信息,从而为图像篡改检测提供了崭新的思路。该方法在常用的图像篡改数据集上取得了SOTA的效果。
Amusi
2022-06-13
1.8K0
CVPR 2022 Oral|港中文开源PoseC3D:基于3D-CNN的骨骼动作识别框架
PoseC3D是一种基于 3D-CNN 的骨骼行为识别框架,同时具备良好的识别精度与效率,在包含 FineGYM, NTURGB+D, Kinetics-skeleton 等多个骨骼行为数据集上达到了SOTA。不同于传统的基于人体 3 维骨架的GCN方法,PoseC3D 仅使用 2 维人体骨架热图堆叠作为输入,就能达到更好的识别效果。
Amusi
2022-04-18
2K0
谷歌大牛Jeff Dean撰文:深度学习研究的黄金十年!
自从计算机诞生之初,人类就梦想着能够创造出会思考的机器。1956 年在达特茅斯学院组织的一个研讨会上,约翰 · 麦卡锡提出人工智能这个概念,一群数学家和科学家聚集在一起寻找如何让机器使用语言、形成抽象理解和概念、以解决现存的各种问题,当时研讨会参与者乐观地认为,在几个月的时间里这些问题能取得真正的进展。
Amusi
2022-04-18
4080
超越YOLOv5!0.7M超轻量,又好又快!这个目标检测开源项目全面升级!
目标检测作为计算机视觉领域的顶梁柱,不仅可以独立完成车辆、商品、缺陷检测等任务,也是人脸识别、视频分析、以图搜图等复合技术的核心模块,在自动驾驶、工业视觉、安防交通等领域的商业价值有目共睹。
Amusi
2022-04-18
1.1K0
重磅!谷歌用扩散模型来生成视频了!刷新SOTA
前有OpenAI用它打败霸榜多年的GAN,现在谷歌又紧随其后,提出了一个视频扩散模型。
Amusi
2022-04-18
6540
CVPR 2022|快手&中科院开源StyTr^2:基于Transformer的图像风格化方法
图像风格化是一个有趣且实用的课题,它可以使用参考的风格图像来呈现内容图像,多年以来在学术界被广泛研究,并已在包括短视频领域在内的业界得到大规模的落地应用。例如,移动互联网用户可以通过快手主站、极速版、一甜相机和快影等一系列 APP,体验包括手绘、水彩、油画和 Q 版萌系风格在内的各种人像风格化特效。
Amusi
2022-04-18
4200
CVPR 2022 Oral | 从图形学顶会到视觉顶会:一份改良何恺明早期工作的图像拼接矩形化新基准
https://github.com/nie-lang/DeepRectangling
Amusi
2022-04-18
8890
CVPR 2022 | Adobe把GAN搞成了缝合怪!凭空P出一张1024分辨率全身人像
从脸,肤色、服饰、头发等身体各个部位,甚至到肢体动作,都能被随意设计和组合,最终“缝”成一张1024 × 1024分辨率的全身照片:
Amusi
2022-04-18
3500
CVPR 2022|处理速度仅用0.2秒!港科大&腾讯AI Lab开源基于GAN反演的高保真图像编辑算法
本文介绍了一篇来自港科大和腾讯 AI Lab已被CVPR 2022收录的工作。工作提出了一种新颖的高保真GAN反演框架,该框架能够在保留图像特定细节(例如背景、外观和照明)的情况下进行属性编辑。不仅处理速度能够达每张图 0.2s,还能保证编辑后图像的高保真度与高质量。
Amusi
2022-04-18
3730
CVPR 2022 | 美图&北航提出DAS:精准的多人3D人体姿态估计新网络!速度大大提升!
多人 3D 人体姿态估计是当前的一个热点研究课题,也具有广泛的应用潜力。在计算机视觉中,基于单张 RGB 图片的多人 3D 人体姿态估计问题通常通过自顶向下或是自底向上的两阶段方法来解决,然而两阶段的方法需忍受大量的冗余计算以及复杂的后处理,其低效率深受诟病。此外,已有方法缺少对人体姿态数据分布的认知,从而无法准确地求解从 2D 图片到 3D 位置这一病态问题,以上两点限制了已有方法在实际场景中的应用。
Amusi
2022-04-18
5920
CVPR 2022 | 超越Swin!华为诺亚&北大提出Wave-MLP:视觉新主干网络
近年来,计算机视觉领域的新型架构层出不穷,包括视觉 Transformer、MLP 等,它们在很多任务上都取得了超越 CNN 的性能,受到广泛关注。其中,视觉 MLP 具有极其简单的架构,它仅由多层感知器(MLP)堆叠而成。与 CNN 和 Transformer 相比,这些简洁的 MLP 架构引入了更少的归纳偏置,具有更强的泛化性能。
Amusi
2022-04-18
7900
CVPR 2022 | 惊呆了!只用一张图+相机走位,AI就能脑补周围环境!
主页: https://xrenaa.github.io/look-outside-room/
Amusi
2022-04-18
3510
谷歌提出MaskGIT:掩码生成图像Transformer
生成式 transformer 在合成高保真和高分辨率图像方面得到了快速普及。但迄今为止最好的生成式 transformer 模型仍是将图像视为一系列 token,并按照光栅扫描顺序(即逐行)解码图像。然而这种策略既不是最优的,也不高效。
Amusi
2022-04-18
7150
CVPR 2022 | 百变发型!中科大/微软/港城大提出HairCLIP:基于文本和参考图像的头发编辑方法
本文介绍我们在CVPR 2022关于基于文本和参考图像完成头发编辑的工作。该工作将文本和参考图像条件统一在了一个框架内,在单个模型内支持广泛的图像和文本作为输入条件从而完成相应的头发编辑任务。代码正在逐步开源,欢迎大家试用。
Amusi
2022-03-23
6470
3D点云识别安全吗? 学界提出健壮性分析数据集:ModelNet40-C
论文:Benchmarking Robustness of 3D Point Cloud Recognition Against Common Corruptions
Amusi
2022-03-23
4490
ICLR 2022 | 首次实现用MLP做检测和分割!上科大和腾讯开源AS-MLP:一种轴向位移的MLP框架
AS-MLP: An Axial Shifted MLP Architecture for Vision
Amusi
2022-03-23
9380
NeurIPS 2021 | 微软提出S3:自动搜索视觉Transformer的搜索空间
搜索空间对于神经网络结构搜索方法至关重要,它决定了搜索结构的性能上下界。 到目前为止,许多研究精力已经被投入到了CNN搜索空间设计中。Vision Transformer模型作为计算机视觉的新宠儿,其搜索空间并未被很好地探索。这使得设计高效的Vision Transformer模型变得具有挑战。不同于人为地根据先验知识设计搜索空间,微软亚洲研究院的研究员提出了Search the Search Space (S3)来自动地设计Vision Transformer的搜索空间。其搜索出来的结构性能对比手工设计的ViT以及ViT变种模型有大幅度的提升。
Amusi
2021-12-10
6750
李航《统计学习方法》全套视频讲解来了!
简单介绍一下我的学习路程,一开始入门机器学习,觉得大多数入门的通病都是漫天的去网上找贴吧找资源,然后网盘保存了一大堆资料,每个吃一点不断的遴选符合自己口味,但又茫然不确定自己选的资料好不好,这段时间费时费神,后来也是看多了发现基本机器学习入门绕不开的两本书就是李航的《统计学习方法》和周志华的《机器学习》,一本小蓝书和一本西瓜书。
Amusi
2021-12-02
2.6K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档