首页
学习
活动
专区
工具
TVP
发布

CVer

专栏作者
386
文章
555017
阅读量
194
订阅数
最强AI!三大维度、70项指标、3728道考题,文心3.5再拿第一!
7月25日消息,中文通用大模型综合性基准SuperClue发布了最新中文大语言模型排行榜。榜单结果显示,百度文心一言总分超GPT-3.5-Turbo,领跑国内大模型。
Amusi
2023-07-25
3350
复旦提出ObjectFormer,收录CVPR 2022!图像篡改检测新工作!
本文中,复旦大学以人为本人工智能研究中心提出了ObjectFormer,借助视觉Transformer的优势建模物体层面的视觉不一致信息,从而为图像篡改检测提供了崭新的思路。该方法在常用的图像篡改数据集上取得了SOTA的效果。
Amusi
2022-06-13
1.8K0
CVPR 2022 Oral|港中文开源PoseC3D:基于3D-CNN的骨骼动作识别框架
PoseC3D是一种基于 3D-CNN 的骨骼行为识别框架,同时具备良好的识别精度与效率,在包含 FineGYM, NTURGB+D, Kinetics-skeleton 等多个骨骼行为数据集上达到了SOTA。不同于传统的基于人体 3 维骨架的GCN方法,PoseC3D 仅使用 2 维人体骨架热图堆叠作为输入,就能达到更好的识别效果。
Amusi
2022-04-18
2K0
谷歌大牛Jeff Dean撰文:深度学习研究的黄金十年!
自从计算机诞生之初,人类就梦想着能够创造出会思考的机器。1956 年在达特茅斯学院组织的一个研讨会上,约翰 · 麦卡锡提出人工智能这个概念,一群数学家和科学家聚集在一起寻找如何让机器使用语言、形成抽象理解和概念、以解决现存的各种问题,当时研讨会参与者乐观地认为,在几个月的时间里这些问题能取得真正的进展。
Amusi
2022-04-18
4080
超越YOLOv5!0.7M超轻量,又好又快!这个目标检测开源项目全面升级!
目标检测作为计算机视觉领域的顶梁柱,不仅可以独立完成车辆、商品、缺陷检测等任务,也是人脸识别、视频分析、以图搜图等复合技术的核心模块,在自动驾驶、工业视觉、安防交通等领域的商业价值有目共睹。
Amusi
2022-04-18
1.1K0
重磅!谷歌用扩散模型来生成视频了!刷新SOTA
前有OpenAI用它打败霸榜多年的GAN,现在谷歌又紧随其后,提出了一个视频扩散模型。
Amusi
2022-04-18
6540
CVPR 2022|快手&中科院开源StyTr^2:基于Transformer的图像风格化方法
图像风格化是一个有趣且实用的课题,它可以使用参考的风格图像来呈现内容图像,多年以来在学术界被广泛研究,并已在包括短视频领域在内的业界得到大规模的落地应用。例如,移动互联网用户可以通过快手主站、极速版、一甜相机和快影等一系列 APP,体验包括手绘、水彩、油画和 Q 版萌系风格在内的各种人像风格化特效。
Amusi
2022-04-18
4200
CVPR 2022 | Adobe把GAN搞成了缝合怪!凭空P出一张1024分辨率全身人像
从脸,肤色、服饰、头发等身体各个部位,甚至到肢体动作,都能被随意设计和组合,最终“缝”成一张1024 × 1024分辨率的全身照片:
Amusi
2022-04-18
3500
CVPR 2022|处理速度仅用0.2秒!港科大&腾讯AI Lab开源基于GAN反演的高保真图像编辑算法
本文介绍了一篇来自港科大和腾讯 AI Lab已被CVPR 2022收录的工作。工作提出了一种新颖的高保真GAN反演框架,该框架能够在保留图像特定细节(例如背景、外观和照明)的情况下进行属性编辑。不仅处理速度能够达每张图 0.2s,还能保证编辑后图像的高保真度与高质量。
Amusi
2022-04-18
3730
谷歌提出MaskGIT:掩码生成图像Transformer
生成式 transformer 在合成高保真和高分辨率图像方面得到了快速普及。但迄今为止最好的生成式 transformer 模型仍是将图像视为一系列 token,并按照光栅扫描顺序(即逐行)解码图像。然而这种策略既不是最优的,也不高效。
Amusi
2022-04-18
7150
CVPR 2022 | 百变发型!中科大/微软/港城大提出HairCLIP:基于文本和参考图像的头发编辑方法
本文介绍我们在CVPR 2022关于基于文本和参考图像完成头发编辑的工作。该工作将文本和参考图像条件统一在了一个框架内,在单个模型内支持广泛的图像和文本作为输入条件从而完成相应的头发编辑任务。代码正在逐步开源,欢迎大家试用。
Amusi
2022-03-23
6470
ICLR 2022 | 首次实现用MLP做检测和分割!上科大和腾讯开源AS-MLP:一种轴向位移的MLP框架
AS-MLP: An Axial Shifted MLP Architecture for Vision
Amusi
2022-03-23
9380
NeurIPS 2021 | 微软提出S3:自动搜索视觉Transformer的搜索空间
搜索空间对于神经网络结构搜索方法至关重要,它决定了搜索结构的性能上下界。 到目前为止,许多研究精力已经被投入到了CNN搜索空间设计中。Vision Transformer模型作为计算机视觉的新宠儿,其搜索空间并未被很好地探索。这使得设计高效的Vision Transformer模型变得具有挑战。不同于人为地根据先验知识设计搜索空间,微软亚洲研究院的研究员提出了Search the Search Space (S3)来自动地设计Vision Transformer的搜索空间。其搜索出来的结构性能对比手工设计的ViT以及ViT变种模型有大幅度的提升。
Amusi
2021-12-10
6750
NeurIPS 2021 | 医学图像生成新范式!在Noisy Data上训练出超越监督学习的模型
介绍一篇Manteia算法组的NeurIPS 2021 Spotlight文章。文章讨论的核心问题是,在医学图像生成领域,限制模型表现进一步提升的原因是什么?用什么方法可以打破该限制?我们希望通过这篇文章,给大家带来医学图像生成的新范式。
Amusi
2021-11-02
6230
一文使用PyTorch搭建GAN模型!
以往人们普遍认为生成图像是不可能完成的任务,因为按照传统的机器学习思路,我们根本没有真值(ground truth)可以拿来检验生成的图像是否合格。2014年,Goodfellow等人则提出生成对抗网络(Generative Adversarial Network, GAN),能够让我们完全依靠机器学习来生成极为逼真的图片。GAN的横空出世使得整个人工智能行业都为之震动,计算机视觉和图像生成领域发生了巨变。本文将带大家了解GAN的工作原理,并介绍如何通过PyTorch简单上手GAN。
Amusi
2021-08-10
1.5K0
ICCV 2021 Oral|涨点神器!RS Loss:目标检测和实例分割的新损失函数
本文作者提出了一种用于目标检测和实例分割任务的Rank & Sort Los),能够简化原来模型训练的复杂性,并能使得模型达到更好的performance。
Amusi
2021-08-10
3K0
超越YOLOv5还不够!这个目标检测开源项目又上新了
作为目标检测领域的扛把子,PaddleDetection当然不仅仅提供通用目标检测算法,还拥有多个业界先进、实用的关键点检测和多目标跟踪算法。除了可以准确识别、定位目标,还可以对移动的目标进行连续跟踪、分析路径,甚至进行姿态、行为分析!
Amusi
2021-06-09
2.1K1
新垣结衣夫妇的孩子会长啥样?我用BabyGAN预测试试...
内容一览:昨日,日本男星星野源通过事务所发布声明,宣布结婚,新娘正是被不少男粉丝奉为「老婆」的新垣结衣。
Amusi
2021-06-09
5270
大厂HR:我们根本招不到合格的算法工程师
如果说,当前什么话题能够引起大众分歧,那无疑是人工智能了,各个领域专家褒贬不一,也双向证明了人工智能的复杂性。那么,当我们在谈论人工智能的时候,究竟在谈论什么呢?
Amusi
2021-05-10
4900
超越YOLOv5!1.3M超轻量,又好又快!目标检测神器来了
不论你需要通用目标检测、实例分割、旋转框检测,还是行人检测、人脸检测、车辆检测等垂类算法;
Amusi
2021-05-10
1.5K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档