前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >强到离谱,Transformer为何能闯入CV界秒杀CNN?

强到离谱,Transformer为何能闯入CV界秒杀CNN?

作者头像
OpenCV学堂
发布2022-04-21 15:10:56
3520
发布2022-04-21 15:10:56
举报

Transformer 近年来已成为视觉领域的新晋霸主,这个来自 NLP 领域的模型架构为何能闯入CV界秒杀CNN?

自提出之日起,Transformer模型已经在CV、NLP以及其他更多领域中「大展拳脚」,实力冲击CNN。

Transformer为什么这么有实力?因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer更是成了屠榜般的存在,在工业界具有广阔的应用前景。所以引起了人工智能研究生的强烈兴趣。

但要想啃透CV Transformer 难度不小:一方面,Transformer本是应用于NLP的论文,其中很多内容都形成了共识,在论文中并不会去详细介绍这些共识内容,例如QKV是什么,embedding是什么等,对于其他方向的人看到这些就很难理解。

另一方面,近小半年,Transformer+CV的论文就已经有40多篇。学术研究更新之快,与脱发速度成正比

那么这些Transformer+CV的论文要怎么学习才能又好又快地吃透呢?

无非三个步骤:泛读、精读、代码复现。

这次我们请来了现处科研一线的——电子羊老师,推出【ViT】+【MAE】论文精讲直播,为期2天,彻底夯实 CV Transformer 基础。

直播嘉宾:

—— 直播内容与安排 ——

1、4月22日20:00直播

1.论文研究背景、成果及意义 2.论文精读 3.论文总结 4.学习路径推荐

2、4月23日20:00直播

1.MAE简介 2.PreTrain FineTune 3.为什么分类任务如此重要? 4.MAE的主要方法 5.MAE实验结果

↓ 前方福利 ↓

原价399现在0.1元领取!

👆扫码添加客服  即可领取↓

免费资料:《CV transformer经典论文》

(限99份,手慢无)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云直播
云直播(Cloud Streaming Services,CSS)为您提供极速、稳定、专业的云端直播处理服务,根据业务的不同直播场景需求,云直播提供了标准直播、快直播、云导播台三种服务,分别针对大规模实时观看、超低延时直播、便捷云端导播的场景,配合腾讯云视立方·直播 SDK,为您提供一站式的音视频直播解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档