前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >All Things ViTs:在视觉中理解和解释注意力

All Things ViTs:在视觉中理解和解释注意力

作者头像
计算机视觉研究院
发布2023-08-24 08:41:29
2280
发布2023-08-24 08:41:29
举报

地址:https://github.com/all-things-vits/code-samples

计算机视觉研究院专栏

Column of Computer Vision Institute

注意力机制已经彻底改变了许多学科的深度学习研究,从NLP开始,扩展到视觉、语言等。

01

概要简介

与其他机制不同,elegant和一般的注意力机制很容易适应,并消除了特定模态的感应偏见。随着注意力越来越受欢迎,开发工具让研究人员能够理解和解释机制的内部运作,以促进更好、更负责任地使用它,这一点至关重要。

今天分享的侧重于在视觉和多模态环境中理解和解释注意力。我们介绍了关于表征探索、可解释性和基于注意力的语义指导的最新研究,以及促进互动的实践演示。此外,我们还讨论了最近工作中出现的悬而未决的问题和未来的研究方向。

在今天分享中,我们将探讨注意力在视觉中的应用。从左到右:(i)注意力可用于解释模型的预测(例如,图像-文本对的CLIP)(ii)基于注意力的探索模型的示例(iii)多模态模型的交叉注意力图可用于指导生成模型(例如,mitigating neglect in Stable Diffusion)。

以下是我们介绍的主题的概述。详细说明见本文件。https://docs.google.com/document/d/1AHYQyi5rvTGZC8kKS1TEOMewl5_b1M6gHrTyUt38oFs/edit#heading=h.4fa4qoz6sg55

Interpreting Attention
  • Brief history of interpretability for DNNs
  • Attention vs. Convolutions
  • Using attention as an explanation
Probing Attention
  • Depth and breadth of attention layers
  • Representational similarities between CNNs and Transformers
  • Probing cross-attention
Leveraging Attention as Explanation
  • New! Ron Mokady will share his seminal research on employing attention for text-based image editing. You can find his slides here.
  • Attention-based semantic guidance

References

[1] Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers, Chefer et al. [2] Do Vision Transformers See Like Convolutional Neural Networks?, Raghu et al. [3] What do Vision Transformers Learn? A Visual Exploration, Ghiasi et al. [4] Quantifying Attention Flow in Transformers, Abnar et al. [5] Attend-and-Excite: Attention-Based Semantic Guidance for Text-to-Image Diffusion Models, Chefer et al. [6] Prompt-to-Prompt Image Editing with Cross-Attention Control, Hertz et al. [7] NULL-text Inversion for Editing Real Images using Guided Diffusion Models, Mokady et al.

转载请联系本公众号获得授权

往期推荐

🔗

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-06-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • References
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档