首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >注意力网络是如何工作的?

注意力网络是如何工作的?
EN

Stack Overflow用户
提问于 2019-12-05 16:38:44
回答 1查看 69关注 0票数 4

最近我在读“注意力就是你所需要的一切”这篇论文,通过它,我发现了一个关于理解注意力网络的问题,如果我忽略了它背后的数学原理。有没有人能举个例子让我理解注意力网络?

EN

回答 1

Stack Overflow用户

发布于 2020-04-01 02:35:41

This教程说明了Transformer中的每个核心组件,绝对值得一读。

直观地说,注意力机制试图根据注意力函数找到“相似”的时间步长(例如,你所需要的就是注意力中的投影+余弦相似度),然后用相应计算的权重和以前的表示来计算新的表示。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59191144

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档