开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >注意力网络是如何工作的？

问注意力网络是如何工作的？
EN

Stack Overflow用户

提问于 2019-12-05 16:38:44

回答 1查看 69关注 0票数 4

最近我在读“注意力就是你所需要的一切”这篇论文，通过它，我发现了一个关于理解注意力网络的问题，如果我忽略了它背后的数学原理。有没有人能举个例子让我理解注意力网络？

attention-model

EN

回答 1

Stack Overflow用户

发布于 2020-04-01 02:35:41

This教程说明了Transformer中的每个核心组件，绝对值得一读。

直观地说，注意力机制试图根据注意力函数找到“相似”的时间步长(例如，你所需要的就是注意力中的投影+余弦相似度)，然后用相应计算的权重和以前的表示来计算新的表示。

票数 3

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59191144

复制

相似问题