• 在本站开通年度VIP,无限制下载本站资源和阅读本站文章

  • 如果觉得本站的内容有帮助,可以考虑打赏博主哦!

  • 问题反馈可发送邮件到stubbornhuang@qq.com

  • 感谢大家访问本站,希望本站的内容可以帮助到大家!

  • 工资「喂饱肚子」,副业「养活灵魂」!

  • 本站会放置Google广告用于维持域名以及网站服务器费用。

  • 欢迎大家交换友链,可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请!

  • 计算机图形学与计算几何经典必备书单整理,下载链接可参考:https://www.stubbornhuang.com/1256/

  • 本站由于前段时间遭受到大量临时和国外邮箱注册,所以对可注册的邮箱类型进行了限制!

Attention和Self-Attention的区别

Transformer 发布于2024-03-08 阅读 2,094次 0次评论 0次点赞 本文共553个字,阅读需要2分钟。

1 Attention和Self-Attention的区别

Attention:以Encoder-Decoder框架为例,输入Source和输出Target内容是不一样的,比如对于英-中机器翻译来说,Source是英文句子,Target是对应的翻译出的中文句子,Attention发生在Target的元素Query和Source中的所有元素之间。

Self-AttentionSelf-Attention机制Attention机制的区别在于,Attention主要是指Target与Source的之间的相关性,而Self-Attention指的是Source内部元素之间或者Target内部元素之间的Attention,也可以理解为Target=Source这种特殊情况下的Attention,而不是Target和Source之间的Attention。

两者具体的计算过程基本上是一样的,但是计算对象发生了变化。

Attention机制可参考下图

Attention和Self-Attention的区别-第0张图片

Self-Attention机制可参考下图

Attention和Self-Attention的区别-第1张图片

参考

欢迎扫码关注我的微信公众号,及时获取文章更新

微信公众号二维码

本文作者:StubbornHuang

版权声明:本文为站长原创文章,如果转载请注明原文链接!

原文标题:Attention和Self-Attention的区别

原文链接:https://www.stubbornhuang.com/3009/

发布于:2024年03月08日 13:43:08

修改于:2024年03月08日 13:51:11

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

文章末尾
上一篇
资源分享 - 游戏人工智能, Game AI Pro: Collected Wisdom of Game AI Professionals 中文版PDF下载
计算几何与计算机图形学资源
下一篇
Seq2Seq模型和Attention机制
Transformer
当前分类随机文章推荐

发表评论

您必须 [ 登录 ] 才能发表留言!

关注我们的公众号

微信公众号