大佬们， -tansformer中相似度和注意力有什么区别吗？感觉本质上都是一样_牛客网

2023-08-05 22:14 浙江大学算法工程师

关注

大佬们，
-tansformer中相似度和注意力有什么区别吗？感觉本质上都是一样的。
-“the tiger ate the sheep because it was hungry.” transformer的注意力机制是怎么知道it指的是tiger而不是sheep？

#阿里#字节跳动 #transfomer#算法

全部评论

推荐最新楼层

蚌埠坦克学院算法工程师

直观理解it可以指tiger或sheep，人依靠语意可以理解到应该指的是tiger，transformer多头注意力会出现有的头it会attend tiger有的attend sheep，这是为什么要用多头，全连接层和多头何冰后乘的输出矩阵会有筛选效果。最终到底指什么还是根据你的语料库或者训练任务来的，仅仅只给出这一句话理论上学不出

6 回复分享

发布于 2023-08-07 11:48 新加坡

牛客586382495号

蚌埠坦克学院 C++

额，我谈一下我的理解哈，不一定对，相似度计算就是做乘法，所谓注意力机制是通过做乘法来实现的，具体那个变换形式得到qkv的过程就很灵活了。然后这个句子的话，语言模型是用来实现给不同token编码的，理论上来说是关系越接近他们的embedding计算相似度越高或者所谓注意力会越集中，通过大量文本的训练，会发现在这个某些固定长度的句子下，前边的主语会和随之而来的这种代词产生比较多的注意力，至于那个训练方式最基本的就是bert里的那两种，训练后再去预测的话，你提出的it这个词就会被拿过去计算相似度，结果会在tiger上更高，大概这么个意思吧

6 回复分享

发布于 2023-08-06 00:36 山西

牛客981931804号

门头沟学院算法工程师

没区别，注意力就是相似度

2 回复分享

发布于 2023-08-07 15:46 上海

牛客351594340号

University of Pennsylvania Java

很简单注意力结果是由于KQV生成三个矩阵的参数权重决定的，参数权重是训练出来的，训练过程中发现it跟tiger相关性高的时候表现好，跟sheep相关性高的时候表现不好，学习出来的。再说相似度和注意力，相似度指的是KQ之间的相似度，但是注意力还需要考虑V，一般的attention是做点乘求出来kq相似度然后用softmax转成V的权重。当然这里的相似度不一定用点乘，可以用其他的核函数，具体可以看linear attention.

点赞回复分享

发布于 2023-09-30 01:49 美国

注意力是相似度加了softmax之后的结果，注意力可以加mask只比较你想要关注的区域

点赞回复分享

发布于 2023-08-30 12:12 北京

门头沟学院算法工程师

实验科学没有为什么🐶

点赞回复分享

发布于 2023-08-06 00:25 北京

04-10 16:31

学而思_HR(准入职员工)

学而思内推学而思内推

（22-25届均可投递）学而思2025届校招还在招人啦！很多HC！面向对象：22-25届毕业生均可投递，专业不限，应聘阶段无教资要求招聘岗位：高中学科、素养、竞赛教练等（多业务线可选，详见投递主页）📍工作地点：全国39城薪酬：每年4-6次调薪机会福利：六险一金、年度体检、带薪病假、福利年假、司令假期、节日礼盒、团建下午茶、花样周边等。面试流程：初筛-初试（试讲）-复试-培训-offer支持线上面试，抢先锁定offer，心向往之，在学而思！内推码: DS74UTFd(优先处理特权)内推链接：https://app.mokahr.com/m/campus-recruitment/tal/1480...

学而思开奖28人在聊

点赞评论收藏

分享

04-09 10:17

魔门塔（苏州）科技有限公司_感知算法工程师(准入职员工)

Momenta｜产品项目岗｜面试经验 一面：主线负责人 二面：项目团队负责人 🎉🎉一面二面的问题，掌握下面几个应对面试完全OK啦！ 1️⃣自我介绍🥳（还是我那说烂了的加分自我介绍，一面直接过！主页自取啦） 2️⃣深挖简历🩷（固定套路，Key point：给我使劲往简历上靠！） 肯定会问到有没有之前的经历和这个岗位相似的工作任务：所以面试前要准备一下以往经历和产品项目管理有关的，最好有那种自己负责一个项目的从0➡️1的过程，很加分！使劲说！比如之前如何持续跟踪过一个什么项目呀，怎么写的prd 文档呀等等！（懂得都懂哈，好好准备这一part，很加分） 3️⃣沟通能力如何？‍♂️...

点赞评论收藏

分享

03-10 16:36

贵州师范学院嵌入式软件开发

找不到工作啊兄弟们，有没有支招的#牛客创作赏金赛##没有合适的工作，你会先找个干着，还是考公考研#

阡陌见暖春：终于知道嵌入式为什么一年不如一年了

各行各业都卷进来，招聘要求是每一年都在变离谱

牛客创作赏金赛没有合适的工作，你会先找个干着，还是考公考研

点赞评论收藏

分享

04-10 20:12

湖南工学院前端工程师

双非二本27届前端鼠苦逼找前端实习日记（附俩家小厂面试题）

从准备八股到正式投简历总共只有一个星期时间。从来没有投过简历的卑微鼠鼠，一开始在boss投简历可以说是一路曲折QAQ。看着满目的只招26届的字样使我频频碰壁。望着这100个沟通 ，0个交简历的累累战果，不禁让我写八股知识点的手微微发颤。清明节放假，又孜孜不倦的投了100多家，（谁能想到这就是噩梦的开始）清明节收假了，鼠鼠在学校百无聊赖的上着课件比我命长的JAVA课时。逐渐开始有10来个要我简历的厂。给鼠鼠高兴坏了！！难道双非二本鼠也有翻身处？谁能想到短短一周时间接到了十多个面试（早知道不投那么多了），没办法，八股接着背，面试时间一天俩场安排吧QAQ。第一...

代码飞升：同27已经老实

面试之前应该如何准备？

点赞评论收藏

分享

评论

15

38

招聘动态

汇丰科技中国

25届校招+26届实习

滴滴

2026届秋招储备实习生招聘

26届实习生双选会报名开启

26届实习求职交流群

理想汽车

2025春季校园招聘

26届投递链接合集

26届实习软件笔试必刷题单

招商银行数字金融训练营

火热报名中

携程集团

25届校招+26届实习

字节跳动Tik Tok

26届实习招聘

全站热榜

更多

华为实习进展

热聊中

创作者周榜

更多

正在热议

更多

# 春招进度记录 #

58528次浏览 434人参与

# 你知道哪些职场黑话？ #

26704次浏览 203人参与

# Keep实习校招 #

24555次浏览 153人参与

# 实习进度记录 #

62171次浏览 533人参与

# 软开人，说说你的烦心事 #

37884次浏览 249人参与

# 招银网络求职进展汇总 #

98477次浏览 623人参与

# 风评不好的公司，你会去吗？ #

31950次浏览 148人参与

# 你想吐槽公司的哪些规定 #

12676次浏览 43人参与

# 毕业后不工作的日子里我在做什么 #

155928次浏览 1354人参与

# 第一份工作应该选高薪还是热爱？ #

42621次浏览 397人参与

# 诺瓦星云求职进展汇总 #

189655次浏览 1629人参与

# 总结:哪家公司最喜欢泡池子 #

120108次浏览 439人参与

# 一觉醒来，秋招难度下降一万倍…… #

62420次浏览 544人参与

# 投格力的你，拿到offer了吗？ #

74817次浏览 549人参与

# 生物制药/化工校招攻略 #

39257次浏览 273人参与

# 你的实习什么时候入职 #

161376次浏览 1405人参与

# 打工人的工作餐日常 #

32498次浏览 287人参与

# 打工人的精神状态 #

40372次浏览 788人参与

# 参加完秋招的机械人，还参加春招吗？ #

39280次浏览 475人参与

# 我在牛爱网找对象 #

168311次浏览 1248人参与

# 机械制造秋招总结 #

47260次浏览 464人参与

牛客网
牛客企业服务