2023-11-03 10:15 门头沟学院 Java

关注

大语言模型问题求解

现在为什么大语言模型都是decoder-only。😭

全部评论

推荐最新楼层

门头沟学院深度学习

非要找个理由的话：decoder-only采用的是因果注意力机制，causal attention mask保证了attention score一定是满秩的，而bi-direction attention mask，也就是encoder里所用的不能保证满秩。显而易见，参数矩阵的秩和它的学习能力是相关的。所以decoder-only架构潜力更大，因此也需要更多的数据才训练，模型做大的时候，它的capability是随着尺寸变大有着一个稳定增长。实际情况：海量数据+更强的训练工程。

8 回复分享

发布于 2023-11-03 11:54 浙江

门头沟学院自然语言处理

推荐苏神博客 https://kexue.fm/archives/9529

2 回复分享

发布于 2023-11-05 11:30 天津

千斗五十铃

天津大学算法工程师

我的理解是因为对话系统理论上输入是无限长的，随着轮数增加输入会越来越长，不同轮数长度差距很大，encoder采用pad的方式不擅长做这种长度区间差异过大的问题，而且只有decoder情况下，预训练和sft只是数据上不同，训练上差别不大

1 回复分享

发布于 2023-11-03 11:48 天津

西安交通大学深度学习

m

点赞回复分享

发布于 2023-11-22 10:22 陕西

10-10 16:24

门头沟学院算法工程师

好未来 10.9机器学习/CV笔试一卷

选择题日常大杂烩3道coding，AK，整体难度不大，题目是lc格式，难度差不多lc easy/medium逆天的是不同岗位意向都要做一套笔试，而且10.9-10.10期限的笔试，10.9下午才发而且我10.10安排满了，只能下班飞奔回家把两套题一起A完（乐，两套coding还有一道重复，省事儿了）等试题过期了发解析 #算法岗#  #算法工程师#  #秋招#  #好未来#

投递好未来等公司10个岗位

点赞评论收藏

分享

10-15 17:53

已编辑

门头沟学院算法工程师

IEG算法日常实习三面完又回到复试

后续：没有第四面技术面，转成hr面了，面完hr了祈祷祈祷🙏——腾讯IEG算法日常实习，三面完又回到复试状态是什么情况咧？ 是还有第四面的技术面还是三面面试官不满意

点赞评论收藏

分享

10-22 21:15

北京工业大学算法工程师

有些专业知识还是不太清楚，继续努力吧！

点赞评论收藏

分享

10-11 16:46

已编辑

门头沟学院银行管培生

#运营商笔面经互助# 中国移动信息技术中心  Ai工程师首先是自我介绍，讲了一下自己的项目。然后针对性的问了一些问题。1、你是做人工智能方向的，具体是哪方面我说我是做视觉的，平时做图像比较多，但是公司对于图像并不是特别关注。2、公司做的更多的是视频的处理，可能包括人脸识别和一些动态验证之类的，面试官问我觉得图像和视频的处理之间有没有什么区别和联系3、然后还问了一下觉得人工智能在人脸信息验证中的应用。我说的是可以用图像相似度对比的方式来验证客户和上传的图片的相似程度帮忙进行验证。4、问了我视频处理的了解程度，实验室正好有同门是做这个方向的，组会我听到的一些专业名词和方法派上用场了！总的来说，公司应该更关注某项技术在实际中的应用情况，而不是单纯的关注科研界到什么程度。面试是多对一，有很多面试官，但是不是每个人都会提问。最后反问环节，我问了一下具体的工作内容。整个时长大概20分钟。

运营商笔面经互助

点赞评论收藏

分享

11-11 17:08

已编辑

山东大学嵌入式软件工程师

华为AI软件工程师，主要以拷打项目为主，考察解决问题的综合能力，少量算法八股，手撕图论和字符串中等------------------------------------------10.21号更新，已加入300+人在泡的大池子11.11号更新，上周已报批

查看6道真题和解析

点赞评论收藏

分享

7 18 评论

全站热榜

正在热议

# 25届秋招总结 #

258385次浏览 2129人参与

# 0offer是寒冬太冷还是我太菜 #

885260次浏览 7888人参与

# 北方华创开奖 #

23413次浏览 260人参与

# 地方国企笔面经互助 #

2763次浏览 7人参与

# 学历or实习经历，哪个更重要 #

42708次浏览 317人参与

# 选完offer后，你后悔学本专业吗 #

12588次浏览 89人参与

# 应届生被毁约被毁意向了怎么办 #

27879次浏览 242人参与

# 你最想要的公司福利是？ #

41312次浏览 138人参与

# 查收我的offer竞争力报告 #

18465次浏览 248人参与

# 如何一边实习一边秋招 #

986647次浏览 12607人参与

# 一觉醒来，我觉醒了超级打工人系统 #

3207次浏览 36人参与

# 嵌入式转岗的难度怎么样 #

11076次浏览 250人参与

# 面试体验感最好的是哪家？ #

83452次浏览 815人参与

# 机械应届生薪资要多少才合适？ #

12511次浏览 61人参与

# 如何写一份好简历 #

604140次浏览 8489人参与

# 秋招OC许愿 #

227633次浏览 1878人参与

# 你认为第一份工作重要吗 #

5395次浏览 49人参与

# 秋招被确诊为…… #

59366次浏览 315人参与

# 来聊聊机械薪资天花板是哪家 #

65158次浏览 441人参与

# 你觉得第一学历对求职有影响吗？ #

14981次浏览 121人参与

# 面试题刺客退退退 #

137822次浏览 2093人参与

牛客网
牛客企业服务