美甲大模型(二面)

🔞 美甲
🧑‍🔧 语音算法实习生
😶‍🌫️ 项目提问+基础理解+代码
1. 自我介绍
2. 介绍自己的论文(问得好细,质疑创新点、消融实验,一开始我的说法有点问题,面试官会揪着不放,幸好后面解释了一波)
3. 你觉得当下的大模型相对于之前初代的bert等模型主要解决了什么样的问题?从原理上来讲,为什么现代大模型在生成式任务的能力要强于以前的MLM类的大模型?
4. 现在大模型为了达到规模扩增,主要做了哪些技术上的优化?旋转位置编码相比于绝对位置编码好在哪儿?为什么不用绝对位置编码?
5. 谈谈为什么MoE机制会成为主流?如何解决MoE训练过程中出现的路由偏爱(路由失效)现象?负载均衡是作用在什么上面的(模型 or token)?
6. 代码:删除单向链表中的倒数第二个元素。
反问:日常工作内容?对我有什么建议?

这次面试与一面有很大不同,削弱了硬性八股的内容,更偏向于考核对大模型的理解。面试官也是蛮随和的人,每回答一个问题会及时给到我反馈,认可or纠正我的回答,这使得整个面试过程都有一个积极的刺激。最后说我对大模型的直觉挺到位的,我还挺开心的🥰
#面经#
全部评论
写面经的时候已经oc了,不枉我准备了这么久
2 回复 分享
发布于 02-28 00:03 北京

相关推荐

不愿透露姓名的神秘牛友
03-31 21:17
小米 后端 24k*15 硕士985
点赞 评论 收藏
分享
03-26 15:18
已编辑
华北水利水电大学 Java
点赞 评论 收藏
分享
评论
点赞
13
分享

创作者周榜

更多
牛客网
牛客企业服务