理想大模型实习面经

1.自我介绍
介绍项目
项目我尽量说的久,面试官中途打断了。
2.LLAMA 和 ChatGLM 的区别
Norm, mask, 激活函数 位置嵌入这四方面答
3.BatchNorm 和 LayerNorm 什么区别
后面进入快问快答。。。。很奇怪的一个环节
1. Bert 的参数量是怎么决定的
(没答上来, 不太理解这是考什么角度)
2. Transformer 的位置 embedding 怎么计算(三角函数。。。没了,就是这么快)
3. p tuning v2 和 prompt tuning 的区别
4.常用的分词方式
5.多头注意力机制和单个注意力机制时间复杂度会变吗?
6. 有了解过怎么解决灾难性遗忘吗?

还有一些小问题,有点记不住了。整体八股不难。重点还是项目。
算法题没做,让我当场写一下 pytorch 的一些常用的算法,就是看看我这些代码熟练度怎么样。我就随便写了一下 SFT 的数据预处理。
全部评论
佬,得物春招正在进行中,你要是感兴趣可以去我主页帖子投递一下
2 回复 分享
发布于 03-12 14:25 陕西
m
点赞 回复 分享
发布于 03-07 17:42 广东
pytorch 的一些常用的算法,指的啥,能详细讲讲吗
点赞 回复 分享
发布于 03-08 09:13 安徽
佬,这是日常实习还是暑期实习
点赞 回复 分享
发布于 03-09 23:16 重庆
你永远可以相信理想没用任何技术
点赞 回复 分享
发布于 03-24 14:36 天津
感觉像是我之前遇到的一个面试官(他们面试太神秘了
点赞 回复 分享
发布于 03-25 16:08 北京
面经千篇一律,大佬讲讲项目好了
点赞 回复 分享
发布于 04-06 04:49 江西

相关推荐

评论
16
109
分享
牛客网
牛客企业服务