【25暑期实习】好未来大模型一面
40分钟左右,面试官很温柔
整体流程如下:
自我介绍
大模型实习项目介绍
手撕multi head self-attention
熟悉哪些微调方法
代码中除根号d的原因
知道哪些norm方式
layer norm与batch norm的区别
pre跟post norm的区别
自由提问
团队介绍
1. 大模型:mathgpt,做数学题
2. 进去做 rlhf,这个方向目前3-4人
3. 业务岗,不以发paper 为目的,但可以发
4. 算力:1k多卡的h800,不可自由使用
5. 希望尽快到岗
整体流程如下:
自我介绍
大模型实习项目介绍
手撕multi head self-attention
熟悉哪些微调方法
代码中除根号d的原因
知道哪些norm方式
layer norm与batch norm的区别
pre跟post norm的区别
自由提问
团队介绍
1. 大模型:mathgpt,做数学题
2. 进去做 rlhf,这个方向目前3-4人
3. 业务岗,不以发paper 为目的,但可以发
4. 算力:1k多卡的h800,不可自由使用
5. 希望尽快到岗
全部评论
哥们咋还和另一个大佬取情侣名呢,都是冲大模型的北大✌️,关注一波期待大模型面经了只能!
暑期实习还是日常实习啊,好未来的暑期怎么投递?
相关推荐
点赞 评论 收藏
分享