momenta意向,一二三面面经,算法岗
(一面)
1、自我介绍
2、讲paper
3、coding
transformerLayer: self-attn和ffn实现;
继续问sqrt(dk)的作用,能不能用norm呢?
写太快又来一题:求一个6面均匀的骰子,不断投,每面至少出现一次的期望
模拟
进一步误差如何得到: 多测几组得到均值和方差
4、介绍组里做的方向:主要是深度学习的轨迹预测
(二面)
1、 大致过一遍项目
2、 问炼丹熟练度:
Loss nan遇到过吗?怎么办
Cuda超显存遇到过吗?怎么办
不收敛遇到过吗?怎么办
训练慢遇到过吗?怎么办
Profiler用过吗?用来debug什么
部署经历有吗
3、 反问
介绍组里planning方向
(三面)
1、自我介绍
2、讲项目
3、视觉,nlp,多模态大模型的进展
4、instructGPT的RL损失相比有监督损失有什么作用:调节正负样本距离
5、写题:输出所有的连续正整数序列,和为输入的target
6、反问
#24届软开秋招面试经验大赏##momenta面经##秋招#