大模型岗0821:投递简历0911:一面0913:二面0919:HR面0924:OC一面(40m)- 主要聊项目,最后问了一些八股- 讲一下self-attention- 为什么要除以根号d?为什么是根号d不是别的?如果不除以根号d会有什么后果?- 为什么NLP用LN不用BN?- 神经网络为什么要有归一化层?- 为什么每一层保持相似的数据分布会使训练稳定?背后有什么数学原理吗?二面(45m)全程挖项目,以及一些开放性话题交流HR面(20m)- 实习期间最有成就感的三件事情- 本科成绩如何?考研还是保研?考研成绩如何- 考研时是怎么选择专业和导师的- 对于工作最看重的三点- 怎么看待头部大厂和小而美的独角兽企业- 如何看待元象- 觉得目前大模型有什么场景是还有待探索的- 学习大模型相关技术的过程遇到最大的困难是什么?已经拒了。#晒一晒我的offer##面经##算法工程师#