鹅厂 (似乎是青云计划的)WXG 大模型推理工程师一面凉经
开始各个厂的人才计划和提前批了,面一次总结一下。希望秋招有个好结果。这段时间跑去字节做训练了,推理相关的忘了好多。。。
八股+项目
- 自我介绍:学校,实习,开源
- 开始聊天:问我以后想做训练还是推理,然后给部门介绍了一个遍。
- 问在商汤工作写的算子:RMSNorm,如何做的算子融合。
- 八股开始,问NV显卡的内存模型 和计算模型。
- c++11 问share mem,share mem是不是进程安全的。如何保证share mem的进程安全性
- 问serving相关的知道哪些技术:orca,投机解码。
- Llama3 和 Llama2的区别,新用了哪些层:全局GQA
- 模型层的优化手段:MLA
- 接着MLA问新kv cache压缩手段:YOCO,Infini attention
写题
- c++矩阵乘法
------------------------------------------
秒挂,(bar还是够不上人才计划吧