鹅厂 (似乎是青云计划的)WXG 大模型推理工程师一面凉经

开始各个厂的人才计划和提前批了,面一次总结一下。希望秋招有个好结果。这段时间跑去字节做训练了,推理相关的忘了好多。。。

八股+项目

  1. 自我介绍:学校,实习,开源
  2. 开始聊天:问我以后想做训练还是推理,然后给部门介绍了一个遍。
  3. 问在商汤工作写的算子:RMSNorm,如何做的算子融合。
  4. 八股开始,问NV显卡的内存模型 和计算模型。
  5. c++11 问share mem,share mem是不是进程安全的。如何保证share mem的进程安全性
  6. 问serving相关的知道哪些技术:orca,投机解码。
  7. Llama3 和 Llama2的区别,新用了哪些层:全局GQA
  8. 模型层的优化手段:MLA
  9. 接着MLA问新kv cache压缩手段:YOCO,Infini attention

写题

  1. c++矩阵乘法

------------------------------------------

秒挂,(bar还是够不上人才计划吧

全部评论
楼主是博士吗
点赞 回复 分享
发布于 07-17 23:14 美国
你是做gpu层面的吧,我咋都没看过
点赞 回复 分享
发布于 07-20 16:48 北京
都答出来了也挂了?
点赞 回复 分享
发布于 07-26 00:43 广东
请问楼主青云计划就是提前批吗
点赞 回复 分享
发布于 08-07 19:35 北京
请问一下楼主硕士期间的研究方向是什么呀
点赞 回复 分享
发布于 08-11 12:08 广东
“c++11 问share mem”这个应该是shared pointer吧
点赞 回复 分享
发布于 08-27 05:13 美国

相关推荐

5 46 评论
分享
牛客网
牛客企业服务