三轮技术面,三个面试官都非常和善,之后应该是 hr 面了。总体来讲一面比较八股,中规中矩;二面更多是模型效率优化相关问题;三面项目问得很深入,基础知识也比较难。一面:20 分钟项目介绍,20 分钟基础知识,20 分钟代码题- 项目介绍 - 关于 Efficient Transformer 的 E.&A. 论文- 基础知识 - cache 每一个 chache line 包含 3 个部分, 分别是什么作用? - 多级 cache 的原因 - cache miss 之后的流程 - 页表机制带来的开销以及如何缓解 - 页表的好处 - C++ 重载机制以及如何...