1. (项目的点衍生出来的)RoPE 原理,手撕2. Transformer MHA 手撕3. vLLM为什么能加速?PagedAttention4. CPU/ GPU 架构,为什么设计 GPU5. GPU 硬件架构具体介绍一下6. 发散的问题:怎么看待AGI,怎么看待大模型的“智能”,平时用什么大模型?(回答豆包,感觉应用做的比较好)感觉整体问的还是比较深入的,一个问题可以拓展出很多细节。问题比上午的电信更理论一些,电信更落地更贴近业务(?可能是面试官的仁慈)偏八股吧,美团全是项目…可能是暑期实习和日常实习的差别?