腾讯 一面 1. Tensorrt-LLM, AGI , VLLM源代码区别 2. 为什么要有continue batch 3. fastllm.cpp 的源代码 4. yolo加速 5. Python 计算密集型使用多进程还是多线程 6. C++继承怎么实现的 7. 最大子数组之和 二面 1. 求比特位中1个个数 2. 编译时运行 3. VLLM ,PageAttention 4. Cuda 内存模型介绍 5. 使用triton 实现 PageAttention 二面挂#金三银四,你有感觉到吗##春招提前批,你开始投了吗#