一面 1. 自我介绍2. 项目介绍3. 预处理cuda加速4. 吞吐量如何增加5. 模型量化,体积减小与速度提高分析,精度分析6. 混合精度量化7. 多摄像头特征,多传感器特征如何对齐?8. bev的缺点,有什么问题9. chat-glm的预训练是怎么做的?10. 为什么没有q的cache11. 目标跟踪论文的介绍,拷打12. 小目标检测的trick13. bert与vit的位置编码,chat-glm的位置编码14. transformer结构加速15. flash attention16. 如何设计一个框架,支持后端各种不同硬件的推理框架17. layernorm如何计算的,是对哪一个维度18. safe softmax19. 特征值是什么,不同类型的特征怎么对齐,怎么评判提取一个特征好不好20. softmax对某一个类别的梯度,怎么计算的,是不是恒为正21. BN前如果有线性层,线性层还要加bias吗50分钟#高性能计算面经##高性能计算##模型部署##秋招#