投的上海的高性能计算被挂了,被北京的高性能计算的语音技术部捞了百度面试官非常好,体验感非常棒,奈何自己太菜了,全程道歉一面 8.2项目深挖算子开发相关涉及知识点 GPU架构,内存模型并发编程 锁 信号量 创建线程的几种方式lambda表达式的底层是怎么实现的std::move 使用场景,他比赋值构造好在哪lock_guard相比较于lock/unlock能防止什么问题?cuda 编程 矩阵转置会遇到什么问题(说是什么访存合并)模型量化 问在int8量化怎么保证在不降点的情况下保持推理速度全程40分钟结束面试官每道题都给我分析解答,体验感非常nice,他是真的想教会我寄是肯定寄了,沉淀沉淀正式批再战!