百度提前批 分布式计算研发工程师 一面
cuda流 stream 了解吗?同步呢?什么时候使用到同步
了解MLIR的dialect吗 具体做什么?tvm的dialect呢
解释下数据并行和模型并行
模型并行的具体实现,具体的参数怎么区分
deform conv和conv的区别
sbp机制切分例子:x[512,1024,768],w[768,768],如何切分,使得分布式训练更加高效
手撕算法:
实现优先队列
非递归方式实现树的后序遍历
个人体会:经历过难度最大的面试之一,会根据细节深入提问,直到不会为止