腾讯WXG 技术架构面经
一面
1. 项目介绍
2. 介绍MPS
3. 推荐模型训练技术, embeding和MLP的分离部署
4. 模型训练 数据并行的通信量, 通信算子
5. CUDA warp执行模式
6. transformer架构
7. 位置编码(问了, 但我说我不太了解就也没再细问下去)
二面
写代码, mem allocator
1. 项目介绍
2. 介绍MPS
3. 推荐模型训练技术, embeding和MLP的分离部署
4. 模型训练 数据并行的通信量, 通信算子
5. CUDA warp执行模式
6. transformer架构
7. 位置编码(问了, 但我说我不太了解就也没再细问下去)
二面
写代码, mem allocator
全部评论
佬,最后怎么样?
相关推荐
点赞 评论 收藏
分享

点赞 评论 收藏
分享
点赞 评论 收藏
分享