大模型预训练面经(五)

  1. 你了解 Mixtral 8*7B 模型训练的优化组选择吗?
  2. 机内通信首选的策略组应该是什么,选择的原因是什么?
  3. shared_memory 一定重要吗,cuda 中的 memory 种类和使用方式介绍一下
  4. cuda launch 的过程,CPU 端怎么知道命令完成的
  5. GPU 之间的通信是如何完成的
  6. cuda 的计算和通信指令是如何发出的
  7. CP 的并行方式和并行思想,ring 和 ulysses 的技术介绍
  8. 介绍一下在大模型训练/推理过程中常见的通信原语
  9. 请解释并介绍一下 Roofline 模型,是怎么运用到实际场景中的
  10. 如果给你一些 CPU,GPU 的型号,你如何去对他们进行比较合适的组装,以及机内机间的带宽你要如何选择(开放题
  11. 对于大模型发展的看法(开放题
全部评论

相关推荐

1 1 评论
分享
牛客网
牛客企业服务