滴滴 机器学习基础平台 面经
滴滴 机器学习基础平台 面经
发个面经攒攒人品
- 量化的工作介绍;
- W4A8;
- SIMD中浮点数和整数指令;
- 量化的逻辑,如果计算;
- W怎么计算到4位,A怎么计算到8位;
- 量化校准策略;
- 其他量化方法;
- FP16训练精度损失问题如何解决;
- 增大BS为什么会减少通信次数;
- 更新和保存的overlap如何做;
- GPT-2迁移后如何验证是对的;
- 激活值、梯度、权重分别怎么验证;
- 微调怎么做的;
- LORA微调、Prompt微调;
- GPU架构,A100有那些计算资源;
- Tensor core介绍;
- 大模型训练指标MFU;
- Nsight system;
- CUDA内存模型介绍
- 一个block可以在多个SM上处理嘛;
- CUDA如何隐藏不同warp之间的延时;
- 大模型结构、视觉、大语言、多模态、MoE、扩散模型;
- 常见的attention变体;
- 手撕:消除数组中的重复数;
挺迷的一场面试,感觉基本没有什么答不上来的,不清楚为什么挂掉
#面经#