1. 问项目,四个项目全问2. 介绍unet结构3. 介绍GAN,损失函数4. 介绍下diffusion,为什么没采用5. transformer 的block结构6. transformer的attention公式7. gpt和llama区别9. gpt和bert的区别10. 分布式训练(只会pytorch的distribute)11. 问实习12. 量化ptq精度不满足怎么办13. 哪些层难量化,为什么14. qat和量化训练的区别(不知道)介绍部门情况和上班时间手撕:螺旋矩阵手撕10min,问项目八股30min,一共四十来分钟