寒武纪-AI解决方案-一面面经
1. 问项目,四个项目全问
2. 介绍unet结构
3. 介绍GAN,损失函数
4. 介绍下diffusion,为什么没采用
5. transformer 的block结构
6. transformer的attention公式
7. gpt和llama区别
9. gpt和bert的区别
10. 分布式训练(只会pytorch的distribute)
11. 问实习
12. 量化ptq精度不满足怎么办
13. 哪些层难量化,为什么
14. qat和量化训练的区别(不知道)
介绍部门情况和上班时间
手撕:螺旋矩阵
手撕10min,问项目八股30min,一共四十来分钟
2. 介绍unet结构
3. 介绍GAN,损失函数
4. 介绍下diffusion,为什么没采用
5. transformer 的block结构
6. transformer的attention公式
7. gpt和llama区别
9. gpt和bert的区别
10. 分布式训练(只会pytorch的distribute)
11. 问实习
12. 量化ptq精度不满足怎么办
13. 哪些层难量化,为什么
14. qat和量化训练的区别(不知道)
介绍部门情况和上班时间
手撕:螺旋矩阵
手撕10min,问项目八股30min,一共四十来分钟
全部评论
佬,有后续嘛
这是算法岗位吗,怎么问的都是算法相关
相关推荐
11-06 23:14
博尔塔拉职业技术学院 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享