寒武纪-AI解决方案-一面面经

1. 问项目,四个项目全问
2. 介绍unet结构
3. 介绍GAN,损失函数
4. 介绍下diffusion,为什么没采用
5. transformer 的block结构
6. transformer的attention公式
7.  gpt和llama区别
9.  gpt和bert的区别
10. 分布式训练(只会pytorch的distribute)
11. 问实习
12. 量化ptq精度不满足怎么办
13. 哪些层难量化,为什么
14. qat和量化训练的区别(不知道)
介绍部门情况和上班时间
手撕:螺旋矩阵
手撕10min,问项目八股30min,一共四十来分钟
全部评论
佬,有后续嘛
点赞 回复 分享
发布于 11-01 10:41 北京
这是算法岗位吗,怎么问的都是算法相关
点赞 回复 分享
发布于 11-06 22:25 上海

相关推荐

1 7 评论
分享
牛客网
牛客企业服务