8.19 360面经

8.19 360面经
1.手撕:数组第k大的数:说是用快排或堆,我用堆后又要加快排
编辑距离:秒了
2.挑一个实习(吟唱)
3.diffusion原理,ddpm/ddim
4.训练损失函数介绍
5.flash-attention原理
6.多模态的embedding怎么融合?
7.transformer维度变化
8.反问(部门是做大模型推荐的,感觉其实不是很匹配,等消息吧)
全部评论

相关推荐

4 13 评论
分享
牛客网
牛客企业服务