算法暑期实习面经

投递时间3.10~4.10
面了淘天 控股 字节 腾讯 蚂蚁的大模型岗
大概问的都差不多,主要是简历的东西,剩下一点时间会问一些八股。
总结一下八股:强化学习(目前每个面试官都会问),L1 L2正则化,LoRA原理,其他PEFT方法,SFT和DPO的区别,SFT和DPO训练心得,Transformer结构,位置编码,长度外推,优化器,flash attention,分类为什么用cse而不是mse,BERT系列训练流程与各种变体,AUC指标,最近读过的论文。
#暑期##算法#
全部评论

相关推荐

点赞 评论 收藏
分享
评论
4
3
分享

创作者周榜

更多
牛客网
牛客企业服务