唯品会大模型二面凉经

1. 讲一下大模型从0到1的训练过程
2. 为什么不能跳过SFT去做RLHF
3. 有哪些提高predict质量的方法(self-consist、cot、few-shot等)
4. 在pretrain中同时有代码和文字知识,在SFT时学习新的代码和文字知识哪个更难?(从pretrain的指标(PPL)上分析)
5. 在做训练时出现复读现象如何debug?怎么解决推理时的重复现象?

另外求教一下第2题是为什么🧐 #实习,投递多份简历没人回复怎么办#  #实习,投递多份简历没人回复怎么办#  #牛客解忧铺#  #牛客在线求职答疑中心#  #不给转正的实习,你还去吗#    #大模型#
全部评论

相关推荐

01-26 22:20
已编辑
门头沟学院 Java
Java抽象带篮子:项目很nb了,现在好好准备八股和算法吧,早点找实习,可以看看我的置顶帖子。帖子里写了怎么改简历,怎么包装实习经历,还有2个高质量可速成的项目话术,和我的牛客八股笔记专栏
点赞 评论 收藏
分享
评论
8
26
分享

创作者周榜

更多
牛客网
牛客企业服务