大佬们问个问题 1.预训练的损失函数和微调的损失函数计算有什么不同？关注点有什么

重庆范冰冰

08-20 10:09 已编辑南京航空航天大学算法工程师发布于江苏

关注

大佬们问个问题
1.预训练的损失函数和微调的损失函数计算有什么不同？关注点有什么差异？
2.预训练后的模型获得了什么样的能力？微调后又获得了什么样能力？

昨天面试的时候被问到了😭

全部评论

推荐最新楼层

爱打瞌睡的柯基

门头沟学院自然语言处理

预训练所有token位置都计算损失、SFT一般只有答案部分计算损失（提问部分label是-100）预训练是为了吃知识、SFT为了指令遵循

7 回复分享

发布于 08-20 16:37 广东

希望有好offer

百度_nlp/llm(实习员工)

预训练和微调的任务不同损失函数肯定会不同吧？预训练不都是自回归而微调可能会根据下游任务设计不同的损失函数

点赞回复分享

发布于 08-20 11:18 北京

CovetousC

天津大学算法工程师

这个预训练是指的视觉编码器的预训练，还是mllm的第一阶段预训练

点赞回复分享

发布于 09-08 11:53 天津

11-03 21:31

门头沟学院图像识别

汇川联合动力求职状态

想问下这种情况是还在泡池子还是说等待下一步发offer？

点赞评论收藏

昨天 23:31

The University of Sydney C++

腾讯校招提前实习

应届生腾讯校招提前实习是不是100%薪资？

宝你的offer真好看：好像实习 6 个月还算工龄

投递腾讯等公司10个岗位 >

点赞评论收藏

10-13 13:35

第一拖拉机制造厂拖拉机学院 Java

逆天

太逆天了这个

挣K存W养DOG：他真的很中意你，为什么不回他

点赞评论收藏

09-19 22:42

武汉理工大学自动驾驶系统工程师

比亚迪

高攀不起迪子了😭😭

GGrain：没事，本硕985也不发面试笔试😖

点赞评论收藏

8 13 评论

全站热榜

正在热议

# 不考虑薪资和职业，你最想做什么工作呢？ #