拼多多+虾皮 算法实习生一面
主要是按照简历来问
部分分享:
虾皮:
在做领域数据清洗时有没有自己构建pipeline
垂直领域大模型增量训练的文本长度问题
增量训练有没有做分布式,deepspeed相关的问题
微调时,batch中数据长度不一致如何优化训练速率
代码:
实现梯度累计代码
拼多多:
数据清洗的pipeline
领域模型训练时专有词汇的处理
有没有做过强化学习,dpo训练后有没有看过token的概率分布变化
代码:
旋转二分查找
部分分享:
虾皮:
在做领域数据清洗时有没有自己构建pipeline
垂直领域大模型增量训练的文本长度问题
增量训练有没有做分布式,deepspeed相关的问题
微调时,batch中数据长度不一致如何优化训练速率
代码:
实现梯度累计代码
拼多多:
数据清洗的pipeline
领域模型训练时专有词汇的处理
有没有做过强化学习,dpo训练后有没有看过token的概率分布变化
代码:
旋转二分查找
全部评论
相关推荐

点赞 评论 收藏
分享
点赞 评论 收藏
分享