KPI吧
点赞 1

相关推荐

        加入vivo AI大模型团队也已经一个月了,总结一下入职以来的工作内容!        我们的主要业务场景是研发手机端侧多模态大模型,让手机在端侧实现复杂任务的自主执行。比如你对着手机说“帮我在滴滴上预约一辆明天中午从机场到公司的顺风车”,它就能自动执行~作为实习生,我的主要职责有:模型蒸馏与数据构造:        用业界前沿的cot模型(如DeepSeek-R1、QwQ-32B)生成高质量动作思考数据,去提升我们轻量级端侧模型的能力。这里会涉及到prompt的构造,以及调节参数利用模型去构造高质量数据的策略,多次采样,构造思维链等等,还要设计各种实验去验证效果,在这个过程中我也慢慢理解了数据质量对于模型效果的影响。训练微调奖励模型:        此外,我还要微调训练RM,通过构造多模态偏好样本对(例如用户对图像的操作、指令执行结果的反馈数据),基于Lora微调或全量微调多模态基座模型(如qwen2.5-VL),确保其可以对模型的输出结果做精确的评估,用于偏好对齐阶段的GRPO(奖励来源于规则或RM) 或DPO策略,进一步提升任务完成率。具体实现起来会涉及很多细节,可能需要对比不同损失构造方式和不同策略的优劣,但同时也能在这个过程中快速学习成长。        此外,为了提高模型的上限,组内的大佬们同时也会做预训练,每次开组会都会学到很多LLM的知识,从预训练的数据配比,到模型指标的分析,以及“工业级大模型”的实战经验!组内还会经常开展各种技术分享会,从分布式框架优化到多模态对齐策略,甚至模型底层的网络结构优化,每次都会让我受益匪浅!​         如果你也对我们的业务感兴趣,非常欢迎加入我们,关注:vivo-HR牛客账号,我们有:团队氛围:成长加速器,组里有顶会论文作者、开源框架贡献者,随时可以请教!​前沿项目实战:从模型训练到产品落地,全程参与AI从实验室到用户手中的闭环。​资源管够:千卡集群随便跑实验,模型训练效率翻倍~💻 #vivo#  #vivo招聘#  #互联网大厂实习#
点赞 评论 收藏
分享
牛客网
牛客企业服务