(社招)京东-算法工程师工程师-LLM强化学习
薪资面议
算法工程师 北京 硕士 1-3年 1 个工作日内
岗位关键词
岗位职责
负责多智能体的强化学习和多智能体联合训练:
1.负责大模型的工业应用与算法落地,包括但不限于智能问答、RAG和Agent等领域;
2.在特定领域和场景下,对大模型进行继续训练,涉及微调和强化学习等方法,优化大语言模型在业务场景中的应用效果;
3.跟进大模型与强化学习技术的前沿发展,提升算法效率与性能。
岗位要求
1.硕士及以上学历,计算机科学、数学、运筹学、统计学等相关专业;
2.熟悉大模型领域的前沿技术,掌握大模型的基本原理及其训练和微调方法;
3.深入理解强化学习的知识体系,熟悉主流强化学习算法如PPO、A3C、DQN等;
4.熟练使用Python或C++等编程语言,掌握常用数据结构;熟练使用TensorFlow或PyTorch等至少一种深度学习框架;
5.有RLHF、多智能体学习、分布式强化学习等实际训练和应用落地经验者优先;
6.在顶级会议或期刊上发表过论文,或参加过国际竞赛并取得优异成绩者优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报