首页 / 大模型训练
#

大模型训练

#
1752次浏览 28人互动
此刻你想和大家分享什么
热门 最新
大模型训练招人了
#大模型训练##WLB#组内直招,坐标联想研究院ICI lab,薪资满意和WLB都能满足,欢迎大佬投递。简历可发邮箱liaodc5@lenovo.com岗位职责: 1. 负责设计高可用大模型训练容错系统,支持千亿大模型预训练 2. 负责大模型训练容错checkpoint优化,提升大模型checkpoint读写与恢复性能 3. 负责大模型弹性训练框架的研发 岗位要求: 1. 全日制硕士以上学历,计算机科学与技术、人工智能等相关专业; 2. 熟练C++/Python语言、数据结构以及计算机系统结构,有AI模型性能调优经验,以及良好的工程实现能力; 3. 熟悉 AI 领域常见的分布式训练技术,包括但不限于:数据并行、流水线并行和张量并行等,具有相应的项目经验; 4. 至少熟悉一种AI框架(PyTorch/TensorFlow/Paddle/DeepSpeed等),能够熟练使用和调试; 5. 熟悉 GPU 硬件结构和 CUDA 计算原理,有 CUDA 相关算子开发、调试经验,对 NCCL/cuDNN 等有一定了解; 6. 对大规模预训练模型有较好的了解,熟悉常见的预训练模型(如GPT、BERT等)结构、训练方法和优化技巧。 7. 具备出色的问题解决能力和创新思维,能够分析和解决复杂的训练问题,并提出改进和优化的方案; 8. 具有良好的团队合作精神,能够与跨部门的团队紧密合作,共同推动项目的成功。 加分项: 1. 有大模型研发和分布式训练经验 2. 熟悉Kubernetes架构以及大模型训练容错系统 3. 在AI或者HPC领域发表过高水平论文
投递联想研究院等公司10个岗位
点赞 评论 收藏
分享
大模型算法招聘啦
【金融上市公司】【校招】【社招】【大模型算法/产品/开发】项目简介:九方AI中心面向九方智投APP九哥数字人,金融IP数字分身系统,金融对话助手StockChat和九章证券大模型平台,立足于打造九方金融超级智能体StockChat。StockChat可以基于大模型LLM进行用户交互中的自主规划决策,工具调用,记忆构建和使用,对话回复生成。项目内容涉及到金融领域的理解任务和生成任务及相关基准构建和评测标准。【岗位:大模型算法工程师(训练)】 【岗位职责】1. 负责金融AI Agent的核心逻辑实现,算法及模型的设计、实验、调优等研发工作;2.负责自然语言处理基础能力建设,针对金融领域场景搭建自然语言处理基础组件;3.从事大语言模型高效参数微调Lora, Q-Lora, p-tuning相关业务侧研发。4从事金融AI Agent 相关Memory, Tools-Learning, Planning相关模块研发。5.跟踪业界前沿技术的发展,探索大模型,AI Agent等前沿技术在金融对话助手场景下的应用前景。【岗位要求】1. 学历要求:计算机科学、人工智能、数据科学或相关专业硕士及以上学历;2. 有出色的编程能力,至少熟练掌握Python/Java/C/C++/Golang等一门编程语言;3. 熟悉大语言模型LLM相关技术,包括但不限于CoT, 指令微调SFT,RLHF, DPO等;4.熟练掌握Tensorflow/pytorch/Keras等至少一种深度学习框架;5.参与过问答、对话等实际项目的开发,并对领域前沿算法有研究;6. 出色的分析问题、解决问题能力;7. 责任心强,积极主动,有良好的沟通能力和团队合作能力。【岗位:大模型算法工程师(加速)】  【岗位职责】1与团队合作,优化算法和模型架构,以适应并充分利用硬件资源,如 GPU, CPU等。2、参与模型推理加速优化的性能分析和调优,识别和解决瓶颈问题,提高模型的推理速度。3、实施并维护自动化工具和流程,以简化和加速模型推理的部署过程。4、跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展。【岗位要求】1. 学历要求:计算机科学、人工智能、数据科学或相关专业硕士及以上学历;2. 有出色的编程能力,至少熟练掌握Python/Java/C/C++/Golang等一门编程语言;3. 熟悉常见的分布式机器学习框架,Megatron、DeepSpeed、HuggingFace4、熟悉 GPU 和其他加速硬件的使用,有相关的性能调优经验,有FastTransformer、CUDA优化、TensorRT、Triton, vllm一些经验更好5、熟悉分布式计算和并行计算的概念和技术,有相关的实际经验。6、熟练使用编程语言,如 Python、C++ 等,在模型训练和推理的开发过程中有丰富的编码经验。7、具备良好的沟通和团队合作能力,能够与跨功能团队密切合作,解决问题并实现共同目标。【岗位:大模型算法工程师(评测)】【岗位职责】1. 负责金融agent的测试与评估相关工作,构建金融对话场景理解基准benchmark和生成基准benchmark;2. 开发自动化测试脚本,实现金融agent相关任务的评测,包括机器指标,人工指标及评分标准;3. 负责测试结果报告撰写及数据整理、分析及归档,协助算法进行模型效果状态跟进与支持;4. 与算法/研发团队密切合作,提供模型badcase的跟踪、修复与验证。【任职要求】:1. 学历要求:计算机科学、人工智能、数据科学或相关专业硕士及以上学历;2.熟悉python语言,能进行测试工具或自动化脚本的开发3.有大模型评测或测试工具使用经验人员优先,如Jmeter,postman,selenium等4了解大语言模型LLM相关技术,包括但不限于CoT, 指令微调SFT,RLHF, DPO等;5. 聪明、思维发散度高、具有很强的学习和独立解决问题的能力6. 责任心强,积极主动,有良好的沟通能力和团队合作能力。【岗位:金融Agent产品经理】  【岗位职责】1、建设金融领域AI Agent,深入业务场景,梳理业务痛点与需求,创新与迭代Agent产品,包含产品应用场景规划、业务流程设计、产品功能设计,能输出清晰的PRD文档; 2、制定AI Agent产品的长期发展战略和规划,明确产品定位、目标市场和商业化;3、负责跟进和探索AI领域前沿技术以及产品应用趋势,结合场景提供解决方案。【岗位要求】1、本科及以上学历,计算机、数学、金融相关专业优先;2、3年以上AI产品工作经验,对AI Agent、LLM有深入研究和实践经验3、具有较强的责任感、目标感以及团队合作精神,逻辑思维和表达能力突出,热爱钻研产品逻辑和业务场景;4、熟悉常用的机器学习/深度学习算法模型,了解LLM应用架构;5、负责过AI Agent产品者优先,例如AI咨询师、AI主播、AI老师、AI律师等;【岗位:Java开发工程师】【岗位职责】1. 负责人工智能应用开发的需求分析、系统设计和研发工作;2. 负责编写高质量代码,完成算法能力的接入并保证系统性能;3. 对现有系统和接口性能的改进和优化工作。4. 编写技术文档和API文档,确保代码的可读性和可维护性;5。遵循敏捷开发流程和编码标准,参与代码审查,确保代码质量和项目进度。【岗位要求】1. 学历要求:计算机科学、人工智能、数据科学或相关专业本科及以上学历;2. 有出色的编程能力,至少熟练掌握Python/Java/C/C++/Golang等一门编程语言;3. 具备一定的基于数据库、缓存、分布式存储开发高性能、高可用数据应用的实践经验;4.有使用微服务框架研发系统的相关工作经验,熟悉常用的中间件;5. 具备一定的问题排查能力,熟练使用工具快速定位并解决问题;6. 责任心强,积极主动,有良好的沟通能力和团队合作能力。【岗位:大模型研究实习生】【岗位职责】1. 负责金融AI Agent的核心逻辑实现,算法及模型的设计、实验、调优等研发工作;2.负责自然语言处理基础能力建设,针对金融领域场景搭建自然语言处理基础组件;3.从事高效参数微调Lora, Q-Lora, p-tuning相关任务研究,发表顶级会议论文。4.跟踪业界前沿技术的发展,探索大模型,AI Agent等前沿技术在金融对话助手场景下的应用前景。5同时撰写前沿论文,投递到顶会中,包括ACL/ /COLM/EMNLP/COLING/NAACL等。【岗位要求】1. 学历要求:计算机科学、人工智能、数据科学或相关专业硕士及以上学历;2. 有出色的编程能力,至少熟练掌握Python/Java/C/C++/Golang等一门编程语言;3. 熟悉大语言模型LLM相关技术,包括但不限于CoT, 指令微调,RLHF, DPO等;4.熟练掌握Tensorflow/pytorch/Keras等至少一种深度学习框架;5.参与过问答、对话等实际项目的开发,并对领域前沿算法有研究;6. 出色的分析问题、解决问题能力;7. 责任心强,积极主动,有良好的沟通能力和团队合作能力。投递方式:标题注明申请岗位信息+姓名简历投递:harvey2@mail.ustc.edu.cn工作地点:上海银科金融中心公司简介:九方智投,成立于1996年8月,九方智投控股(股票代码:9636.HK)旗下品牌,国内首批获得证券投资咨询资格的机构之一(许可证号:ZX0023),中国证券业协会会员理事单位。公司坚持“科技+投研”双驱动,从投资策略、投资风控、智能投顾等多方面为投资者打造一站式证券投资顾问服务。AI部门简介:九方人工智能研发中心依托于九方大模型AI团队,目标是打造新一代对话式股票投资助手,目前落地产品包括九方智投APP九哥数字人,金融IP数字分身系统,金融对话助手StockChat等。目前自主研发的九章证券大模型相关技术、知识图谱、OCR文字识别技术、图像识别技术、大数据、智能语音技术(科大讯飞联合)等赋能于各个产品线金融业务场景。目前合作单位包括香港科技大学(广州)、粤港澳大湾区数字经济研究院(IDEA研究院),约翰霍普金斯大学等,成果已经和即将发表在ACL, EMNLP, COLING会议上。#大模型训练##大模型招聘##社招##校招#
投递中国科学技术大学等公司10个岗位
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务