活干不过来了 seed 训练框架抓实习生

在线抓一个实习生 最近框架活太多干不过来了 没啥细致jd 熟悉大模型 熟悉Megatron/deepseed 熟悉torch python 有一些框架层面项目经历 牛客私我简历 简历直达主管
全部评论
秋招有hc嘛,训练的
点赞 回复 分享
发布于 2024-09-06 01:13 陕西
学长怎么也开始研究分布式了
点赞 回复 分享
发布于 2024-08-27 12:09 江苏
update 日常实习 今年是没法转正的
点赞 回复 分享
发布于 2024-08-26 16:19 北京
只能base北京
点赞 回复 分享
发布于 2024-08-26 14:24 北京

相关推荐

作为AI产品经理,大模型选型需要从业务目标、技术特性和资源投入三个维度进行系统性评估。分步骤的选型:1. 场景需求拆解- 任务类型:区分生成式(GPT)、理解式(BERT)、多模态(CLIP)等任务需求- 性能指标:明确时延要求(如对话场景<2s)、准确率阈值、内容安全等级- 输入输出:处理文本长度(如法律文本需支持10k tokens)、多语言支持需求2. 技术参数评估- 模型架构对比:Transformer层数(如LLaMA 7B vs 13B)、注意力机制差异- 性能基准测试:在HuggingFace OpenLLM Leaderboard等榜单比对MMLU/HELM得分- 领域适配性:检查是否经过垂直领域微调(如Med-PaLM 2医疗专用模型)3. 成本效益分析- 推理成本计算:API调用成本(如GPT-4 $0.03/1k tokens)vs 自建GPU集群成本- 算力需求评估:模型参数量与GPU显存关系(7B模型需至少16G显存)- 长尾运维成本:监控维护、版本迭代、安全补丁更新等隐性成本4. 工程化适配度- 部署方案验证:测试ONNX转换效果、量化后精度损失(INT8量化典型损失2-5%)- 扩展能力测试:分布式推理效率、最大并发请求承载量- 工具链完整性:配套的Prompt工程工具、评估体系、持续训练Pipeline5. 风险合规审查- 数据隐私合规:评估模型训练数据来源合法性(如排除版权争议数据)- 输出可控性:测试有害内容生成概率及防护机制有效性- 许可证审查:确认商用限制(如LLaMA商用需单独授权)6. 迭代路线规划- 短期方案:采用API快速验证(如Azure OpenAI)+ RAG增强时效性- 中期过渡:微调行业小模型(LoRA适配器方案)- 长期演进:构建混合模型架构(大模型+规则引擎+传统ML) #牛客激励计划#  #大模型#  #大模型面经#  #找工作#  #聊聊我眼中的AI#  #数据人的面试交流地#  #AI了,我在打一种很新的工#  #产品经理# #牛客AI配图神器#
点赞 评论 收藏
分享
评论
4
5
分享

创作者周榜

更多
牛客网
牛客企业服务