网易互娱-n星计划-AI研究工程师面经

ailab,base 广州,做游戏npc,代码生成等业务
9.19 一面
1、项目相关
2、llama用的什么注意力?
3、flashattention简单讲一下?
4、ppl是什么?
5、如何选取训练后的模型?
6、有试过将多个模型权重合并吗?
7、训练时loss暴增可能是什么原因,怎么解决
8、有哪些节省显存的方式?
=======================
9.25 二面
1、项目相关
2、介绍一下SFT,lora,reward model,DPO
3、SFT只计算回答部分的损失合适吗?
4、模型蒸馏了解吗?损失是什么?可以用KL散度吗
5、交叉熵和KL散度的公式是什么
6、MQA,GQA是什么,deepseek的MLA了解了吗
7、如何训练一个代码检索模型?
8、reranker的训练目标?训练目标和我们希望的目标是否有不一致的地方,就比如训练时q-d对的匹配概率,但我们希望是检索的文档对大模型有用,这两个目标是否存在不一致呢?
========================
10.17 三面
全程问项目
========================
10.23 hr面
========================
无意向,目前还在泡池子
全部评论
差不多同时间hr面,还没结果
点赞 回复 分享
发布于 12-12 19:37 北京

相关推荐

#实习生##百度##大模型#(至少26届)百度-智慧城市-北京-测试开发实习生。  音频、视频算法背景最佳,其他要求如下:1、开源大模型部署、使用经验,例如文生图、文本、视觉等(stable diffusion/llava/gpt/阿里Qwen/商汤internVL等等)2、传统视觉模型部署、测试经验优先(yolo系列等等),对于模型测试集有扩充、筛选经验优先工作职责-负责需求分析、测试用例设计、功能测试、性能&压力测试、稳定性测试、高可用测试以及跨产品的联调测试等-负责Web端、服务端相关测试,CI/CD流水线建设和优化、监控体系建设和优化-协助研发定位问题,并对产品及流程提出持续性改进建议-负责根据各项规范推进项目如期上线 ,迭代结束后归纳总结经验教训职责要求-计算机相关专业,本科及以上学历;-能熟练地应用以下一门或几门技术进行相关开发:C/C++/Java/object-c/goland、Linux/Unix Shell、Perl/Python/PHP、JavaScript/Html/Ajax-熟悉云原生架构及原理、熟悉K8S和Docker相关技术者优先-有测试实习经验者优先-具备快速的产品及业务学习能力,敏捷全面的逻辑思维能力-对软件测试有浓厚的兴趣,有很强的分析,问题定位能力和项目推动能力-具有良好的沟通协调能力、较强的团队合作精神、优秀的执行能力-热爱互联网,对互联网相关业务或技术充满好奇及热情
投递百度等公司10个岗位
点赞 评论 收藏
分享
评论
3
1
分享
牛客网
牛客企业服务