阿里 飞猪 大模型 暑期实习 一面&二面&hr面

已发意向

一面

手撕:三数之和

过实习

预训练数据构造

数据配比

如果现在重做一遍项目,怎么跟DeepSeek的技术结合

能不能直接通过RL训练chat模型

大模型八股

sft、dpo的区别,什么时候用哪个

MHA、GQA、MLA的异同

从Bert开始讲,位置编码的演进和注意力机制的关系

py八股

除了py外,还有用什么语言

进程、线程区别,什么时候用哪个

平常用的什么包,numpy、pandas有用吗

生成器、迭代器

日常

有没有其他在投,城市偏好

反问

评价?整体不错

业务?有训练做知识注入、也有做问答系统

流程?三面,两面技术一面hr

大概40min

二面

无手撕

聊科研

介绍实习

灾难性遗忘怎么缓解的

sft后什么情况下用dpo

对大模型的发展方向怎么看

反问

评价?满意,过

给实习生资源做探索性实验?给

约25min

hr面

问base、实习收获

其他的忘了,没有技术相关的

反问

意向?3天内,实际面完秒发

约20min

总结:一面有些八股,问py八股是没想到的,另外三轮面试都问base,说广东人很多不愿意出省

#牛客AI配图神器#

#大模型##互联网##暑期实习##阿里#
全部评论
佬,时间线大概是怎么样,一面完多久二面的,我一面被拷问麻了,根本不敢问评价
点赞 回复 分享
发布于 04-10 18:12 陕西

相关推荐

今天老师给大家分享大模型项目准备经验,供各位同学参考学习。1️⃣大模型流程✅数据处理:1.参考 deepseek 、 llama 、 qwen 等技术报告的数据清洗工作;2.强烈建议使用 Data - Juicer 做启发式数据清洗工具;3.做数据多样性探索,保证 Prompt 的多样性;4.做数据质量增强,用强基座做数据改写等。做拒绝采样保证 response 的" Online "性质。✅开始训练:1.卡多做 CPT ,没卡就基于 Base 模型做 Post - Training ;2.不同规则的模型调参差异大,参考大厂技术报告和其他博客;3.试试不同的训练策略,有挺多 fancy 的增量预训练和 Post - Training 方法,多试试;✅评估 Case :1.在常见的 Benchmark 上看看效果,脚本都有现成的;2.不要只看指标和 loss ,多分析 case ,知道加什么数据,摸清模型的边界能力,持续迭代优化模型能力;3.基座或者 Chat 作为 Baseline ,对比看看效果。2️⃣做一个垂域大模型项目资源准备:你需要准备至少4张3090级别的显卡,核数足够多的 CPU 。✅前期准备:1.调研业务,设计业务场景,分析可行性(数据,技术,实用性);2.会爬虫;3.需要留钱买 API ;✅数据处理:1.爬的数据很脏,一定要做数据清洗;2.如果垂域没那么垂直,比如法律方向,大概率 Base 模型见过了,可以选择不做垂域和通用的数据配比;评估 Case :搞两个 Benchmark ,垂域和通用的,通用不能掉点太多;评估下一致性,从训练集里按任务分层抽样看看 case ;3️⃣做一个大模型应用做完上面两个项目后,其实都可以在此基础上构建一个大模型应用,目前最多的就是 rag 或者 agent 嘛,讲讲如何构建一个 RAG 。✅前置能力:1.学下 Langchain 和 Llama - index ;2.看看简单的 workflow 怎么做的,强烈推荐看看 Anthropic 的《 Building effective agents 》;3.有一定的工程能力。✅参考框架:1.Langchian- Chatchat ,之前笔记就推荐了, rag 很有影响力的开源项目,而且可优化点多;2.Qanything;3.自己手搓个 workflow .可优化点:内容供给;重排策略;微调 embedding ;意图分流单独训个 agent ;优化归纳📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系
点赞 评论 收藏
分享
评论
2
5
分享

创作者周榜

更多
牛客网
牛客企业服务