滴滴提前批 - 大模型算法工程师(12345面)
一面/技术面 2024/8/2 下午14:00-14:30
- 面试官先介绍了一下部门的整体情况
- 自我介绍
- 快手实习,详细问了XGBoost
- 损失函数?
- 如何处理缺失值?
- bagging和boosting模型异同
- 如何处理样本不均衡的问题
- 腾讯实习
- 介绍LongLoRA
- 长文本有哪些技术
- norm有哪些作用
- 为什么不能用bn
- OOM一般你怎么解决
- 说说deepspeed
- 反问:业务场景
- Coding:岛屿数量
二面/技术面 2024/8/7 晚上19:00-19:40
- 自我介绍
- 介绍腾讯实习
- 目前上线后有没有遇到什么问题,后续打算如何解决
- 遇到的最难的问题是什么,如何解决的
- 模型并行和数据并行
- 模型的哪些部分比较耗费显存
- 说说DeepSpeed
- 了解RLHF么
- SFT过程中哪些因素比较重要
- 完全微调在什么情况下会比LoRA微调好
- 大模型前向传播和反向传播会有哪些过程
- 哪些因素会影响显存占用
- 如果调大batch_size会对哪些部分有影响
- 在sft的过程中,有没有哪些参数比较重要,有没有较好的经验值
三面/技术面 2024/8/13 早上8:00-9:00
- 自我介绍
- 腾讯实习
- 负责了哪些部分
- 你进去实习之前组内的大模型是怎么处理的
- 效果如何测评
- 数据集构建过程
- 从最开始调研到模型上线的全流程
- 有没有遇到比较难解决的问题,如何解决的
- 上线后使用有没有什么bad case,如何解决的
- 开放性问题:用大模型做智能客服,从头到尾设计一下
- 假设有大量的历史交互数据,以及知识库,你会怎么去优化,从长文本和RAG两个角度说了一下
- 大量历史数据微调后效果很一般,该如何去优化
- 个人往后想做的方向有什么倾向,做落地(论文这么多,为什么不做研究?我觉得比我论文多的人很多)
- 日常通过什么途径和渠道来了解前言技术进展
- 反问
一天后收到了四面通知,以为是HR面,点进去之后发现是新锐加面
四面/新锐加面/技术面 2024/8/14 下午14:00-15:00
- 自我介绍
- 介绍腾讯实习
- 长文本如何测评
- 了解哪些长文本技术
- 为啥没用腾讯内部的混元
- 应用场景下一般会提问哪些问题
- 数据集构造
- 上线后出现了哪些bad case,如何解决的
- 你负责了哪些部分
- 哪些部分比较难
- 聊了聊华为910B
- 显卡利用率低和哪些因素有关
- 开放问题:摒弃你现在做的东西,设计一套RAG系统来做长文本的摘要理解,给了一定的思考时间
- 长文本能打败极致的RAG吗
- RAG在摘要理解方面的能力如何提升
- 详细介绍了NIPS论文
- 聊了聊实验室方向
- 聊了聊面试的其他岗位,滴滴排序在哪个位置
- 回去等通知
五面/HR面 2024/8/19 下午17:30-18:00
- HR自我介绍
- 自我介绍
- 面试轮次较多,对前边几轮面试以及面试官有没有什么看法,觉得怎么样
- 对滴滴的印象以及建议
- 硕士阶段是如何一步步走到现在的,目标,如何去做
- 怎么想到走算法岗这条路的
- 觉得自己相比腾讯这边其他实习生,优势在哪里,劣势在哪里
- 问了腾讯这边转正的事
- 还面试了哪些公司
- 未来对工作有哪些要求
- 未来的工作更倾向于做什么方向
- 反问:预计八月底发offer意向,谈薪十月份
总体来讲滴滴没怎么考察代码,主要是深挖实习细节,以及各种场景题,比较开放
#秋招提前批##滴滴提前批##秋招##大模型##滴滴#