滴滴提前批 - 大模型算法工程师(12345面)

一面/技术面 2024/8/2 下午14:00-14:30

  1. 面试官先介绍了一下部门的整体情况
  2. 自我介绍
  3. 快手实习,详细问了XGBoost
  4. 损失函数?
  5. 如何处理缺失值?
  6. bagging和boosting模型异同
  7. 如何处理样本不均衡的问题
  8. 腾讯实习
  9. 介绍LongLoRA
  10. 长文本有哪些技术
  11. norm有哪些作用
  12. 为什么不能用bn
  13. OOM一般你怎么解决
  14. 说说deepspeed
  15. 反问:业务场景
  16. Coding:岛屿数量

二面/技术面 2024/8/7 晚上19:00-19:40

  1. 自我介绍
  2. 介绍腾讯实习
  3. 目前上线后有没有遇到什么问题,后续打算如何解决
  4. 遇到的最难的问题是什么,如何解决的
  5. 模型并行和数据并行
  6. 模型的哪些部分比较耗费显存
  7. 说说DeepSpeed
  8. 了解RLHF么
  9. SFT过程中哪些因素比较重要
  10. 完全微调在什么情况下会比LoRA微调好
  11. 大模型前向传播和反向传播会有哪些过程
  12. 哪些因素会影响显存占用
  13. 如果调大batch_size会对哪些部分有影响
  14. 在sft的过程中,有没有哪些参数比较重要,有没有较好的经验值

三面/技术面 2024/8/13 早上8:00-9:00

  1. 自我介绍
  2. 腾讯实习
  3. 负责了哪些部分
  4. 你进去实习之前组内的大模型是怎么处理的
  5. 效果如何测评
  6. 数据集构建过程
  7. 从最开始调研到模型上线的全流程
  8. 有没有遇到比较难解决的问题,如何解决的
  9. 上线后使用有没有什么bad case,如何解决的
  10. 开放性问题:用大模型做智能客服,从头到尾设计一下
  11. 假设有大量的历史交互数据,以及知识库,你会怎么去优化,从长文本和RAG两个角度说了一下
  12. 大量历史数据微调后效果很一般,该如何去优化
  13. 个人往后想做的方向有什么倾向,做落地(论文这么多,为什么不做研究?我觉得比我论文多的人很多)
  14. 日常通过什么途径和渠道来了解前言技术进展
  15. 反问

一天后收到了四面通知,以为是HR面,点进去之后发现是新锐加面

四面/新锐加面/技术面 2024/8/14 下午14:00-15:00

  1. 自我介绍
  2. 介绍腾讯实习
  3. 长文本如何测评
  4. 了解哪些长文本技术
  5. 为啥没用腾讯内部的混元
  6. 应用场景下一般会提问哪些问题
  7. 数据集构造
  8. 上线后出现了哪些bad case,如何解决的
  9. 你负责了哪些部分
  10. 哪些部分比较难
  11. 聊了聊华为910B
  12. 显卡利用率低和哪些因素有关
  13. 开放问题:摒弃你现在做的东西,设计一套RAG系统来做长文本的摘要理解,给了一定的思考时间
  14. 长文本能打败极致的RAG吗
  15. RAG在摘要理解方面的能力如何提升
  16. 详细介绍了NIPS论文
  17. 聊了聊实验室方向
  18. 聊了聊面试的其他岗位,滴滴排序在哪个位置
  19. 回去等通知

五面/HR面 2024/8/19 下午17:30-18:00

  1. HR自我介绍
  2. 自我介绍
  3. 面试轮次较多,对前边几轮面试以及面试官有没有什么看法,觉得怎么样
  4. 对滴滴的印象以及建议
  5. 硕士阶段是如何一步步走到现在的,目标,如何去做
  6. 怎么想到走算法岗这条路的
  7. 觉得自己相比腾讯这边其他实习生,优势在哪里,劣势在哪里
  8. 问了腾讯这边转正的事
  9. 还面试了哪些公司
  10. 未来对工作有哪些要求
  11. 未来的工作更倾向于做什么方向
  12. 反问:预计八月底发offer意向,谈薪十月份

总体来讲滴滴没怎么考察代码,主要是深挖实习细节,以及各种场景题,比较开放

#秋招提前批##滴滴提前批##秋招##大模型##滴滴#
全部评论
太强了佬
2 回复 分享
发布于 08-28 00:23 广东
强的佬,想问一下你收到意向了吗
1 回复 分享
发布于 08-27 23:18 辽宁

相关推荐

10-19 22:56
已编辑
门头沟学院 Java
timeline一面:10.11二面:10.16本来滴滴是一天一二面直接结束的,可能前面的人拖时间了,二面等了一个小时后面hr打电话改时间了;一面:(35分钟)1. 项目实习拷打(15分钟,具体有点忘记了)2. 八股:(1)MySQL事务隔离级别,怎么实现的(MVCC)(2)Redis 性能高的原因(数据结构、IO多路复用),追问IO多路复用的原理(epoll讲了一下)(3) Redis集群模式(讲了相关配置,扩缩容),追问和主从区别(故障转移、负载均衡)(4)docker在实习中怎么用的(回答构建镜像到运行容器相关的指令),追问有没有什么优化的经历(无)(5)kafka和rabbitmq哪个熟悉(熟悉应用场景和用法,原理没怎么看),后续就没问了3. 手撕: 最常无重复子串4.反问:部门业务 一面完10分钟通知二面二面(30分钟)1. 实习项目拷打:只问了你觉得实习中最难的一个点是什么?怎么解决的?(大数据量导入流程优化,缓存、多线程、预加载、SQL优化),追问SQL优化(答怎么统计的,索引优化和join优化)2. 八股:(1)TCP/IP协议栈,追问网络层、传输层的作用(回答TCP加了端口实现进程间通信),追问那和应用层有什么区别?为什么要加个应用层(专注功能,TCP实现可靠传输)(2) Redis持久化方式(RDB,AOF),追问优缺点和应用场景(八股吟唱)3. 场景题:微博点赞系统怎么设计(回答了数据库表的设计、缓存设计),追问缓存过期时间怎么设置、一些大V的数据怎么缓存(回答了可以按时间统计定期入库),追问有用户取消关注了怎么办?(卒)4. 算法题:非零数字稳当的排到数组后面(之前没刷过,临时想了双指针思路对了,具体细节处问题没A出来)5. 聊天环节:(1)研究生一直在实习吗?现在还在实习吗?(2)你比较看重什么点(我回答了比较看重行业)当时情商真的不在线,应该顺坡下驴的6.反问环节:对于大模型的看法,后续业务会都重塑吗10.19查状态发现挂了,其实在预料中,场景题和算法题都没答好😭,最后情商还不在线
点赞 评论 收藏
分享
10 31 评论
分享
牛客网
牛客企业服务