滴滴大模型一面面经

记录一下秋招:

8.13滴滴一面挂,llab大模型岗。

1.自我介绍,为什么想做大模型方向?
2.拷打项目和实习
3.reward bench上的reward model分哪几类?reward model如何训练的,训练目标是什么?
4.dpo训练的损失函数和训练目标,dpo如何改进
5.指令跟随能力的评估集有什么,如何评估的?
6.gsm8k和math评估集有什么区别?
7.mbpp和hella swag评估集有什么区别?
8.阿尔法狗强化学习策略是什么?
9.提升推理能力和指令跟随能力哪个更难,为什么,提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方
10.dpo训完了一般输出长度会变化吗?如何解决这个问题
11.注意力机制为什么除以根号dk,为什么不是dk
12.transformer里边norm的位置在哪里,norm如何计算的
13.大模型训练过程学习率一般如何变化的,退火阶段学习率如何变化的

代码:
1.写了个注意力层
2.手撕,一个数组,输出这个数组每个位置之外的其他元素的乘机,不能用除法,要求尽量减少时间复杂度,然后要求仅用一个数组存储

太难了,10分钟后就挂了

其他公司:

米哈游-简历挂
蔚来-简历挂
文远知行-简历挂
鹰角网络-简历挂

服了,投了3次蔚来都给我挂了
#滴滴##滴滴提前批##大模型面试##米哈游##蔚来#
全部评论
看着好难
4 回复 分享
发布于 2024-08-16 22:01 黑龙江
感谢分享
4 回复 分享
发布于 2024-08-16 23:47 黑龙江
好难
2 回复 分享
发布于 2024-08-16 22:42 黑龙江
这个代码题貌似是hot100上的原题
2 回复 分享
发布于 2024-08-20 22:12 北京
你滴滴多久进面试的啊
1 回复 分享
发布于 2024-08-16 14:00 北京
看着有点难阿
1 回复 分享
发布于 2024-08-16 14:06 北京
话说这个RM分哪几类是指,reward bench上的评估有哪几个类别吗?
1 回复 分享
发布于 2024-08-16 14:58 北京
第10个问题要怎么答呢
点赞 回复 分享
发布于 2024-09-07 21:58 广东
hot没有吧
点赞 回复 分享
发布于 2024-12-21 08:13 北京

相关推荐

之前查面经的时候面试看着不难,结果今天差点把我问炸了。。。问的还蛮偏,全程在祈祷来点正常的八股吧,有点阿里控股那味儿了开篇提问:负责学生会项目的哪一块?(我一个人做的)大三的课程怎么办?(全部自学完了)xfg大营销项目拷打:     1.用到了哪些技术?(后端+前端)     2.怎么设计的?(参考了pdd抽奖,zijie稀土掘金,头脑风暴,库表设计)     3.简历上写的项目多次迭代?(mvc到ddd,filter到责任链)     4.怎么防超卖?(decr+setnx)     5.双写一致性怎么保证?(延时队列+定时任务+rabbit mq将军走此小道)     6.加一个商品怎么更新redis?(活动预热,提前装配)     7.怎么防止sql注入?(参数化,正则输入过滤)八股:8.session和cookie的区别?存在哪,cookie默认保持多少时间?cookie消失后,session还存在吗?为什么?9.redis断电了怎么办?怎么保证消息不丢失?(一时间没答上,现在想想应该答持久化操作+主从集群)10.rabbit mq呢?断电了怎么办(答的镜像集群)11.varchar(5)存一个字符时的大小?char呢?为什么?12.使用select...for update,行锁的范围?13.说出五个linux命令14.如果我要复制某个文件,用的是哪个命令?(我说copy)那移动呢?(我说我用的图形化操作界面)15.我看你项目用到了react,知道js嘛?(开始慌)16.(问了一个前端问题)(没答上)17.工厂模式的使用场景?(只关心从工厂购物,不关心工厂如何创建物品,在spring框架有使用)18.重写和重载区别反问:给些建议(深度还是有,广度差了一点,年轻人不要钻纯后端,搞搞全栈也还是很吃香滴)后续:询问可以实习多久(6个月)大四毕设是否会留校(我说我才大三)应该是稳了
查看36道真题和解析
点赞 评论 收藏
分享
评论
12
60
分享

创作者周榜

更多
牛客网
牛客企业服务