滴滴大模型一面面经

记录一下秋招:

8.13滴滴一面挂,llab大模型岗。

1.自我介绍,为什么想做大模型方向?
2.拷打项目和实习
3.reward bench上的reward model分哪几类?reward model如何训练的,训练目标是什么?
4.dpo训练的损失函数和训练目标,dpo如何改进
5.指令跟随能力的评估集有什么,如何评估的?
6.gsm8k和math评估集有什么区别?
7.mbpp和hella swag评估集有什么区别?
8.阿尔法狗强化学习策略是什么?
9.提升推理能力和指令跟随能力哪个更难,为什么,提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方
10.dpo训完了一般输出长度会变化吗?如何解决这个问题
11.注意力机制为什么除以根号dk,为什么不是dk
12.transformer里边norm的位置在哪里,norm如何计算的
13.大模型训练过程学习率一般如何变化的,退火阶段学习率如何变化的

代码:
1.写了个注意力层
2.手撕,一个数组,输出这个数组每个位置之外的其他元素的乘机,不能用除法,要求尽量减少时间复杂度,然后要求仅用一个数组存储

太难了,10分钟后就挂了

其他公司:

米哈游-简历挂
蔚来-简历挂
文远知行-简历挂
鹰角网络-简历挂

服了,投了3次蔚来都给我挂了
#滴滴##滴滴提前批##大模型面试##米哈游##蔚来#
全部评论
看着好难
4 回复 分享
发布于 08-16 22:01 黑龙江
感谢分享
3 回复 分享
发布于 08-16 23:47 黑龙江
小红书
校招火热招聘中
官网直投
好难
2 回复 分享
发布于 08-16 22:42 黑龙江
这个代码题貌似是hot100上的原题
2 回复 分享
发布于 08-20 22:12 北京
你滴滴多久进面试的啊
1 回复 分享
发布于 08-16 14:00 北京
看着有点难阿
1 回复 分享
发布于 08-16 14:06 北京
话说这个RM分哪几类是指,reward bench上的评估有哪几个类别吗?
1 回复 分享
发布于 08-16 14:58 北京
第10个问题要怎么答呢
点赞 回复 分享
发布于 09-07 21:58 广东

相关推荐

多模态 & 大模型 & Agent 正式员工(*3) & 实习生招聘 (*5,实习时间>=3个月)1、团队介绍我们是快手垂搜大模型团队,致力于构建视觉大模型、多模态搜索、User Agent新系统,应用于多种电商场景(如拍照搜同款、图文相似款、电商创意AIGC,买家Agent问答)。团队紧随技术潮流,不断技术/商业创新,期待与优秀的同学一道,进一步扩大影响力。团队一直坚持学术与业务并向发展的方式,目前在CVPR、WWW、AAAI、SIGIR等会议发表论文多篇 (其中一篇Shared Task Best Paper, 一篇Outstanding Paper),并在国内知名赛事与榜单荣获过多项Top2成绩;内部提供充分的交流讨论,现有正式员工与实习同学均来自国内/全球顶尖学校;在这里你会有专业的Mentor实时指导技术创新与业务落地。过去半年团队一共发表论文4篇,AIGC方向专利5项。组内机器资源充足(数百张V100/A100),产研结合,自由度高。组内氛围良好,年轻同学多且有活力,小组内部定期有LOL/桌游/团建旅行。实习表现出色可优先转正及获取SSP Offer。万分期待你的加入!2、实习内容1、多模态视频图文内容理解 (预训练、微调、RLHF、self-prompt技术创新与应用)2、电商多模态信息RAG (商品-商家-用户-平台粒度多维度信息对齐与检索, 跨模态匹配)3、AIGC视觉生成(文生图/视频、精细编辑、多轮交互、训练推理加速、评估标准)4、User Agent设计 (商品知识库信息构建、跨模态实时检索、工具调用与信息分析)5、参与模型蒸馏,量化剪枝,在线实时性部署等工作,支持生成&翻译算法的性能优化与落地;6、针对业务特点,跟踪相关领域的技术发展趋势,进行各类技术方案的探索和学术研究。、当然,研究不限于上述方向,如果您觉得其他方向非常有趣/有价值,也欢迎交流讨论。3、职位要求1、计算机、数学、人工智能或相关专业硕士及博士在读,有扎实的机器学习和NLP算法基础。2、熟悉LLM工程技术和方法,并掌握大模型的微调和评估方法;有参与大模型研发者优先。3、熟悉深度学习框架,如TensorFlow、PyTorch等,有扎实的编程基础和代码实现能力。4、具备优秀的业务感知以及分析和解决问题的能力,良好的沟通协作能力。5、有高水平论文(如ACL、CVPR、NIPS、AAAI、ICML等)或者开源项目者优先。工作地点:杭州 or 北京简历投递:线下私聊
投递快手等公司10个岗位
点赞 评论 收藏
分享
10 42 评论
分享
牛客网
牛客企业服务