09-15 13:40 已编辑中山大学算法工程师发布于广东

关注

滴滴大模型面经

本人只做点业务数据sft, 做的更加偏向于粗糙业务，直接被拷打麻了，望佬看到可以给我指点一下

1. 现在有一个非常完备的sft指令集，你只能选择1w条，你如何选择数据来使模型的能力更加提升+完备？
2.我们知道sft的时候尽量不要注入知识给模型，因为只希望sft可以提升模型的指令遵循的能力，注入知识的话，可能会导致后面使用的时候模型容易出现幻觉，那我们怎么确保自己选择的这1w条数据没注入知识给模型呢？
3.7b和13b模型微调同一批数据，学习率哪个大？
4. Pretrain/sft/ppo学习率怎么变换？
5. 学习率和batch大小变化一致吗？
6. 做表征学习的时候，模型坍塌的原因？
7. 为什么做rm的时候，用不同的小模型大模型来采样生成后训练出来的rm会比以前那种方法奏效？这很反直觉，因为按照直觉来说的话，这种方式可能会让rm偏向某个权威的模型
8. 现在有很多种方法，有做完pt直接做rlhf的，也有按班就步的pt-sft-rlhf的，还有直接不做rlhf的，你觉得为什么这些方法都有效，你觉得是什么原因造成的？

#滴滴##秋招##面经# #算法# #八股#

全部评论

推荐最新楼层

西安铁路职业技术学院自然语言处理

搞这么细啊。有些答案可以去llama3.1的技术报告参考，其他的等大佬回答

4 回复分享

发布于 09-14 15:37 陕西

牛客344243631号

门头沟学院算法工程师

通常lr缩放倍数为batch size倍数的开方。例如batch size增大4倍，学习率对应扩大2倍即可。

2 回复分享

发布于 09-14 20:40 辽宁

北京农商银行

校招火热招聘中

官网直投

算法工程师

蹲蹲答案

1 回复分享

发布于 09-14 18:14 美国

门头沟学院算法工程师

佬这是几面啊，滴滴是连着面吗🙌

1 回复分享

发布于 09-15 01:15 广东

09-09 16:14

门头沟学院算法工程师

字节大模型算法工程师

组是负责处理字节内部事宜的工作，可以说是什么都干，监测票据、查找文本特殊信息、总结文件等等。拷打实习transformer 前馈神经网络的结构， 为什么会先提升维度后缩小维度multihead 如果改变head个数会影响参数量吗大模型是temperature先起作用还是top p如何解决幻觉，复读机问题如何处理局部最优点过拟合l1,l2区别，用法力扣1650  二叉树的最近公共祖先

查看7道真题和解析

点赞评论收藏

分享

09-11 19:37

已编辑

门头沟学院算法工程师

快手推荐大模型三面面经

1. 面试官先自我介绍了一下2. 我的自我介绍3. 主要比较care实习里面的各个阶段的数据流程，问了一下合成数据的优缺点？4. 问了一下LLM评估方面，人工还是自动化？离线评估指标和线上评估指标有什么区别？5. 问了一下推荐系统和LLM结合的理解，从召回和精排两部分稍微说了一下理解，以及结合多模态blabla6. 做了一个最长回文子串的题，我用的一般的O(n^2)的算法，那个O(n)的记不得了，面试官让优化，大概说了一下可以剪枝什么的，没有具体做（确实不太会）7. 反问，其实更多的是面试官在给我讲推荐系统的难点，以及他们认为LLM可以优化哪些地方#快手求职进展汇总##牛客创作赏金赛#

查看3道真题和解析快手求职进展汇总牛客创作赏金赛

点赞评论收藏

分享

09-12 22:20

门头沟学院自然语言处理

蔚来大模型工程师 1234面

一面/技术面 2024/8/23 上午11:00-12:00自我介绍挑一个实习介绍了解哪些位置编码技术RoPE原理线性内插、NTK到YaRN位置内插后注意力计算会增加，如何缓解介绍LongLoRA数据集构建时各种类型的比例是如何确定的使用华为910B及其相关平台时遇到过哪些困难，如何解决的效果如何评测最终的效果提升有没有什么具体的指标Coding：两数之和为什么要投蔚来反问二面/技术面 2024/9/3 下午16:00-17:00自我介绍介绍实习自己做了哪些工作，mentor提供了哪些支持介绍LongLoRAYaRN原理主要业务场景训练过程中如何降低显存使用训练的细节，时长，参数设置，显卡数量...

查看3道真题和解析蔚来求职进展汇总

点赞评论收藏

分享

09-09 18:31

门头沟学院自然语言处理

快手大模型应用一二三面

一面介绍你最熟悉的项目数据质量、来源训练细节、模型评估BPE拷打论文、问其他工作的区别手撕：链表easy题手撕MHA二面拷打项目数据清洗、分词、配比数据来源、代码比例并行策略loss抖动对齐拷打论文八股：生成式和判别式、KL散度三面hr职业规划选择offer看什么base、薪资期望老家哪的有无其他offer具体问题可以私聊我虽然是提前批，但是流程不算快，隔几天出结果

快手HR面126人在聊

查看20道真题和解析

点赞评论收藏

分享

09-04 00:42

浙江大学自然语言处理

美团大模型算法工程师配送一面（附带吐槽）

8.28 美团一面 纯纯的搞笑面前言：本来美团的面经不该在这个时间点来写的，我也并不想写，因为这面经写出来没有丝毫的价值，本该着手去写的已挂的百度二面面经，但在我看到我的美团校招流程变成回到人才库时，我必须写点什么吐槽这件事。1.自我介绍2.看我的简历里面没有学校的经历，为什么？（学校的经历和求职的需求百分之百不符合）3.看我许久以前的简历是找java的，为什么改了？（礼貌的回答了）4.让我选一个项目聊，我选了目前实习做的项目，大语言模型做类似判别的任务。5.我这个项目的场景下，大模型的输入是啥？我回答是文字。6.大模型的输出是啥？我回答也是文字。7.这个loss是怎么计算的？我回答，toke...

查看10道真题和解析牛客解忧铺美团求职进展汇总

点赞评论收藏

分享

10 22 评论

招聘动态

欧莱雅

2025届管培生招聘

德州仪器

2025届秋季校招

北京农商银行25届校招

建信金科

2025届秋季校招

携程集团

2025届校园招聘

三七互娱

2025届校园招聘

阿里大文娱

2025届校园招聘

宝时得科技

2025届校园招聘

信也科技2025届校园招聘

留学生招聘双选会报名啦~

全站热榜

正在热议

# 面试体验感最好的是哪家？ #

15712次浏览 136人参与

# 安利/避雷我的岗位 #

285022次浏览 3985人参与

# 东方财富校招 #

11181次浏览 206人参与

# 国央企求职进展汇总 #

2481次浏览 15人参与

# 实习，投递多份简历没人回复怎么办 #

2003047次浏览 30787人参与

# 比亚迪求职进展汇总 #

287892次浏览 1668人参与

# 联影秋招 #

31987次浏览 436人参与

# 设计人的面试记录 #

53311次浏览 794人参与

# 校招求职有谈薪空间吗 #

41541次浏览 389人参与

# 机械人，你最希望上岸的公司是？ #

55035次浏览 1124人参与

# 写简历别走弯路 #

539187次浏览 6775人参与

# 你/你领导的口头禅是什么？ #

988次浏览 19人参与

# 投递实习岗位前的准备 #

1025747次浏览 16661人参与

# 24届秋招同行攻略分享 #

696537次浏览 11216人参与

# 学信网能看师兄师姐就业去向了 #

72655次浏览 212人参与

# 工作丧失热情的瞬间 #

146659次浏览 1677人参与

# 实习中的菜狗时刻 #

206062次浏览 2165人参与

# 你觉得找工作该拿大厂还是小厂练手 #

105443次浏览 1356人参与

# 正在实习的你，有转正机会吗？ #

242579次浏览 2256人参与

# 科大讯飞求职进展汇总 #

131572次浏览 1755人参与

# 实习工作，你找得还顺利吗？ #

213379次浏览 2407人参与

# 25届如何提前做秋招准备？ #

111290次浏览 1948人参与

牛客网
牛客企业服务