作业帮 提前批 NLP 一二三面 面经

7月底投递、测评

8月初开始约面

一面
介绍一下预训练数据处理
数据配比有什么经验
介绍一作的文章
你们有用大模型做数学推理吗?主要用什么方法
手撕:链表重排
第二天约面

二面
讲一下论文,拷打细节,你觉得还需要在哪些方面提升
拷打项目,讲一下数据清洗
模型训练发生的一些异常如何处理?如loss突然上升
训练数据有问题如何检查出来
用过哪些bert类型的小模型,他们用什么预训练任务
讲一下位置编码
长文本问题怎么处理的
手撕:最长无重复子串
当天约面

三面 hr
问过往经历
问实验室情况
几月份毕业
学生到职场的转换有什么挑战
其他公司进度
考虑offer优先考虑什么
三个词形容自己,并找一个例子体现一下
能来提前实习吗

几天后oc,oc也会问一些类似hr面的问题

#秋招记录# #NLP算法工程师# #大模型#
全部评论
二面后还有三面嘛
点赞 回复 分享
发布于 08-09 21:54 江苏
一般面完多久出结果啊,为啥我面完过了一周还没消息😭
点赞 回复 分享
发布于 08-14 16:43 北京
所以loss突然上升怎么处理呢
点赞 回复 分享
发布于 08-15 13:13 北京
一面第一个问题问预训练?楼主你做过LLM预训练吗?
点赞 回复 分享
发布于 08-15 15:54 浙江
请问是已经发offer了吗?我hr面完很久了还没信,怕不是寄了
点赞 回复 分享
发布于 08-20 07:54 上海
大佬,三面和oc隔了多少天呀
点赞 回复 分享
发布于 08-21 14:42 台湾
太强了吧,请问这一题: 训练数据有问题如何检查出来 怎么检查呢,能想到的只有训练过程中某个 step 出现 loss spike 或者其他异常问题,有可能这个 batch 的数据有问题。 还有其他 before training 的方法吗?
点赞 回复 分享
发布于 08-25 17:32 北京

相关推荐

最近没有新增的面试了,该挂的都挂了好像我的秋招结束了,就这么滴吧,摆烂了快手——数据挖掘1. 做题——最长公共子序列2. 简历介绍实习、项目3. 项目技术1. fasttext原理,层次softmax,树构造2. LSTM更新公式3. mapreduce 原理和阶段4. minhash原理,LSH实现1. 可以优化的地方,sentence-bert精召5. BERT原理、维度、词表大小,模型结构、位置编码类型4. 反问1. 工作内容和工作性质,上下游,需求方式2. 如何沉淀技术栈和方法论【挂】快手二面——数据挖掘1. STAR法则说项目2. 八股1. 一句话概括precesion、recall、AUC指标和应用场景2. 一句话概括LR、随机森林、GBDT的区别、3. word2vec原理3. 反问1. 从问题上看重视思路,这种筛选流程是怎么样的1. 社招看经验2. 校招看基础4. 做题:无【挂】字节一面——NLP算法,挂1. 介绍项目1. 怎么做的CoT、SFT2. SFT数据集怎么构建2. Minhash原理,召回优化,怎么做语义去重1. embedding聚类,怎么聚,怎么评估聚类效果,怎么进行采样1. 超大规模聚类怎么选取类别2. 采样方案,如何保留长尾数据3. fasttext原理和选型原因4. Qwen系列模型和GPT2的diff5. deepspeed多个阶段参数分布6. 写题:最长递增子序列,老哥手把手教我写,人很好,还是把我挂了长安综合面1. 聊到哪里算哪儿,为什么选择长安2. 怎么看待大模型3. 长安在大模型领域可能的应用4. 研究方向长安技术面1. 介绍项目2. lora原理3. SFT有什么经验【拒】长安offer,给的少,拒京东 记错时间,错过一面了荣耀一面——AI工程师1. 讲项目2. 各种模型、微调各个阶段loss飞了可能的原因和解决办法荣耀二面1. 问专业研究方向2. 劝我年轻读博华为1面——AI软件开发1. 随意唠嗑2. 复盘笔试题目3. 手写最小路径4. transformer八股漫谈华为2面1. 谈数据处理流程、长尾问题发现和优化2. 数据飞轮怎么建设3. 写题华为3面1. 聊年龄专业房价发展2. 画饼3. 聊末位淘汰 和 手里做出选择的原因pdd 一面1. 怎么验证实验效果 scaling law, 策略组验证2. 训练框架1. 大量数据,魔改megtron2. 小批量,deepspeedPDD二面 忘了,工程题PDD三面 介绍项目,无反问,写链表重排题目 #我的失利项目复盘#
查看53道真题和解析 我的失利项目复盘
点赞 评论 收藏
分享
7 16 评论
分享
牛客网
牛客企业服务