阿里大文娱优酷大模型一面
阿里大文娱优酷,没做笔试直接约面试。
1.自我介绍
2.实习经历
训练数据有哪些组成部分?
每一个样本是只有一句话参与训练还是都参与?
用的什么训练框架?
SFT 的过程中有没有遇到什么困难?
你们这个流程中,有需要人力评估吗?在哪一部分?
多机多卡训练的时候用到了 deepspeed 吧?你了解 deepspeed 吗?
流水线并行了解吗?
你们训练的时候学习率怎么调的,用不用 warm up?
还有一些忘记了
智力题:10 个字的句子,最多能分成多少种分词?(实际上很简单,就是 10 个词中间 9 个空,分割过不分,2 的 9 次方。 我硬是用递归公式推了半天)
代码题: 给一个数 N,一个长度 L。 求一个非负整数连续序列,序列和等于 N,长度不小于 L。 多个答案的话要输出最小的长度。(有一些数学计算)
反问业务:做剧本辅助的大模型
面试官迟到五分钟进来说还在开会让我等一会。等了 30 分钟+面试 90 分钟,整体两个小时没绷住 hhh。
1.自我介绍
2.实习经历
训练数据有哪些组成部分?
每一个样本是只有一句话参与训练还是都参与?
用的什么训练框架?
SFT 的过程中有没有遇到什么困难?
你们这个流程中,有需要人力评估吗?在哪一部分?
多机多卡训练的时候用到了 deepspeed 吧?你了解 deepspeed 吗?
流水线并行了解吗?
你们训练的时候学习率怎么调的,用不用 warm up?
还有一些忘记了
智力题:10 个字的句子,最多能分成多少种分词?(实际上很简单,就是 10 个词中间 9 个空,分割过不分,2 的 9 次方。 我硬是用递归公式推了半天)
代码题: 给一个数 N,一个长度 L。 求一个非负整数连续序列,序列和等于 N,长度不小于 L。 多个答案的话要输出最小的长度。(有一些数学计算)
反问业务:做剧本辅助的大模型
面试官迟到五分钟进来说还在开会让我等一会。等了 30 分钟+面试 90 分钟,整体两个小时没绷住 hhh。
全部评论
感觉是同一个面试官,完全一样的智力题和代码题,智力题我直接找规律把面试官看乐了
请问sft微调遇到什么困难怎么回答呀
我看官网没有在招岗位 你啥时候投的
佬提前批流程过完了吗
听里面的人说这个组挺不错的 可以冲
有大佬想来我们这吗 帮推
大佬oc了吗
相关推荐
11-06 23:23
博尔塔拉职业技术学院 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享