百度,智源一面
百度智源连着,难蚌
百度感觉又寄了。。。。面试官一点兴趣没有的样子,有点压力。
1.自我介绍
2.项目拷打
大模型联邦学习你们是做了什么?
为什么用 Qwen2?你们有没有遇到一些比较创造性的任务小模型比大模型差很多?怎么抉择。
你所谓的高质量数据,这个质量是怎么评定的?
二分类任务一般用哪些指标判断?(我说 auc,因为自己做一些推荐预测是样本非常不均衡)
那对于不均衡样本有什么办法吗?(我说重采样欠采样)
从训练角度有什么办法吗?(不会。。。loss 可以有权重啥的瞎讲)
这些指标你一般看哪些?ppl 是什么?都是概率,他和交叉熵有什么区别?
有注意一般训练都会输出 ppl 吗?为啥?
KL 散度和交叉熵的关系?为什么不用 KL 散度做 loss?
介绍一下 DPO
有了解一些更新的 RLHF 吗
代码题
看到我写 Cpp,又问了几个 Cpp。。。都回答错了,太久远了。
代码题是类似于两个有序数组合并,但是要原地,第一个数组空间足够。
我归并的 and or 写错了一个,没跑出来。。。。只给了不到 10 分钟,然后不让我写了,也不问思路。
反问做什么业务:百度输入法,就不想问了,还急着智源。。。
智源
说是 coding 面但是比较简单
1.自我介绍
介绍了一下 peft 的那些几种微调方式
什么时候选择 lora?
lora 的几种变种知道吗?(不太清楚了,只知道一两个)
项目随便聊聊一个一个问了几分钟。
代码题
括号生成 回溯
反问 总的 25 分钟
感觉百度又凉了,很崩溃
百度感觉又寄了。。。。面试官一点兴趣没有的样子,有点压力。
1.自我介绍
2.项目拷打
大模型联邦学习你们是做了什么?
为什么用 Qwen2?你们有没有遇到一些比较创造性的任务小模型比大模型差很多?怎么抉择。
你所谓的高质量数据,这个质量是怎么评定的?
二分类任务一般用哪些指标判断?(我说 auc,因为自己做一些推荐预测是样本非常不均衡)
那对于不均衡样本有什么办法吗?(我说重采样欠采样)
从训练角度有什么办法吗?(不会。。。loss 可以有权重啥的瞎讲)
这些指标你一般看哪些?ppl 是什么?都是概率,他和交叉熵有什么区别?
有注意一般训练都会输出 ppl 吗?为啥?
KL 散度和交叉熵的关系?为什么不用 KL 散度做 loss?
介绍一下 DPO
有了解一些更新的 RLHF 吗
代码题
看到我写 Cpp,又问了几个 Cpp。。。都回答错了,太久远了。
代码题是类似于两个有序数组合并,但是要原地,第一个数组空间足够。
我归并的 and or 写错了一个,没跑出来。。。。只给了不到 10 分钟,然后不让我写了,也不问思路。
反问做什么业务:百度输入法,就不想问了,还急着智源。。。
智源
说是 coding 面但是比较简单
1.自我介绍
介绍了一下 peft 的那些几种微调方式
什么时候选择 lora?
lora 的几种变种知道吗?(不太清楚了,只知道一两个)
项目随便聊聊一个一个问了几分钟。
代码题
括号生成 回溯
反问 总的 25 分钟
感觉百度又凉了,很崩溃
全部评论
百度输入法啊,让他爬,这感觉去不了一点吧
老哥之前不是百度已经三面了吗
百度工程味总觉得特别重
智源是哪家公司?
智源你的这么简单嘛,我直接来了道机器学习题,根本不是leetcode,人直接没了,那老哥似乎是搞ai for science的。
虽然百度业务不行,但是面过的百度和字节的面试官一般都挺有水平的😂
相关推荐