百度,智源一面

百度智源连着,难蚌
百度感觉又寄了。。。。面试官一点兴趣没有的样子,有点压力。
1.自我介绍
2.项目拷打
大模型联邦学习你们是做了什么?
为什么用 Qwen2?你们有没有遇到一些比较创造性的任务小模型比大模型差很多?怎么抉择。
你所谓的高质量数据,这个质量是怎么评定的?
二分类任务一般用哪些指标判断?(我说 auc,因为自己做一些推荐预测是样本非常不均衡)
那对于不均衡样本有什么办法吗?(我说重采样欠采样)
从训练角度有什么办法吗?(不会。。。loss 可以有权重啥的瞎讲)
这些指标你一般看哪些?ppl 是什么?都是概率,他和交叉熵有什么区别?
有注意一般训练都会输出 ppl 吗?为啥?
KL 散度和交叉熵的关系?为什么不用 KL 散度做 loss?
介绍一下 DPO
有了解一些更新的 RLHF 吗
代码题
看到我写 Cpp,又问了几个 Cpp。。。都回答错了,太久远了。

代码题是类似于两个有序数组合并,但是要原地,第一个数组空间足够。
我归并的 and or 写错了一个,没跑出来。。。。只给了不到 10 分钟,然后不让我写了,也不问思路。
反问做什么业务:百度输入法,就不想问了,还急着智源。。。

智源
说是 coding 面但是比较简单
1.自我介绍
介绍了一下 peft 的那些几种微调方式
什么时候选择 lora?
lora 的几种变种知道吗?(不太清楚了,只知道一两个)
项目随便聊聊一个一个问了几分钟。

代码题
括号生成 回溯
反问 总的 25 分钟

感觉百度又凉了,很崩溃
全部评论
百度输入法啊,让他爬,这感觉去不了一点吧
1 回复 分享
发布于 09-14 21:01 陕西
老哥之前不是百度已经三面了吗
1 回复 分享
发布于 09-16 10:02 广东
百度工程味总觉得特别重
点赞 回复 分享
发布于 09-14 18:52 四川
智源是哪家公司?
点赞 回复 分享
发布于 09-14 19:04 北京
智源你的这么简单嘛,我直接来了道机器学习题,根本不是leetcode,人直接没了,那老哥似乎是搞ai for science的。
点赞 回复 分享
发布于 09-15 10:22 北京
虽然百度业务不行,但是面过的百度和字节的面试官一般都挺有水平的😂
点赞 回复 分享
发布于 09-15 12:21 北京

相关推荐

11-07 18:08
已编辑
门头沟学院 算法工程师
智源 研究员 总包50多一点 其他
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
11-04 10:13
京东零售 数据开发 31.5 x 19 大专
点赞 评论 收藏
分享
2 9 评论
分享
牛客网
牛客企业服务