百度提前批搜索策略组NLP二面
- 自我介绍。
- 聊中了ACL的工作,这次面试官非常耐心,几乎每个细节都问了,还让我讲了没中的第二个工作的大题思想。
- 谈了一下在美团实习期间做的工作,然后就开始问大模型的东西了,如下:
- 简历上写了关于大模型模型特化的探索,所以开始问了一些,展开的说了一下看过的论文和做法
- 大模型相比小模型的优势体现在哪些地方?我一开始说了一些泛化性、few-shot、CoT,又说大模型通过指令微调、RLHF拟合人类偏好等等(可能不全)
- 大模型如何实现的计算加速?我就想到了Pre Norm加速收敛,解释了下为什么;还说了flash-attention,其他的真想不到了。。
- 大模型加速框架的原理?主要就是deepspeed分布式数据并行stage 1,2,3那些。
- 算法题,leetcode162寻找峰值,没刷过,一开始写了个遍历,面试官都笑了,然后说要O(logn)复杂度,我就知道二分了,基本撕出来了。。。不过边界问题好像没考虑好
面试官人属于非常和蔼的类型,很有耐心,写不出来题还疯狂提示我,感觉两面都碰到这种面试官属实是烧高香了。
#提前批面试#