阿里斑马智行 - NLP算法工程师面经
部门具体做车载语音智能助手相关的业务,10.11一面,10.17二面,目前约了下周三的HR面 整体感觉还好,只不过二面差点被打回原形,问了太多机器学习八股,面试官喜欢反问追问到底,给人比较大的压力 希望HR面顺利~
一面/技术面 2024/10/11 晚上18:00-19:00
- 自我介绍
- 介绍大模型实习
- 应用场景是什么,有什么意义
- 构造SFT数据的细节
- SFT的prompt模板
- 目前的方案有没有什么创新的地方
- 后续有没有什么改进,具体介绍一下
- 效果如何评估
- 大模型SFT过程中自己有没有什么总结出来的经验
- SFT过程中如何判断是否过拟合
- 硕士期间发表的paper,可以结合ppt来介绍一下
- 如何看待目前大语言模型都是decoder-only结构
- encoder-only和decoder-only的对比,纯理解场景哪个更优
- 描述一下典型的encoder-only如Bert的结构细节
- 多层堆叠时如何避免梯度消失和梯度爆炸
- DPO和PPO
- 代码题:lc75,颜色分类
二面/技术面 2024/10/17 下午15:00-15:40
- 自我介绍
- 询问为什么没转正
- 介绍大模型实习
- 具体负责了哪些板块
- 为什么没有公司内部的LLM
- 为什么非得用长文本而不用RAG
- 为什么不一直用GPT-4,隐私保护
- prompt优化这部分做了什么工作
- prompt优化这部分还了解哪些方法吗
- 如何判断当前使用的prompt就是最优的,无法进一步调整了,只能做SFT
- 不做全量微调的原因(还能什么原因,没卡)
- SFT的资源描述,卡数,机器数
- SFT过程中如何判断是否过拟合
- 有没有系统学过机器学习课程,开始拷问八股
- 如何判断一个模型是否收敛,从多个角度回答
- 判断收敛需要用验证集吗
- 如何定量判断是否收敛
- 如何判断目前的收敛点是局部最优解还是全局最优解
- 测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
- 主要使用什么语言(Python),有没有系统学过C++
- C++中STL中一些容器的底层实现原理
- pytorch中的计算图
- 最近看的一些开源代码和paper介绍,有学到什么东西
- 对第一份工作的预期,希望加入什么团队
- 反问:进来后可能会做的方向