阿里斑马智行 - NLP算法工程师面经

部门具体做车载语音智能助手相关的业务,10.11一面,10.17二面,目前约了下周三的HR面 整体感觉还好,只不过二面差点被打回原形,问了太多机器学习八股,面试官喜欢反问追问到底,给人比较大的压力 希望HR面顺利~

一面/技术面 2024/10/11 晚上18:00-19:00

  1. 自我介绍
  2. 介绍大模型实习
  3. 应用场景是什么,有什么意义
  4. 构造SFT数据的细节
  5. SFT的prompt模板
  6. 目前的方案有没有什么创新的地方
  7. 后续有没有什么改进,具体介绍一下
  8. 效果如何评估
  9. 大模型SFT过程中自己有没有什么总结出来的经验
  10. SFT过程中如何判断是否过拟合
  11. 硕士期间发表的paper,可以结合ppt来介绍一下
  12. 如何看待目前大语言模型都是decoder-only结构
  13. encoder-only和decoder-only的对比,纯理解场景哪个更优
  14. 描述一下典型的encoder-only如Bert的结构细节
  15. 多层堆叠时如何避免梯度消失和梯度爆炸
  16. DPO和PPO
  17. 代码题:lc75,颜色分类

二面/技术面 2024/10/17 下午15:00-15:40

  1. 自我介绍
  2. 询问为什么没转正
  3. 介绍大模型实习
  4. 具体负责了哪些板块
  5. 为什么没有公司内部的LLM
  6. 为什么非得用长文本而不用RAG
  7. 为什么不一直用GPT-4,隐私保护
  8. prompt优化这部分做了什么工作
  9. prompt优化这部分还了解哪些方法吗
  10. 如何判断当前使用的prompt就是最优的,无法进一步调整了,只能做SFT
  11. 不做全量微调的原因(还能什么原因,没卡)
  12. SFT的资源描述,卡数,机器数
  13. SFT过程中如何判断是否过拟合
  14. 有没有系统学过机器学习课程,开始拷问八股
  15. 如何判断一个模型是否收敛,从多个角度回答
  16. 判断收敛需要用验证集吗
  17. 如何定量判断是否收敛
  18. 如何判断目前的收敛点是局部最优解还是全局最优解
  19. 测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
  20. 主要使用什么语言(Python),有没有系统学过C++
  21. C++中STL中一些容器的底层实现原理
  22. pytorch中的计算图
  23. 最近看的一些开源代码和paper介绍,有学到什么东西
  24. 对第一份工作的预期,希望加入什么团队
  25. 反问:进来后可能会做的方向
#阿里求职进展汇总##斑马智行##NLP算法工程师##大模型##秋招#
全部评论
佬,我刚刚也被问到这个问题了:测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起。这个怎么回答呀?
点赞 回复 分享
发布于 11-08 17:52 北京

相关推荐

7 20 评论
分享
牛客网
牛客企业服务