淘天NLP一面凉经
闲鱼技术中心,感觉就是被拉来凑数的,面完秒挂
时间:9.19
1. 自我介绍
2. 直接开始做题,最长不重复字符串
3. 介绍大模型实习
4. 数据集构建过程,效果如何评估
5. 常见的长文本扩展方案
6. post-norm和pre-norm优缺点
7. attention的时间复杂度
8. DeepSpeed的zero策略
9. dp mp pp
10. SFT过程中有哪些参数比较重要,为什么需要warm-up
11. 大模型推理过程中有哪些参数
12. top-p和top_k同时存在时如何处理
13. 长度惩罚具体是干了些什么
14. LoRA参数有哪些,lora_alpha的作用
15. 先0还是先高斯分布,是否可以交换
16. RLHF原理
17. 对比学习原理
18. 反问:业务相关
#淘天##闲鱼##NLP算法工程师##25校招##淘天2025秋招#