淘天NLP一面凉经

闲鱼技术中心,感觉就是被拉来凑数的,面完秒挂

时间:9.19

1. 自我介绍

2. 直接开始做题,最长不重复字符串

3. 介绍大模型实习

4. 数据集构建过程,效果如何评估

5. 常见的长文本扩展方案

6. post-norm和pre-norm优缺点

7. attention的时间复杂度

8. DeepSpeed的zero策略

9. dp mp pp

10. SFT过程中有哪些参数比较重要,为什么需要warm-up

11. 大模型推理过程中有哪些参数

12. top-p和top_k同时存在时如何处理

13. 长度惩罚具体是干了些什么

14. LoRA参数有哪些,lora_alpha的作用

15. 先0还是先高斯分布,是否可以交换

16. RLHF原理

17. 对比学习原理

18. 反问:业务相关

#淘天##闲鱼##NLP算法工程师##25校招##淘天2025秋招#
全部评论
经典kpi
点赞 回复 分享
发布于 10-20 13:05 浙江

相关推荐

不愿透露姓名的神秘牛友
11-11 01:05
已编辑
美团 后端 ssp1 硕士双一流
点赞 评论 收藏
分享
3 10 评论
分享
牛客网
牛客企业服务