分享一波攒了整个秋招的NLP算法岗面经

投的岗位比较杂,主要是NLP,也包括一些多模态、大模型、推荐相关的岗位,最终拿到了腾讯、顺丰、平安金服和迪子的offer,华子、京东和百度的池子。

总结一下,首先算法的问题会问得非常杂,主要根据你的项目经历,面试官一般会从你的经历里挑和他们工作内容比较相关的点提问,然后不断扩展;反而八股文问的不多,一般是一些中小厂喜欢问八股。

最后是自己的一点见解,对于非研究性质的算法岗位,论文的权重并没有很大(也看面试官的喜好),反而是相关的竞赛/实习经历会非常重要。有意找算法岗的uu,一定要去搜广推(可以再加一个大模型)相关的岗位刷刷实习经历。

以下是整个秋招的面经:

  1. 用语言介绍一下Transformer的整体流程
  2. 深度学习的三种并行方式:数据并行,模型并行,流水线并行
  3. Deepspeed分布式训练的了解,zero 0-3的了解。
  4. 对于CLIP的了解
  5. 说几种对比学习的损失函数,以及它们的特点和优缺点
  6. 说说大模型生成采样的几种方式,它们的特点和优缺点比较
  7. 损失函数中温度的作用
  8. BLIP的细节。(面试中提的问题是BLIP为什么将训练分成两个阶段)
  9. Visual Encoder有哪些常见的类型?
  10. 深度学习中常用的优化器有哪些?
  11. SimCSE的了解
  12. prenorm和postnorm
  13. LLaMA 2的创新/ChatGLM的创新点/Qwen的创新点/Baichuan的创新点
  14. LLM的评估方式有哪些?特点是什么?(中文的呢?)
  15. 文本生成模型中生成参数的作用(temperature,top p, top k,num beams)
  16. LoRA的作用和原理
  17. CoT的作用
  18. 神经网络经典的激活函数以及它们的优缺点
  19. softmax函数求导的推导
  20. BERT的参数量如何计算?
  21. AUC和ROC
  22. batch norm和layer norm
  23. 大模型训练的超参数设置
  24. 经典的词向量模型有哪些?
  25. InstructGPT三个阶段的训练过程,用语言描述出来(过程,损失函数)
  26. 大模型推理加速的方法
  27. Transformer中注意力的作用是什么
  28. RNN、CNN和Transformer的比较(复杂度,特点,适用范围etc)
  29. AC自动机
  30. 产生梯度消失问题的原因有哪些?
  31. 大模型的幻觉问题
  32. 大模型训练数据处理
  33. RLHF的计算细节
  34. 构建CoT样本的时候,怎么保证覆盖不同的场景?
  35. 召回的三个指标:Recall、NDCG、RMSE
  36. RoPE和ALiBi
  37. 交叉熵、NCE和InfoNCE的区别和联系
  38. 贝叶斯学派和概率学派的区别
  39. 一个文件的大小超过了主存容量,如何对这个文件进行排序?应该使用什么算法?
  40. Python中的线程、进程和协程
  41. python中的生成器和迭代器
#晒一晒我的offer##我的实习求职记录##23届找工作求助阵地#
全部评论
一个都看不懂,举报了
9 回复 分享
发布于 2023-11-15 20:37 江苏
md我科班想转搜推广,刚研一,编程基本不会,机器学习懂点,大佬你上面发的我一个看不懂,还有救吗
2 回复 分享
发布于 2023-11-18 19:53 浙江
问下佬,我现在的NLP实习就是不断换模型然后微调找最好的那个,没什么拿得出手的东西,面试深挖项目也会问这些吗?感觉你分享的这个面经不是八股,胜似八股工作深入下去这些理论知识都会用到吗?真心求问,万分感谢!!
1 回复 分享
发布于 2023-11-15 23:48 上海
m
点赞 回复 分享
发布于 2024-02-23 18:17 江苏
点赞 回复 分享
发布于 2024-01-30 16:15 北京
好难😅
点赞 回复 分享
发布于 2024-01-04 12:43 上海
可以私聊问问大佬sf nlp开的多少嘛?
点赞 回复 分享
发布于 2023-12-05 15:30 广东
码住,谢谢佬
点赞 回复 分享
发布于 2023-11-20 13:48 辽宁
点赞 回复 分享
发布于 2023-11-18 15:10 广东

相关推荐

03-29 23:24
已编辑
门头沟学院 算法工程师
腾讯 LLM (3+1) 🚀实习+项目占比1/2,八股1/4,代码题1/4,项目被问个底朝天1. 介绍transformers的结构以及每部分的作用以及对应的参数大小2. 介绍位置编码(绝对,相对主要是ROPE,以及Alibi(Baichuan使用的))3. 介绍目前所用的优化器,它们有何区别?项目中使用了LSTM?为什么使用它,不用Transformer?LSTM的不足和优势?优势差点没说不来🥲5. LLM多大的,是否使用并行方式,训练多久,训练过程中遇到什么难题以及如何解决?Deepspeed和Megatron对比一下有何不同,优势分别是什么?6. 你为什么选用Deepspeed?出发点是什么?PEFT的各种结构,简单总结下,各有什么好处?6. linux如何查询某个文件的前几行?回答指令你为什么使用DPO不使用PPO?出发点是什么?7. 阐述下你所了解的大模型压缩技术?并展开讲述1-2个8. 开放题:现在你有两个选择:超大模型的对话助手和很多特定领域的小模型对话助手,你会选用哪种方案?9. 代码题:1. 多头注意力机制源码、2. 对角线矩阵、三数之和、3. 快速排序、最长不重复子数组(?)10.HR就是那样子的,腾讯那边会问:你自己职业规划有什么想法?可三年或五年。面了两次都遇到了。。。#nlp算法工程师# #秋招# #算法# #互联网大厂# #大模型# #实习# #马上消费金融#
查看13道真题和解析
点赞 评论 收藏
分享
研发管理部三面给我挂了,心情巨差,打游戏的时候有个人一直给我打电话,我全没接。打完看到短信好像是什么腾讯音xxx,以为是腾讯音乐就没管。周天检查的时候才发现是腾讯云音视频,连忙回信约面。1.项目经历,就让我简单介绍一下,我说需不需要我详细介绍一下项目难点,面试官拒绝。2.c++知识。先是智能指针,unique_ptr能不能转移所有权,如何使用只能指针能够减少开销。拷贝构造函数和赋值构造函数的区别,然后给我四行代码让我分辨哪个是拷贝哪个是赋值,脑子一下空白,第一次回答错了面试官又叫我思考一下,然后正确。malloc函数在执行过程中都经历了什么,程序free掉的空间是直接释放还是会有其他操作。基类的析构函数是否可以为虚函数,如果不是虚函数会有什么后果。3.计网。为什么需要WAIT_TIME。拥塞控制算法。什么是粘包,怎么解决粘包。4.操作系统。哪些命令查看内存使用情况。系统中某个进程发生了内存泄露,如何定位到是哪个进程发生了内存泄露,如何在不重新编译运行程序的情况下详细分析内存泄漏的情况(即不能使用内存消毒剂之类的工具)?5.算法。两道力扣中等题,一道智力题。两根分布不均匀的绳子烧完分别要一个小时,如何计时15分钟。6.反问阶段:你们是做什么的,base地。为什么上个部门把我挂了,上个部门面评如何(面试官完全不知道)。半个小时后收到二面通知。
查看18道真题和解析
点赞 评论 收藏
分享
评论
48
344
分享

创作者周榜

更多
牛客网
牛客企业服务