2021-字节春招实习-data广告-推荐算法-实习面经
先说一下各位比较关心的时间节点:
2月18日上午, 投递简历.
2月18日下午, 约一面时间.(无笔试)
2月25日上午, 一面.
2月26日上午, 一面通过, 约二面.
3月2日上午, 二面.
3月2日晚上, 二面通过, 约三面.
3月9日晚上, 三面.
3月12日下午, 三面通过,约HR面.
3月15日晚上, HR面.
3月16日上午, 发offer, 收到面试体验调查短信.
技术面时间长度: 1~1.5小时
虽然说字节面试比较效率, 但是可能因为我面的部门比较忙,从投递到收到offer也是隔了一个月.不过好在结果是好的!
投递的岗位是推荐算法.
一面:
1. 自我介绍
2. 介绍之前的实习经历
3. 实习所用的模型, 用户侧特征是怎么得到的.
4. 淘宝EGES的原理.
5. 如何增量训练, 如何在保持嵌入矩阵维度不变的情况下增量训练(可能会有新书进来)
6. 多任务模型的一般思路.
7. 为何选择DIN为排序模型.
8. 结合实习的业务, 对比DIN和BST的效果.
9. AB test的原理
10. AB test中你会关注哪些信息
11. 实习时间
12. 反问环节(我问了 部门的工作内容, 转正率什么的)
13. 算法题: 简单题, 二叉树, 每个节点有一个值, 求出二叉树从根出发的所有路径的和.
总体来说, 一面考核的是思想层面, 比如考核面对大数据如何增量训练, 面对多指标如何多任务学习, 从离线实验到部署上线的流程, 线上测试需要关注的信息, 模型选择的依据等.
二面:
1. 自我介绍
2. 介绍我的CV比赛项目
3. 介绍Cascade cnn框架的优势.
4. 介绍比赛中的有用的trick有哪些
5. yolo的损失函数
6. 介绍所了解的目标检测框架.
7. 实习经历
8. 分别介绍所了解的推荐模型有哪些.
9. 是否了解L2R, NLP, transformer, 图神经网络.
10. 推导FM的时间复杂度优化公式(n方复杂度优化到n复杂度)
11. 有哪些所了解的机器学习算法
12. 算法题: 中等题, 编辑距离(增删改的惩罚由参数指定)
二面考核的主要是宽度, 几乎都是横向的问, 很少纵向的深挖, 而我恰恰缺乏宽度的积累, 所以面试过程还是有点难受.
最后的算法题, 编辑距离是将A变成B需要的操作数, 我头脑发热, 理解成了把A和B变成一样所需要的操作数, 最后导致dp的转移方程写的有点问题, 而且自己测试怎么都感觉是对的.
最后面试意外的过了, 可能是面试官看懂了我的代码, 知道我看错题了? 可能是再给我一次机会吧,哈哈哈.
三面:
1. 自我介绍
2. 介绍实习经历.
3. EGES算法如何建图
4. 图的边如何表示成概率.
5. 图的边表示的概率如何运用到后续的训练中.(我一开始理解错了意思, 以为问的是边权计算概率的方式对模型的影响)
6. 如何将多种商品特征结合起来, 用EGES训练得到多个特征的嵌入向量.
7. skipgram和cbow的区别, 为什么选择skip gram.
8. skip gram和cbow的模型结构(详细到几乎口述代码的程度)
9. 选择skipgram的输入向量还是输出向量作为商品的嵌入表示.
10. 如何验证向量召回算法生成embedding的质量.
10. 如何验证向量召回算法生成embedding的质量.
11. DIN的模型结构, DICE原理
12. 为什么选择DIN
13. 线上AB测试中DIN的表现和别的模型对比, 以及原因.
14. DIN的缺点
15. 如何将文本信息融入到推荐系统中.
16. 是否了解NLP, 介绍transformer的原理
17. 多任务的主要解决方案
18. 算法题: 中等题, 一个矩阵, 从左上角走到右下角, 只能往下,往右,往右下走, 求路径和最小的所有路径.
三面面试官的考核主要是深度, 一直深挖每一个细节, 基本上问到口述代码的程度.不过所有代码都是自己写的就问题不大.
技术面就这样了, 算法题的话 一面三面都比较顺利的过了, 二面看错题有点冤...
HR面:
1. 自我介绍
2. 实验室介绍
3. cv转推荐的原因
4. 读研选择cv的原因
5. 保研 or 考研
6. 实习完 工作还是读博
7. 入职时间
8. 实习经历和收获
据说技术岗 HR没有权限给挂. 整个HR面的过程感觉都不是冲着考核去的, 感觉就是了解一下入职前的基本信息.
#实习##面经##字节跳动##算法工程师##校招#