23届秋招算法岗面经分享

写在前面,楼主是23届硕士,秋招过程中在牛客上收获了很多宝贵的经验,也认识了很多热情的小伙伴,现在马上24届就要开始秋招了,这里我也来分享下自己的面经回馈牛客吧。

大家如果有什么想问的尽管在评论区留言,也可以向我私信,我都会尽量回复的~也祝大家都能有满意的offer~

技术面基本流程

  1. 自我介绍(两分钟足够了)
  2. 讲论文/项目/比赛/实习经历(要有层次,建议讲的过程中可以适当和面试官进行互动)
  3. 基础知识(你自身研究领域/机器学习/深度学习/编程语言,一般来说,如果你实习和论文很丰富就不会涉及基础知识了)
  4. coding(面试时讲究的是快准,要足够熟悉,否则一紧张最基础的都可能写不出来)
  5. 反问

背景

lz是9本C9硕,有两段个人感觉含金量不高的算法实习,一篇很水的论文,力扣代码刷了六七百道,对于各种题型中的高频题目刷了很多遍,面试代码基本上都写出来了,笔试就看运气了。

因为一些个人原因没怎么参加秋招,以下大部分面试基本上都是秋招补录和春招时期,所以存在一个公司面两次的情况。

360-广告

一面

  1. 实习内容
  2. 二分类建模过程
  3. mse和交叉熵用于分类的区别
  4. 假如随着迭代的过程,模型结构越来越复杂,特征越来越多,但是效果一段时间后下降了,请问是什么原因,该怎么解决
  5. 过拟合怎么解决?
  6. 怎么进行特征选择?
  7. 两道题:最长上升子序列(求出具体序列)、背包问题lc322

二面

  1. 随便闲聊了下,问了下实验室做的东西,本来一开始说要写题,结果也没写

hr面

  1. 常规问题,HR说要十一月中旬才有结果。。。

百度-NLP强化学习

一面

  1. 论文、实习
  2. 进程和线程区别
  3. GNN和GCN区别
  4. yolo和FasterRCNN区别
  5. 代码:最大子数组和

二面

  1. 论文
  2. 实习,讲完了啥也没问。
  3. 剪绳子。
  4. 没反问

三面

  1. 问了下对我这个领域应用难的看法;
  2. 做research还是业务,选择哪个方向
  3. 反问

腾讯-cdg广告

一面

  1. 实习内容
  2. 介绍精排
  3. LR为什么用交叉熵
  4. 还有一些基础记不清问的啥的
  5. 代码题二选一,好像是全排列?

二面

面试官没安排好。又是一面的面试官,于是临时拉了个人面。。。只是大概问了简历和一些问题,最后一道很简单的题。lc448。

最想去的地方挂了,唉😔

美团-内容理解

一面

  1. 论文、实习
  2. 了解CV还是搜推多?讲一下DIN DIEN
  3. 介绍一下attention、transformer
  4. 代码:二叉树层序遍历

二面

  1. 论文
  2. GNN和graphsage区别
  3. mind和DIN区别
  4. 代码:重排链表

hr面

  1. 半小时,常规问题,记不清了。。。
  2. 期望薪资报高了?后来给我加面了

加面-四面

  1. 论文和实习
  2. 一道代码,很简单的二分查找

字节-电商广告

一面

  1. 论文
  2. 常规八股:bn、resnet、dropout、
  3. 了解什么cv模型,讲一下senet,
  4. 过拟合欠拟合,
  5. 了解什么搜推广模型,讲一下DIN,
  6. 代码:给定正整数数组nums,求积小于k的连续子数组的个数。例如nums=[10, 5, 2, 4, 1], k=100

二面

  1. 论文实习
  2. 代码:斐波那契额数列变体,f(n)=f(n-1)+2f(n-2)+3f(n-3),(开始出的没有这些系数,我说了下思路后面试官问我是不是写过,就改了下系数),要求时间复杂度小于O(n),其实就是矩阵快速幂写法

三面-未面

HR二面当天说通过了,结果过了一天说没有hc了,给我转到隔壁部门了

字节-非闭环广告

一面

  1. 论文、实习
  2. 怎么衡量召回效果
  3. 增加一路召回后,怎么衡量这一路的效率(性能和成本)?从召回本身的roi怎么评估?
  4. 代码题:lc68

估计是对我经历没啥兴趣,但看我代码写出来了,又继续问八股了。。。

  1. 介绍DIN及其中的激活函数、din中有个过拟合的设计介绍一下,这么设计的优点
  2. 直接学习不平衡的数据,这毕竟是一个真实分布,会有问题吗,从机器学习本身的原理上来说,或者说不处理是为了解决一个什么问题、可以从梯度下降的角度思考一下
  3. 过拟合的方法(提到了bn)
  4. bn为什么能过拟合,怎么用bn解决过拟合,也就是怎么调bn
  5. attention,LHUC(Learn Hidden Unit Contribution)
  6. 会sql、hadoop吗

反问建议和评价:了解的东西比较多,包括很多东西说的整体上也是对的,但是不能想当然,要把更多更细节的东西展现出来,算法具体哪一步有用。

另外说我召回评估这块没讲好,我说实习组里权限没字节这么大,面试官就说组里的限制不影响你个人的思考,可以秀一下你自己的思考(好吧,确实面试官比我厉害)

最后结果也不出意料,挂了

字节-tiktok推荐-实习

找不到工作。。。只能试试实习了,当积累面经了

一面

  1. 实习
  2. dropout、过拟合解决方法
  3. 论文
  4. 了解什么backbone?提到了mobilenet、shufflenet、senet、vit相关的
  5. 讲一下senet
  6. 代码:pytorch实现senet、找第k大的数(面试官看我写的很快,说背的很熟啊,哈哈哈)
  7. 反问

二面

  1. 问了论文和实习,没八股。
  2. 代码题:找每一层最左边的节点,无反问

三面

  1. 一上来就说面试时间大概45min,先考核代码和数学能力,然后有时间就问下项目
  2. 两道代码:斐波那契额数列快速幂版,rand3实现rand7(调用次数期望值怎么计算,具体计算过程)
  3. 后面问了下实习最深刻的印象、为什么去这些实习、几月份答辩

还以为能过呢,结果后来问了下hr才发现当晚面完秒挂。。。

蚂蚁-商家开放技术部

一面

  1. 论文(面试官竟然了解我这个领域的一些论文,我很激动的和他探讨了下目前的研究现状)
  2. 实习
  3. 代码:编辑距离

不明白为什么挂了,后来找人问了下面评,说是基础不行,可是并没有问任何基础八股问题啊??

阿里-大淘宝

一面

面试官给我的感觉是技术比较强,实习和项目一点没问

1.线上线下效果不一致怎么排查?怎么进行特征选择?假设明确问题是特征泄露,假设问题出在100个特征,该怎么找出导致效果不好的特征?

2.了解BN吗,参数量是多少,有什么用,训练时和测试时的差异,测试时该怎么做,训练时用滑动平均还是单纯用单个batch数据进行bn?

3.两阶段的训练模型,类似stacking,第一阶段输出作为第二阶段输入,假设第一阶段训练得到的数据分布不太稳定,或者说和第二阶段的不一致,该怎么解决这个问题

  • 比如说,旁边组同学模型的输出会作为你的模型的输入,他的模型每天都会更新,这就导致这个输入分布一直在发生变化,这个时候你的模型就需要一定的适应时间,最终的输出根据你的模型决定,这个时候该怎么做,保证你的模型输出尽可能准确

4.最近有跟进什么最新的论文吗,有什么想法让你眼前一亮,讲一讲

5.代码题:给定一个数组,要求将其打散。滑动窗口内(大小为4)不能有元素重复,即模拟用户看到的一个展示页面没有重复,

  • 如果窗口内发现重复元素,则往后探测一个合适的元素与当前元素交换。尽可能不改变相对顺序,
  • 如果不能打散,就把剩下的数全部添加到结果中

输入:[1,2,3,1,3,4,5,6]

输出:[1,2,3,4,1,5,3,6]

二面

  1. 问了论文,也没讲全就被打断了,感觉面试官不在意
  2. auc物理含义
  3. 假设已知auc值,现在新加一批打分为0的负样本,auc值怎么变化?我开始说变大,他说不对,然后我就说不变,面试官还是说不对,叫我回去再想(面完复盘觉得应该就是变大?)
  4. sigmoid激活函数为什么造成梯度消失?(我说输入值太大或太小会导致落入梯度为0处,面试官说不对)
  5. 代码题,实现set(i,index),get(i),setall(val) O(1)时间复杂度。(期间面试官还掉线了,但是我看的是代码界面,没关注会议界面,后面才发现我讲了半天他都没听到)
  6. 问我有哪些offer

百度-商业化

一面

  1. 论文和实习
  2. 代码:求两个数组的交集(如果是有序的呢?)、最大子数组和、pyspark题:求一个月内连续登录三天的用户(大概说了下思路,面试官说不是很重要,就没写了)
  3. 讲一下xgboost,过拟合设计
  4. 梯度消失、梯度爆炸怎么解决
  5. CNN的特点

二面

  1. 实习
  2. 一道很简单的概率题
  3. 然后三道题:
  • 怎么判断n是否能被7整除,不能用除法和求余(二分);
  • 验证完全二叉搜索树(lc958);
  • 两个1GB的文件,每一行存了一个单词,每个单词小于16kb,现在内存1MB,磁盘500G,求两者的交集并输入到C(分治+哈希即可)

4.如果用户输入了一个有错的query,怎么进行纠错,怎么衡量纠错完的质量

三面

  1. 闲聊,对自己5-10年规划,方向选择等等问题
  2. 实习最大的成长,讲一下实习,做了哪些优化,实习的组那边怎么样
  3. 论文创新点
  4. 开放性问题:百度搜索结果页广告,和谷歌广告,从用户和广告主角度看怎么样?其实谷歌广告多很多,那为什么给用户的感觉是百度更多广告,且体验更不好,可以做哪些优化

知乎-推荐算法

一面

  1. python基础:深拷贝、浅拷贝、多线程、生成器迭代器
  2. 分类和回归常用loss、优化器、激活函数区别
  3. 聊实习
  4. 代码题:lc213
  5. 介绍一下WDL,各自作用,去掉Wide可以吗
  6. 介绍一下召回排序链路,哪一个最重要

二面

  1. 随便聊聊论文
  2. 了解排序算法吗,时间复杂度,python排序库函数原理是什么
  3. 了解重混排吗,介绍一下
  4. 代码:检验二叉搜索树

后来面完和二面ld聊了很久,ld人很好诚意很足,可惜最后还是没去

快手-ytech推荐算法

一面

  1. 自我介绍,先写两道题,两个栈实现队列、二叉树根节点到叶子节点的路径(自己建树)
  2. 写代码时间有点长,后面没多少时间了,就问了下实习和论文,有点赶,叫我挑重要的说
  3. 然后八股,问了个梯度消失、梯度爆炸咋办。

二面

  1. 问实习和代码问了好久,感觉确实是比较有水平的,拷打了很久我的💩论文
  2. 代码题:删除数组中重复的数字
  3. 反问:面试官好能讲。。。。

三面

被拷打了实习,聊什么是自监督,自监督的做法、为什么有用,最新的趋势是什么

假设面试官是个从来不懂计算机的外行人,该怎么解释自监督的原理和做法?

  • 从有监督、到无监督怎么做的,一步一步说的。举猫狗的例子,然后自监督是否能应用到这个任务中?然后我举了个文本生成的例子:完形填空,模型怎么设计,输入输出是什么(其实就是word2vec的原理)。讲了很多,讲完这部分面试就到四十多分钟了,还给面试官画了图。

b站-搜索

一面

  1. 实习项目、论文
  2. 冷启动怎么做、线上配额等等
  3. 介绍一下transformer、BERT、GPT
  4. 介绍一下FM、WDL、DIN
  5. 代码题:移掉k位数字,lc402

二面

  1. 自我介绍、论文、实习
  2. 两道题:lc141、lc40

三面

  1. 论文、实习,然后引申问了些问题
  2. 无代码

美团-外卖推荐

后来春招又投了,结果二面完和我说之前拒过就不能发offer了

一面

  1. 讲一下研究生期间做的这个领域
  2. 线上流式学习怎么做
  3. 交叉熵公式,能不能log内外反过来
  4. 蒸馏loss形式、梯度推导
  5. 讲一下实习。
  6. 线上线下怎么评估召回结果,透出率?
  7. 了解什么模型?DIN激活函数怎么做的,为什么有用,attention的输入是什么
  8. cv nlp这块了解什么,transformer的decoder结构讲一下,有动手实现过吗
  9. 代码:lc97

二面

  1. 论文
  2. 假设有个主场景(很多数据),另一个小样本场景(比如抢购场景),两个场景实际上是有一些差距的(比如抢购场景折扣大、有自身的特效),那怎么用增量学习来解决这个问题呢(提到了PPNet)
  3. 抢购场景用户数量少,用PPNet怎么对少样本进行学习呢
  4. 抢购场景都是一些新商品,也存在主场景中,但是价格不同,库存不同,导致其ctr cvr和主场景不一样,也就是数据分布不一样,这种情况怎么处理。而且抢购场景售卖时间短,通过数据积累和特征的方法是做不了商品推荐的
  5. 如何评价知识蒸馏中student和teacher的差异性和共性
  6. 假如在召回中,用召回模型蒸馏粗排模型,如何评价蒸馏模型的效果,从知识蒸馏角度没有独特指标是吗
  7. 实习怎么构建的图网络
  8. 平时通过什么方式学习新知识,
  9. 对搜广推哪个模块比较熟悉,
  10. 代码:给定一个数组,对每个元素分别找到其左边、右边第一个比它小的数,对每个数返回一个索引对。

商汤-大模型

一面

  1. 论文,实习
  2. bn作用,ln作用
  3. 怎么判断链表是否有环,慢指针最多走多少步(假设有n个节点,最多走n步)

二面

(顶着38 39度高烧面试,但其实面完感觉人更舒服了一点)

  1. 检测中的增量学习难点
  2. 检测中怎么进行蒸馏
  3. cnn和transformer区别
  4. 在cnn和transformer之间进行蒸馏的难点
  5. 讲一下self-attention,具体怎么计算
  6. softmax运算过程,有什么问题(溢出),怎么解决
  7. bn和ln区别,bn具体怎么计算,训练和测试时差别

三面

  1. 两道题,快速幂、lc528
  2. 反问的时候面试官信号太差了,一直断断续续,几个回答一个没听明白,又不好意思叫他再说一遍。。

hr面-电话面

lazada-用户增长

一面-没开视频

  1. 论文、实习
  2. auc效果提升,但是gauc效果不变甚至下降是为什么?
  3. MMoE中很多expert gate的权重变为0怎么解决?比如只有对某个expert是激活态,其他都是0,那其他expert可能压根学不到信息,该怎么办
  4. 代码:岛屿数量、接雨水
  5. 反问(面试官很热情的和我介绍,当时心里还以为过了)

两个八股答的一般吧。。哎,挂了,这也是我最想去的地方。。。

快手-社科推荐

一面

  1. 自我介绍
  2. 代码题:求2的根号,精确到小数点后四位。要求二分法、梯度下降法、牛顿法,写完问还了解其他优化方法吗
  3. 知识蒸馏目前的做法?讲一下,有什么优缺点,讲了很久很细。
  4. 知识蒸馏loss?温度系数
  5. 了解什么推荐内容?把整个链路说了一下
  6. 探索和利用怎么做?讲一下汤普森采样,期望和方差对应什么参数
  7. 冷启动怎么做?PPNet具体做法?
  8. 实习
  9. 论文

二面

  1. 实习项目,讲了四十来分钟,一步一步写伪代码和过程
  2. 反问

三面

  1. 实习
  2. 论文
  3. 知识蒸馏在cv nlp和推荐中的区别
  4. 代码:lc148,我用归并排序实现,写完又问我快排怎么实现?

四面

  1. 实习,各种问题
  2. 找二叉搜索树中最接近target的节点(先写了bfs,然后写dfs)

hr面

  1. 一些常规问题

小红书-信息流广告

一面

  1. 代码:快排、最大乘积数组
  2. 论文、实习

二面

  1. 论文、实习经历
  2. 实习组内推荐系统最大缺陷是什么,或者做的不好的地方有哪些,该怎么改进

HR通知说过了,结果不知道为什么一直拖着不约三面。。。。后来我也懒得管了

阿里UC-推荐算法

一面

  1. 论文和实习大概讲了下
  2. 代码:(1)合并区间(2)实现树(3)求树的最大直径
  3. 数学题:m个红球,n个蓝球, 有序的选7次,求可选次数,m、n > 7
  • 1)同色球可以区分;2)同色球不可区分;3)蓝球不可连续选

二面

  1. 本科课程,数据结构,了解什么排序,时间复杂度各是多少
  2. 研究生课程,介绍一下模型,FM、WDL、DIN,youtube召回模型,优缺点
  3. 实习,实习收获

hr面

  • 常规问题,忘了

后来没接到HR电话,也打不回去。只能找约面的联系人,说帮我询问一下,结果一看官网流程就给我立马挂了。。。。果然不缺人

滴滴网约车mpt

一面

  1. 论文、实习
  2. 线上线下分布不一致是为什么,怎么解决
  3. 了解什么激活函数,sigmoid特点,relu呢?怎么改进
  4. L1L2正则化为什么有用
  5. auc曲线,怎么画
  6. 权重初始化
  7. spark和hive区别(mapreduce)
  8. 怎么找多个数中的第k大数,时间复杂度(口述)
  9. 代码:复制带random指针的链表,lc138

二面

  1. 实习
  2. 代码:找中位数
  3. 反问(面试时间不长)

三面

  1. 论文、实习
  2. 排序有什么指标?ndcg怎么计算的,其中的d是什么
  3. 怎么理解偏差和方差,怎么减小方差,bn为什么能减小,正则化是减小还是增大偏差
  4. 代码题:最小路径和,O(1)空间复杂度做法

四面

  1. 还是技术面,忘记记录了

hr面

  1. 常规问题。忘了
全部评论
太强了。。。不愧是刷几百道算法题的人👍
6 回复 分享
发布于 2023-07-20 16:12 吉林
或许可以考虑*****?(被系统删麻了。。)
2 回复 分享
发布于 2023-06-26 14:12 广东
好奇 Lazada 的用户增长到底是干嘛的,明天面这个,看 lz 被问的问题我都答不上 55
2 回复 分享
发布于 2023-07-11 11:35 广东
楼主楼主可以和研0学弟聊聊人生嘛
1 回复 分享
发布于 2023-07-05 16:45 浙江
大家有什么疑惑都可以在评论区讨论交流,即使我不知道,路过的大佬们看到也会解答的😂
点赞 回复 分享
发布于 2023-06-26 10:18 广东
或许可以考虑*****?不知道大家感不感兴趣,欢迎各个方向的小伙伴来一起交流
点赞 回复 分享
发布于 2023-06-26 12:30 广东
牛 都是大厂面
点赞 回复 分享
发布于 2023-06-26 12:46 白俄罗斯
lz最后去哪了呀
点赞 回复 分享
发布于 2023-06-26 13:29 浙江
请问博主说的计算机视觉八股能分享地址吗
点赞 回复 分享
发布于 2023-07-02 22:21 广东
想问下楼主的“一篇很水的论文”是CCF什么等级的文章,是顶会吗
点赞 回复 分享
发布于 2023-07-03 09:13 北京
有uu想要➕的吗!
点赞 回复 分享
发布于 2023-07-13 15:04 北京
所以面试官有说到底sigmoid激活函数为什么造成梯度消失吗?
点赞 回复 分享
发布于 2023-08-16 18:44 上海
好猛
点赞 回复 分享
发布于 2023-08-25 22:11 广东
朋友们,今年秋招情况怎么样呀😂大家来交流交流
点赞 回复 分享
发布于 2023-10-14 17:56 北京
美团手撕没撕出来还有戏嘛
点赞 回复 分享
发布于 2023-10-25 03:19 上海
剪绳子是啥
点赞 回复 分享
发布于 2023-11-07 03:41 上海
楼主最后去哪里了呀 我目前研一也想卷算法岗 可以加lz个微信请教一下学习路径嘛 我不是科班有点迷茫
点赞 回复 分享
发布于 2023-11-13 20:33 浙江
大佬最后去哪啦呀?不知道大佬了解不了解小红书信息流广告的情况
点赞 回复 分享
发布于 2023-11-23 22:22 河北
大佬,我目前研二也想卷算法岗 可以加lz个微信请教一下学习路径嘛!感谢
点赞 回复 分享
发布于 01-21 21:30 辽宁
请问可以加一下楼主的微信吗,我今年研二也打算找推荐方面的工作,可以请教楼主一些秋招方面的问题吗?
点赞 回复 分享
发布于 02-20 21:39 北京

相关推荐

12-26 17:47
重庆大学 后端
黑皮白袜臭脚体育生:一般需要一业务一轮子两项目,再加一个项目会更好,另外简历条例按使用了什么技术实现了什么功能解决了什么问题或提升了什么性能指标来写另外宣传下自己的开源仿b站微服务项目,GitHub已经400star,牛客上有完整文档教程,如果觉得有帮助的话可以点个小星星,蟹蟹
点赞 评论 收藏
分享
12-06 10:46
已编辑
上海大学 C#工程师
LHight:兄弟去偷配方回来
点赞 评论 收藏
分享
评论
74
415
分享
牛客网
牛客企业服务