百度提前批算法岗四小时面试记录
持续时间从13:50到18:09,连续三面,问了很多东西而且问得非常细,面完后脑子有点糊,很多东西不记得了,各位见谅。
因为三面聊了50分钟的业务,技术就稍微问了一下,所以三面就不说了,只说一二面。
一面:
一面面试官问的东西特别细,可以感觉出无论技术还是理论都是搞出一个级别的存在。一面中很多问题我出了好多差错,幸好面试官多次确认我又答对了。
1. 自我介绍,比赛、项目、论文挨个问一遍,问得很细;
2. 比赛,特征怎么做的。聊聊DBSCAN,为什么选择DBSCAN,它的优缺点是什么。还知道那些聚类算法,各有什么优缺点。聚类算法的参数怎么调。聊聊XGB,它在性能上有哪些改进,在表现上有哪些改进。正则项是干啥用的。
3. 项目1,为什么要做这个东西,出发点是什么。
4. 项目2,聊聊embedding,知道哪些RNN模型。了解GRU不,了解LSTM不。LSTM参数有几个矩阵,它们的维度分别是多少。给出相邻两层网络的featuremap尺寸,求卷积核的参数数量。你项目中哪一部分是Encoder,哪一部分是Decoder。word2vec的参数数量是多少。
5. 论文,简单讲了一下。
6. 两道coding,最低公共祖先,01矩阵中最大全1矩形的面积
二面:
最开始我不知道为啥,二面面试官话贼少,就是那种我说完他就一直沉默,搞的很尴尬。期间我还问了两次“面试官?”确认他在,后面他问了一个问题我才知道二面面试官一直在看我的GitHub,所以隔了很久才说一句话。
1. 比赛跟项目,又来了一遍,论文简单提了一下。
2. 看项目1觉得我机器学习理论很扎实,推一个logistic regression,要矩阵形式的。
3. 现在有一个文本情感分析的任务,你自己设计一个模型框架。我画了个Seq2Seq的大致框架,加了TextCNN和Attention。说到Context Vector的时候,问Decoder部分和分类部分还可以用什么来做。embedding是用预训练比较好还是直接针对任务调优比较好。这里扯了很久,不太记得了。
4. 知道哪些激活函数,它们的优缺点分别是什么。
5. 两道coding,第一道太简单没意义,第二道,求和最大的连续子数组。不是只求最大和,还要求连续子数组。
三面:
三面面试官是个女性,自我介绍完后开始问我本科时的情况,我以为是HR面了,后面证明我太拿衣服,三面应该是最有压力的一面了。
1. 详细讲论文,因为论***的方向面试官没接触过。
2. 对深度学习了解多少,说下你知道的所有DL模型。
3. 开始扯业务场景,就不细说了。最开始提出业务场景的时候我脑子一蒙,支支吾吾答不出来,然后面试官开始简化条件,慢慢引导。到最后我都聊high了,但是面试官好像也不是特别满意,总觉得我对业务不熟,把东西都想得太简单,但还是让我一直说。最后评价是思维能力不错。最后稍微问了点问题就结束了。
就这样,记得的就这么多了。