滴滴金融事业部算法岗面经,已意向书
情况介绍:本人本硕末流985,双控,导师项目一点不沾边,平时自己自学,然后主要的方向还是想做推荐/广告。疫情期间自个参加几个比赛都没拿到top(我太菜了QAQ,一个人玩就是去当炮灰)。然后5-8月在网易那边做线上实习,感觉实习在面试的加分很大,面试官也主要就着这个面的。考虑到自己水平,面核心部门铁定挂,所以选了金融事业部。
笔试(8.21):编程ak
一面(8.31,1h20m):
详细问比赛问项目,然后根据项目问模型(简历上的项目沾边的模型一定要会)
主要有gbdt相关(xgb,lgb改进方向,工程并行实现等,和rf区别)
bias和varience
l1,l2正则
batch normalization
Attention
梯度消失,爆炸及解决方案,LSTM相比于RNN改进和怎么捕捉长期依赖
LR,FM,deepFM,wide&deep相关等
编程题:
两个有序数组的中位数(没a出来)
给一个数组的字符串,然后求shape。如:“[[1,2,3],[1,2,3]]”,结果为(2,3)。我没做过相关的题,所以自己想的,可能有点复杂:用栈判定同一维,然后用“,”分割求维数,例子中的维数就是emb=[3,3,2],逆序取维数:(emb[-1],emb[-1-emb[-1]])=(2,3),注意对于求过的数据需要抹去逗号。
一面还是比较简单的,问的也比较基础
二面(9.3):
和一面差不多的套路,问实习问比赛,
问了些实习相关的难点和怎么解决,后续的改进方向之类的。
编程题给忘了,但是是leetcode中等难度的。
三面(9.9):
上来直接就让挑一个项目说(套路X3),我选的实习。
中间问了些很不错(难)的问题:
LR做特征重要性分析时,连续值会有影响吗,怎么处理,特征的重要是看one_hot后的sum还是mean?连续值会和权重相乘,有影响,所以需要离散处理,后面说下离散处理的好处和坏处,这里的坏处我时考虑到计算量的增加,不知道对不对。特征的重要性是看mean,one-hot后每个权重都代表着这个类别的权重
GBDT树直接取第二层的特征也可以看成交叉特征,和FM比较:我认为GBDT树模型本身只是对样本的一个记忆,不具备泛化性能,即可能样本里没有出现过的类别组合,gbdt就不会 学习到,其实这个跟LR做二阶特征一样;而FM是直接对每个特征训练一个隐向量,不依赖某个特定的特征组合是否出现过,只要特征x和其他任意特征组合出现过,就能学习到x的隐向量,泛化性能更好。
问了下NFM,这里我答的不够详细,大致说了下
两个相同的特征(对输出都有用)输入到线性模型,用L1正则,这两个特征是不是都会为0?我一开始是一维考多重共线性,后来面试官明确了下问题,然后我回答的不会,因为两个特征都有用,那么l1正则不会让他们为0,但是由于L1正则的存在,所以两个的权重会减半(相比于一个)
问了下l2正则会不会影响adam的学习率?会,具体原因我说我不知道,然后扯了下网易实习时优化器的选择时,adagrad优于adam,说了下原因(adam会更新整个batch的样本,容易造成embedding层过拟合),成功的圆回来了(0.0)
最后两个概率题(听到概率题心凉了半截):
1. 三个门,门后一个有礼物,你选了一个,帮你排除了一个没有礼物的门,问你换不换:换,假设第一门有礼物,计算换和不换拿到礼物的概率,最后换的概率是2/3,一开始我直觉上以为不用换,差点就说出来不换了,还好算了下概率
2. n个人,其中一个是明星其余为普通人,明星不认识普通人,普通人都认识明星,普通人之间是否认识未知。现给一个黑盒,可以询问一次A是否认识B,问使用黑盒几次能找到明星,面试官提示了下,最终算出了n-1次,推导如下:A不认识B,那么B不可能是明星;A认识B,A不可能是明星,每次询问必能淘汰一个人,所以最后需要n-1次
三面问的挺深的,需要依靠平时的积累来推导,第二个概率题回想还是挺简单的,是我自己太菜了。
hr(9.9):
三面是下午3点结束的,晚上8点40成功错过第一个电话,9点打来接到了,问了下手上的offer,我说有个触宝提前批(希望能提提价,但是感觉希望不大),后面还会面大厂,选择主要看薪资福利等,很奇怪没有聊薪资,直接说了后续正式offer会写明。感觉应该就是白菜价了。
秋招一个多月第一个大厂offer,接到hr电话还是蛮激动的,庆幸自己能看清自己能力选择了非核心部门(我周围投cto网约车的最远走到了二面,太难了),希望大家也能理性看清自己,今年算法岗本来就一片红海,因为疫情原因,好多海外高校的也投了国内的公司。
最后祝愿大家能拿到一个满意的offer,早日结束秋招的痛苦。