网易杭研,数据挖掘,21号面经分享(估计都面完了)
一面
主要问的是项目
没想到还有编程题:手写快排,讲一下top k思路
随机森林和SVM各自的适用场景
做题,考察贝叶斯概率公式是否熟悉,写一下高斯核函数(我给忘了)
二面
上来就说,一面项目应该问得差不多了吧,我们聊聊算法
随机森林的训练过程,如何采样
Adaboost训练过程(权值更新公式我给忘了,只讲了过程)
朴素贝叶斯如何用先验概率生成后验概率,拉普拉斯光滑怎么处理
C4.5的信息增益率计算公式,比ID3好在哪里
写LR的极大似然估计,推导根据梯度更新参数的式子
Kmeans的时间复杂度(我也给忘了,现场想了下,不知道对不对)
总得来讲二面问得不难,都比较基础,但是还挺细的
HR面
随便聊了聊