算法实习生面经(nlp、数据挖掘、机器学习)
总结一下这几个月的面试吧。算法刷题的面试题没有记录。多刷刷leetcode和剑指offer就可以。
自己之前面的数据挖掘岗,但是后来自己的兴趣在nlp,所以后面很多就面试nlp岗位了。
1、xgboost 比 gbdt 有哪些优势,xgboost的原理。
3、解释一下AUC
4、lgb和xgboost 对比 哪些优势。lgb如何实现并发多线程的
5、svm对缺失数据敏感吗,为什么,决策树呢。
6、决策树是如何处理缺失数据的。
6、svm如何处理多分类
7、为什么svm采用最大间隔。
鲁棒,对未知数据泛化更好
8、svm选取样本问题,如何增加样本点。
9、词向量 降维是如何实现的
10、什么时候选择svm算法,什么时候选择决策树算法。
svm更适合处理特征多的样本。 而决策树处理特征多的样本时容易发生过拟合。
11、神经网络如何实现异或门
12、神经网络多层感知机训练过程,手写一下
13、逻辑回归完整推导过程,LR
14、CRF HMM原理 公式、维特比算法的公式
15、L1、L2正则,数据平滑 解释
16、RNN参数大小。推导。
17、LSTM公式、GRU公式
18、word2vec和glove优劣
19、基于密度的聚类了解哪些
20、nlp分词技术有哪些,如何分的。