西安站百度一二三面面经
2017/9/15
1. LR和SVM的应用(这一部分比较细,具体忘了);
2. SVM核函数有哪些,核函数的作用;
3. 手撕计算日期差代码;
4. 一枚正反硬币,一枚两面都是正的硬币,一枚两面都是反的硬币,任意选一个,抛出,正面朝上的概率;
5. ABCDE排列,AB必须在一起,可以左右互换,C必须在D的右边,有多少种方法;
6. 如何判断链表中有环;
7. 项目;
2017/9/18
8. C++中哪些强制转换,每个强制转换的应用;
9. 解释虚函数,虚函数表是什么,虚函数指针如何快速查找到虚函数表中的函数;
10. 虚函数前面可以加static吗,为什么?
11. 写一个字典树,数据结构自己定义,实现插入功能;
12. N个有序的链表,将这些链表合并成一个有序的链表;
13. TopK,那如果查找第k个元素呢;
14. 算法题:实现字符串分割,分割后每个word都在一个字典中,返回true,否则返回false;
15. 红黑树
16. 问项目
17. 交叉熵,LR的交叉熵损失函数,如何优化
18. SGD,GD
19. Xgboost原理,如何获得每个特征的重要度,xgboost里面个get_score的原理是什么;
20. Bagging是什么,RF的原理,如何解决过拟合,假如有m个特征,一般选多少特征拟合一棵树,为什么只选一部分的特征;
21. 线性回归将特征如何转为高维度
22. 为什么SVM中核函数做内积就可以,核函数的含义是什么
23. 正则化,L1为什么能使参数变稀疏
24. 高斯核函数的物理意义
2017/9/20
百度三面
问题很深入,很尖锐。大大佬,先收下小弟的膝盖。。。
1.项目,总之就是为什么这样,这样为什么好?
2.Adaboost和GBDT的区别;
3.Adaboost推导;
4.聚类算法有哪些,高斯混合模型聚类方法,高斯混合模型中的隐变量是什么,对应EM中Q函数的哪部分,说明Q函数的意义,深入探讨了EM算法,发现自己只是浮于表面。。。;
5.场景问题:给百度用户的搜索日志,海量字符串,已知少量的化妆品品牌,如何根据这些化妆品品牌和海量的搜索日志,获得大量的化妆品品牌。
6.国内哪些书籍,国外哪些机器学习方面的书籍,国内哪些学校的NLP做的好,等等。
7.聊如何学习,百度部门等等。受益匪浅。。。。