百度3.27连续三面面经
请问大家有没有3.27连续三面后,说今天的面试结束了,后续等通知的呀
到现在也没有通知……心慌的很……有没有人已经有后续消息了?
整理了一下面试的相关问题,供大家参考
机器学习/数据挖掘
一面:40min
1. 自我介绍
2. 平时用什么语言(lz只会python……被问会不会C++java,尴尬的说了不会)
3. python基础的数据类型与数据存储方式?
4. python中如何将一个列表随机化?
5. 快速排序的原理?快速排序和冒泡排序的时间复杂度?
6. 快速排序什么时候达到最大时间复杂度?
7. 1w个数字,如何高效选取其中的top10?
8. 快速排序的时间复杂度是nlogn,有没有更更快的排序方法?
(7和8答案是用最小堆最大堆,没有答上来)
9. 1w个数字,选取其中的top10,用快速排序如何改进?
(面试官很好的一步步给提示,最后把方法理出来了,面试官人真的好。首先判断每次排序后star位置属不属于最后10个。如果属于,则star右边list均属于top10,只继续对左边list递归即可;如果不属于,那么说明TOP10均属于右边list,继续对右边进行递归)
10. 10亿个数字,如何找出出现次数最多的10个数?
11. AUC是什么?
12. 在你的项目中用了哪些算法?如何进行算法的落地?
13. 在样本不平衡问题中,除了修正数据集,还能有哪些方法?
14. 对于模型融合的了解?
15. 如果一个模型受训练集的影响非常大,也就是更换训练集后结果变化非常大,用什么方法解决这个问题?
16. 可以安排实习时间是多长?
没有编程题,直接进入二面啦
二面 30min
1. 自我介绍
2. 深挖项目(把自己的项目给面试官讲明白,包括细节如何实现)
3. 解决样本不平衡的方法?
4. 数据扩增SMOTE算法的原理?
5. 欧式距离为什么不适用于高维数据?
4. XGBoost与GBDT的区别?
5. GBDT实现的流程?哪些参数对最后结果比较大?
6. 对于之后做的方向有什么规划吗?CV/NLP/推荐?
7. 在线编程:镜像二叉树
进入三面……等了好久忐忑。。。
三面 35min
1. 自我介绍
2. 深挖项目,问数据来源,怎么产生的数据or从哪儿找的数据?
3. 项目模型如何进行优化的?
4. 项目中的分工是怎样的?
5. 对深度学习的了解?
6. 目前主流的视频推荐、音乐推荐基本算法有哪些了解?
7. (开放题)如果现在让我给用户推荐一个音乐,我应该怎么实现这个功能,涉及哪些特征哪些算法怎么计算?
8. 看你专业不是计算机,平时有没有学一些计算机基础课程?通过什么渠道学习?
9. 在线编程:找二叉树最深的节点的深度
(面试官听完我的思路后,说不能用递归,可以辅助一些栈或者队列,(有没有小伙伴知道怎么做吗??)。但是我没有想出来……最后还是允许我用递归写出来了)
然后一直到现在就是等待……
啊啊啊啊好想去百度啊,,跪求offer!!!!
===============================================
4.07更新
我来还愿了,哈哈哈已经接到offer啦,希望各位朋友offer多多!