百度 算法实习生一二三面经
中间有些内容可能隔了有点久没有完全记录下来,请大家见谅。
一面(时间:3.27)
- Python的浅拷贝和深拷贝的区别,具体怎么写
- 有用过linux吗,用过哪些命令,akw用过吗
- hadoop和spark了解吗
- 代码题,之字形层次遍历
- Kaggle的整个过程是怎么做的,特征怎么处理
- 特征怎么选择,怎么判断一个特征的效果
- Xgboost和gbdt的区别,xgboost中防止过拟合,bagging和boosting的区别
- Sigmod激活函数的具体公式,手推lr
- LR的特征交叉,那不想手动交叉怎么办
- 评价指标
- LR有什么优化算法
- 会不会attention
- 有一些比较零碎的想不起来
- 反问:问了具体是做什么,是不是一定要c++
二面(时间:3.27)
- 代码题,找到最长的子序列
- 样本不平衡怎么办
- 特征缺失得特别多怎么办
- 决策树对于这种样本缺失的会怎么表现
- 挑选一个项目讲讲,项目里的xxx怎么做
- 还有些别的问题忘了
- 没有反问直接说这轮面试结束
三面(时间:3.27):
- 主要问项目,往广度问,往深度问,对这个方向的了解和主流的解决手段(我的机器学习方向比较偏门),从模型和数据的角度出发,探讨里面的一些问题,比较深入。自己的项目有什么亮点,关于这个方向的想法。
- 做项目的过程中有遇到什么困难吗,怎么解决,平时怎么沟通
时间:4.2 oc
总结:一面主要问机器学习的一些比较基础的问题和项目,二面会问机器学习的问题和项目更佳深入一些,三面聊论文往广度和深度问。比较感激三面的面试官是跟我以一种共同探讨问题的态度,告诉我没有标准的答案,大家一起讨论。从我个人觉得,回答问题可以从多角度出发。