贝壳机器学习/数据挖掘三面凉经
Timeline:7月17投递,8月13号笔试,8月22两轮技术面+1轮HR面。太多人安排在周末面试了,一面结束后等了一个多小时才到二面,二面结束等了半个多小时才hr面。
一面(1h)
1. 自我介绍
2. 介绍简历上的一个项目
- 特征工程
- 如何添加和业务相关的特征
- 哪个特征花是尖子u多
- 模型上线后提升的效果
- 如何输出结果给业务
3. 随机森林如何计算特征重要性,每种方式适合什么场景
- 项目里的特征重要性,有无思考过为什么这样
4. 处理样本不均衡的方式,样本加权方式有哪些
5. 过拟合和欠拟合区别,如何处理
6. 有哪些需要对数据做归一化的算法
7. 做题
- 有序数组中找出不小于目标值的数,用的二分法
- SQL
8. 反问
- 组里的工作内容
和房源、客户、门店相关的回归和分类问题
- 新人培训体系
二面(40min)
1. 自我介绍
2. 介绍简历项目
3. 总结一下特征工程中,有什么方法。使得路径更短,效率高
4. DeepFM和FM的区别
5. 哪些处理特征稀疏的算法
6. L1正则化和L2正则化的区别
7. one-hot通常用在什么地方
8. bagging和boosting区别,两者更适合处理什么问题
9. 进程和线程区别
10. 模型通常有不同类型数据的输入,了解多模态吗
11. 了解高频模式挖掘吗
这个真的不会。。。
12. 算法题
二叉树中任意两节点的最短路径
HR面(15min)
1. 自我介绍
2. 未来1-2年职业规划
3. 优缺点
4. 在项目中的收获
5. 有其他offer吗,如何选择城市