腾讯数据分析二面凉经
一面
3.17 投递
3.27 29min
自我介绍
整体介绍实习经历,描述实习中某一项工作具体是怎么做的,是否独立完成,实习经历中得到了哪些收获挑选了一个项目进行介绍,项目缺失值怎么处理
随机森林和XGBoost的异同点
XGBoost的并行化体现在哪里
交叉验证是怎么做的,如何防止过拟合
介绍逻辑回归模型,为什么输入逻辑回归的变量不能有相关性,相关关系的学名是什么,了不了解odds的概念
有没有对特征进行降维处理,知道哪些降维处理的方法
了解怎么做单变量分析吗,后来查了应该是对一个变量深入探索,做统计分析之类的
有一个设备的APP安装列表信息,安装了哪些APP,如何识别此人是否有买车的意愿
介绍一下惩罚项,L1正则和L2正则,L1正则有哪些应用场景
反问面试官
二面
3.31 27min
自我介绍
学校和老家的地理位置,为什么不选离家近的要选腾讯,如果离家近的给了offer选择离家近的还是腾讯未来三五年的职业规划
介绍一个项目,项目分工
为什么选随机森林和XGBoost,事前的考虑
如果这个项目再做一遍,有哪些可以改进的地方
因为项目做的是预测重复购买,问从宏观上说什么因素会影响用户的重复购买
如何评价自己在上一段实习中的实习工作,我的实习技术门槛不高
如果给你一堆QQ号数据,怎么判断两个QQ号属于同一个人
如果给你一堆通话记录,怎么判断哪些电话号码是外卖员或者快递员,说完一堆让我对自己刚刚的发言进行总结
反问面试官,我这时候对上次面试单变量分析没答出来做了个补救,但面试官并不care,反正已经对我无兴趣了
面试官的评价:提到分析的方面很多,但是没有思考到更加基本、底层的东西;项目做得不够深入,对模型适用什么场景没有宏观上的理解
迷惑:准备了很长时间但没考SQL和Python
#腾讯暑期实习##腾讯##数据分析师##校招##面经#