龙湖数据分析一面
线下面试30分钟。
- 自我介绍。
- 为什么选择做数据分析。
- 本科最忙是什么时候,怎么协调。
- 研究生比本科多学到了什么。
- 线性回归和逻辑回归的区别。
- 决策树原理。
- 知道哪些分类算法。
- 讲一下AUC。
- 讲一下协同过滤的两种方式;基于内容的推荐与协同过滤的区别。
- 把评分大于等于 3.5 分的样本标签标识为 1,意为“喜欢”,评分小于 3.5 分的样本标签标识为 0,意为“不喜欢”。这样可以完全把推荐问题转换为 CTR 预估问题。请问老师,3.5分这个值是怎么来的呢。
基本原则是我在分析完分数的总体分布后得出的,3.5分基本是正负样本比例1:1的分界线,另外大于3.5分也符合我们直观意义上的高分,所以认为3.5分是比较合理的。 - 现在思考推荐项目有什么需要改进的吗。
- python怎么分割数据集的列。
- 场景题。用户活跃度上升了60%,怎么去分析。