面经-快手海外版-数据分析实习生
一面
1.SQL
table_a
dt, city_id, device_id, gmv tips:每个device一天可能有多条记录
(1)求每个城市每天gmv最高的5个device_id
(2)求连续三天每个城市每天gmv都在前5的device_id
2.统计题
(1)自变量存在多重共线性,如何通过变量筛选来解决?
(2)线性回归的五个基本假设
3.机器学习
(1)DBScan 与 Kmeans相比的优点
(2)如何判别离群点(总是在边界上的点)
面试官说他比较喜欢统计学学的好的人,可惜我不是学统计的
二面
(1)基于观测数据的因果推断 如何从因果角度分析指标对转化率的影响
(2)发现快手海外的新用户留存下降了 Q4和Q3相比
从相关性的角度分析 指标对留存率的影响
(3)使用线性回归满足的假设
比较重要的是验证协变量之间是不是存在多重共线性、残差是不是满足正态分布
(4)T-test的时候需不需要变量满足正态分布
当样本大于30不再要求变量满足正态分布,T值需要满足正态分布
#数据人的面试交流地##数据分析#