货拉拉数分一面面经
title:数据科学家
base:上海/深圳
面试官是可爱的小姐姐,人很好,希望接下来的面试顺利。
1. 自我介绍
2. 介绍一个简历上的项目,根据项目提问,我讲了一个销量预测的kaggle比赛
缺失值怎么处理的?
建模的目的是什么?
EDA怎么做的?
线性模型怎么做的,怎么改进的?
kNN原理,适用和不适用的场景
随机森林原理
3.两道sql题,中等难度,我写在IDE里给她看了屏幕,用到了rank(),她问和row_number()的区别
4.ABtest原理,举个例子,她也举了个例子,问我原假设和备择假设应该是什么,我答错了,应该把小概率事件放在备择假设里
5.p-value定义
6.对货拉拉的了解,我讲了一下对app的看法
7.业务分析题,问货拉拉订单下降的原因是什么,提示要从供给方和需求方两方面分析
8.对数据分析职业路径的了解,问我更想做偏分析的还是偏挖掘的,我答偏挖掘的
9.反问环节