滴滴数分 面经(已oc)
时隔一年再次鼓起勇气投简历了,秋招压力真的很大~
bg:北京985,计算机相关专业,两段大厂数据分析实习,一段小厂前端开发实习,目前求职意向是前端开发(优先)和数据分析。
滴滴出行 增长运营方向-数据分析
投递渠道是实习僧,面试官是一个语气很温柔的姐姐
一面(50min)
1.自我介绍。
院校、专业、毕业时间、实习经历简介
2.简单介绍一个实习期间印象比较深的项目。
我介绍了一个实习期间产品优化方面的项目,主要内容就是对PM上线的AB实验效果进行分析,介绍的思路大概是项目背景、项目流程、项目成果。
3.项目中关注了哪些指标?
从正向指标和负向指标展开,产品优化的方向是提升正向指标,控制负向指标。
4.既然聊到AB实验,说一下显著性怎么确定的?p值是多少?
这里有点尴尬,刚好忘记复习AB实验的内容......显著性是指零假设为真的情况下拒绝零假设所要承担的风险水平,p值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。总之,p值越小,越显著。
5.聊聊第一类错误。
第一类错误是原假设为真但错误地拒绝原假设,第二类错误是原假设为假但错误地接受原假设。
6.样本量怎么确定。 依然尴尬,样本量计算有公式,没复习。
7.指标体系如何搭建。 北极星指标、一级、二级,根据重要性和粒度依次向下拆解,也可以说OSM模型(Object、Strategy、Method)。
8.机器学习项目深挖。
楼主做了一个分类的机器学习项目,主要是将小样本的用户调研数据,推广到大样本的平台用户,根据用户的特征对用户是否信任平台进行分类。大体包括了用户画像、特征选取、特征变换、模型搭建和调参优化等。
9.训练集标签的比例是怎样的?
训练数据不平衡可能导致最终分类准确率的错误,这里回答了是均衡的数据。
10.ROC值大概是多少?
回答了0.76左右,后续还有进一步优化。
11.另一段实习的深挖
主要介绍了如何监控指标异动的,以及如何用统计学方法对用户进行标签化。
12.两道SQL题,要求共享屏幕回答。有一张表,有日期(date)、用户ID(uid)、订单ID(order_id)等字段,要求完成下面两个需求:
- 找出最近一周,完单量TOP10的用户。(完单量定义为完成订单的数量)
- 找出每天完单的人中,新用户的数量。(新用户定义为在一条记录中,该用户的日期是他第一次出现的日期)
# 需求1: 窗口函数、日期函数
# 主要关注的点:如何找出近一周内的记录、如何排序
# tmp子表主要用于找出近七天所有用户的完单量
with tmp as (
select
uid,
count(distinct order_id) as `order_num`,
from table
where
date between DATE_SUB((select max(date) from table), INTERVAL 1 WEEK)
and (select max(date) from table)
group by uid
)
select
uid,
order_num,
rk
from
(
select
uid,
order_num,
dense_rank() over (order by order_num desc) as rk
from tmp
)t
where rk <= 10
# 需求2: 窗口函数
# 找出一个用户产生订单记录的日期最小值,如果当前记录的日期等于该最小值,则认为这条记录是新用户产生的
with tmp2 as(
select
date as curr_date,
uid,
order_id,
min(date) over (partition by uid) as min_date
from table
)
select
curr_date,
sum(case when curr_date = min_date then 1 else 0 end) as new_user_num
from tmp
group by curr_date
13.实习时长,最早到岗时间 14.反问环节。
问了主要职责,日常分析中的工具使用占比,还有面试官对楼主的表现如何评价
总体下来感觉还是不错的,面试的姐姐非常亲切有礼貌,问题大多与简历中的实习和项目相关,偶尔会引申一些理论知识的考查,SQL题对楼主来说也是比较easy的。建议面试的小伙伴们一定要好好研读自己的简历,不要给自己挖坑,写出来的项目一定要清楚他的原理是怎样的。
一面隔天约了二面时间。
二面(15min)
感觉是leader面了,人很随和,聊聊天的性质
- 自我介绍
- 校内感兴趣的专业课,为什么
- 实习中有亮点的一个项目,说一说
- 技术和business sense的关系
- SQL、Python掌握得怎么样,自我评估一下
- 反问
整体下来很轻松~反问问了具体工作,面试官说取数需求不会太多,大部分是在做A/B、数据建模和一些业务的分析(目前正在评估系统重构的效果)
二面10min后收到oc
#秋招##数据分析##滴滴#