2023届校招面经:猿辅导-数据分析师
TimeLine:一面20220820,二面20220827(已挂)
BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师
笔试
涉及统计学、概率论、机器学习、SQL等方面的知识,详情可在牛客网上搜索“猿辅导数据分析笔试”获取更多信息
一面
1. SQL题,口述解法即可
课程信息表lesson_order,字段:学科 subject, 用户id userid, 订单id orderid, 订单价格 price, 支付时间戳 paidtime, 课程规格 season_type
问题1:各学科每个月新增用户量,输出字段:月份、学科、新增付费用户量
with a as ( select userid, min(paidtime) as paidtime, max(subject) as subject from lesson_order group by userid ), b as ( select userid, subject, month(paidtime) as paidmonth from a ) select paidmonth, subject, count(userid) as new_users from b group by paidmonth, subject
问题2:输出用户各学科累计付费达到2000元的时间,输出字段:用户id、学科、累计消费达到2000元的日期
with a as ( select userid, subject, paidtime, sum(price) over(partition by userid, subject order by paidtime asc) as pricesum from lesson_order group by userid, subject ) select userid, subject, min(paidtime) from a where pricesum > 2000 group by userid, subject
2. 简述在字节实习的基本工作内容
AB实验的观测和回收,业务方的取数需求和数据看板搭建需求,研究方向的专题研究
3. 结合字节的数据分析师实习经历,介绍一下AB实验的具体流程
- 实验开始前,需要和RD确认需要重点关注的指标组,确保involve对应的分析师以防指标组没数据
- 实验进行时,提醒RD逐次放量,关注相应的性能指标和业务指标的变化是否在预期之内,出现意料之外情况时及时归因
- 实验回收时,确认实验指标表现是否符合预期,如有业务收益做好原理闭环,出具报告作为上线依据
4. 在观测AB实验时,如果发现实验组关注指标不显著该怎么办?
关注业务指标如果有显著正向预期却没有显著,首先应确认该实验对应的性能指标是否有显著收益,如果性能指标没有显著收益,那么也就不能做到原理闭环,拆分维度观察性能指标进行归因,将结果告知RD;如果性能指标存在显著收益,则观察关注业务指标的走势,走势正常可周知RD进行放量,如果走势不符合预期则检查是否存在组前差异
5. 场景题:斑马业务线获客的主要手段是通过引导用户购买两周的体验课程,之后由销售人员借入,引流到正式课程的购买,近期发现转化率下降了,如何分析?
外部原因,可能有竞对(对于猿辅导而言基本上没有)、政策(如双减、疫情防控等),也可以套PEST 内部原因,结合主观反馈和客观数据:
- 用户对课程有主观上的认知,他们会反馈课程存在的不足
- 客观数据方面,从年龄、性别、职业、城市等用户画像角度和课程分类等课程属性进行拆分
6. 现有一推送策略,斑马业务线会在app上通知家长参加课程线上宣讲会,如何评价这一策略的效果?
定义关键指标为用户转化率、留存和日活等进行AB实验评估策略效果
7. 针对问题Ⅵ进行追问:因资源有限无法做AB实验,直接全量,如何从事后的角度来评估策略的效果?
思路是对比参加宣讲会家长的转化率和不参加宣讲会家长的转化率差异,可以采用PSM的方法从未参加宣讲会中的家长筛选出一批和参加宣讲会用户特征相似的群体,再与参加宣讲会的家长进行比较
二面
1. 现有老用户裂变带动新用户的活动,如何评估这一活动的效果?
思路1:该活动本身是一个转化漏斗,各阶段有相应的评估指标:
- 将这一活动信息告知老用户(新用户获取):推送、触达的渗透率
- 新用户激活:点击、下载、注册的转化率
- 新用户留存:留存率、活跃天数
- 新用户变现:付费率、人均付费金额
- 新用户自传播:app推荐渗透率、人均推荐次数
思路2:从ROI的角度进行评估
- 投入:活动宣发、礼品兑换、项目开发成本
- 收益:用户的付费
2. 如何评估疫情对课程续订率的影响?
考虑双重差分模型DID,模型细节参见【计量分析系列】双重差分模型(DID)——政策效应评估的Stata实现
例如上海是受疫情影响的城市,假设北京是和上海体量类似的城市,除疫情和时间外没有其他的影响因素。上海的课程续订率同时受到疫情和时间因素的影响,北京的课程续订率仅受到时间因素的影响,将两者做差分即可得到疫情对课程续订率的影响
3. 如果针对比率类型的变量做假设检验,使用的统计量是?
不确定,敬请读者批评指正
#猿辅导校招##数据分析师面经##数据人的面试交流地##秋招##校招#