23届秋招面经 字节跳动-Data-电商 数据科学
字节跳动提前批:data-电商 数据科学
一面,部门成员:~50min
1. 自我介绍
2. 机器学习
a) XGBoost:损失函数推导、特征重要性的计算方法
b) 为什么用SHAP计算特征重要性,不用XGBoost自带的方法(实习项目)
3. AB test
a) 对于不同类型的指标,分别要怎么做统计检验
b) 用非参数方法检验偏态分布的指标,统计功效较低,有什么其他方法
c) 对于CTR、CVR这类比值指标,应该怎么检验
4. 因果推断
a) 介绍Double ML项目:项目背景 & 建模流程;对比其他方法,DML的优劣势
b) 介绍Uplift项目:模型选择 & 建模流程;uplift的评估指标(追问:AUUC和AUC的异同)
c) 场景题:要测算“用户是否下载快手”对“抖音使用时长”的影响,应该怎么设计方案?
5. 概率题
a) 一枚均质硬币,抛到正面停下,抛到反面继续抛;抛硬币的期望次数是?
6. 业务题
a) 抖音的创作者投稿率在短期内大幅下跌,怎么做异动分析?
7. 反问
二面,部门leader:~80min
1. 自我介绍
2. 因果推断
a) 营销投放的高价值用户挖掘(Uplift)
i. 项目背景 & 建模目的(ITE or sub-group HTE)& 建模流程;
ii. 建模前如何选取用户特征:指标体系的搭建、指标选取有什么禁忌;
iii. 依据统计显著性判断重要特征,有什么风险点?如何识别、解决这些风险点?
iv. 针对统计显著的特征,如何根据特征重要性排序、筛选,形成业务策略?
v. 是否对比过不同形式的uplift模型的效果?结果不一致如何取舍?
b) 基于观察数据的因果推断项目(Double ML)
i. 项目背景 & 建模流程
ii. 除了DML,是否尝试过其他因果推断的方法?不同方法的结果一致吗,为什么选择采纳DML的结果?
iii. DML框架本身有什么风险点,如何识别、解决?
iv. 建模得出的结论符合业务逻辑吗,有什么业务侧的解释?
v. 如果把这个项目设计成AB test,怎么设计实验方案?
3. AB test
a) 对于不同类型的指标,分别要怎么做统计检验?
b) 指标方差太大,检验不显著,有什么解决方法?
4. 概率(思维)题:
a) 三个药瓶,里面的药可能是每颗1g/2g/3g。只称重一次,如何得知三个瓶子中药的重量分别是多少?
b) 贝叶斯: P(明天是晴天|三个信息源都说明天是晴天)
5. 反问
三面,隔壁部门leader:~70min
1. 自我介绍
2. 因果推断
a) 细挖Uplift项目:项目背景、模型选择、建模流程、评估指标…
b) 对ITE/HTE的理解
c) 匹配方法:CEM/PSM建模流程、对con-founders的理解、平衡性检验怎么做?
d) 针对平衡性检验追问:为什么偏态分布的指标不能用t-test?
3. 业务题
a) 抖音的DAU出现异常波动,怎么做异动分析?
4. 机器学习
a) 如何基于历史数据,预测60天后的DAU?
b) 假设能获取所有用户数据,如何基于个体预测的方法,建立模型?其中可能有什么卡点,如何解决?
- 纯预测 or 兼顾解释性:深度学习(RNN, attention...)VS. 传统统计模型(ARIMA等时序模型)
- 卡点:不同生命周期的用户,时序长度不一致 -> 一般用padding,但个人认为不靠谱
c) 面试官解密时刻:如何解决时序长度不一致的问题?