▫️Timeline:3.13投递 - 3.15完成综合考试 - 3.27请求转到第二志愿 - 4.11一面 - 4.21二面 - 4.25HR面+英语测评 - 4.26收offer▫️bg:美本专业对口,一段相关实习,两个项目(1机器学习风控,1数分rfm)▫️一面(~45mins)- 职业学业规划- 回国时间&到岗时间&实习时长- 自我介绍- 介绍实习内容- 实习怎么搭建指标体系- 实习遇到的困难- 实习做的case案例- 介绍项目- 如何处理缺失值- 如何处理类别不平衡问题- 怎么发现和处理异常值- 特征工程做了哪些- 特征编码和特征交互怎么做的- 说说PCA- 全部都是自己写的代码吗- 讲讲RFM模型,怎么分类- SQL两个问题,基本考察时间戳,groupby和窗口函数用法,这两个问题用pandas df怎么做- 介绍rank,row_number,dense_rank- 反问▫️二面(~30mins)- 自我介绍- 介绍一个对个人成长最大帮助的项目- 特征编码怎么做的- 特征分箱用了什么方法,变量数据分布怎么样,为什么用这个方法- 只用了woe编码吗- 为什么不把全部交互后的特征扔进XGBoost,用PCA为什么不怕去掉的成分会影响最后test的评估指标- 用本机跑的项目吗- 项目评估指标是什么?公式怎么计算?- ROC的AUC横轴纵轴都是什么?- TPR和FPR的公式- 了解LightGBM吗(不了解)- 讲讲CLV怎么算的,指出我的错误计算方法偏好老客运营,RFM会把新客分到低价值的客户群体- pandas上怎么找每行的max,min和avg- axis=0或1的意义- 反问▫️HR面(~20 mins)- 到岗时间&实习时长&回国时间- 倾向城市- 有上海落户打算吗- 职业规划,想做什么方面的工作- 投了其他什么公司- 商量入职时间- 介绍offer,包括薪资、工作时长、补贴等- 反问