23届秋招面经 字节跳动-Data-电商 数据科学

字节跳动提前批:data-电商 数据科学

一面,部门成员:~50min

1.   自我介绍

2.   机器学习

a) XGBoost:损失函数推导、特征重要性的计算方法

b) 为什么用SHAP计算特征重要性,不用XGBoost自带的方法(实习项目)

3.   AB test

a)   对于不同类型的指标,分别要怎么做统计检验

b)   用非参数方法检验偏态分布的指标,统计功效较低,有什么其他方法

c)   对于CTR、CVR这类比值指标,应该怎么检验

4.   因果推断

a)   介绍Double ML项目:项目背景 & 建模流程;对比其他方法,DML的优劣势

b)   介绍Uplift项目:模型选择 & 建模流程;uplift的评估指标(追问:AUUC和AUC的异同)

c)   场景题:要测算“用户是否下载快手”对“抖音使用时长”的影响,应该怎么设计方案?

5.   概率题

a)   一枚均质硬币,抛到正面停下,抛到反面继续抛;抛硬币的期望次数是?

6.  业务题

a)   抖音的创作者投稿率在短期内大幅下跌,怎么做异动分析?

7.   反问

 

二面,部门leader:~80min 

1.   自我介绍

2.   因果推断

a)   营销投放的高价值用户挖掘(Uplift)

        i. 项目背景 & 建模目的(ITE or sub-group HTE)& 建模流程;

        ii. 建模前如何选取用户特征:指标体系的搭建、指标选取有什么禁忌;

       iii. 依据统计显著性判断重要特征,有什么风险点?如何识别、解决这些风险点?

        iv. 针对统计显著的特征,如何根据特征重要性排序、筛选,形成业务策略?

        v.  是否对比过不同形式的uplift模型的效果?结果不一致如何取舍?

b) 基于观察数据的因果推断项目(Double ML)

        i.  项目背景 & 建模流程

        ii. 除了DML,是否尝试过其他因果推断的方法?不同方法的结果一致吗,为什么选择采纳DML的结果?

      iii. DML框架本身有什么风险点,如何识别、解决?

        iv. 建模得出的结论符合业务逻辑吗,有什么业务侧的解释?

        v. 如果把这个项目设计成AB test,怎么设计实验方案?

3.   AB test

a)   对于不同类型的指标,分别要怎么做统计检验?

b)   指标方差太大,检验不显著,有什么解决方法?

4.   概率(思维)题:

a)   三个药瓶,里面的药可能是每颗1g/2g/3g。只称重一次,如何得知三个瓶子中药的重量分别是多少?

b)   贝叶斯: P(明天是晴天|三个信息源都说明天是晴天)

5.   反问

 

三面,隔壁部门leader:~70min

1.   自我介绍

2.   因果推断

a)   细挖Uplift项目:项目背景、模型选择、建模流程、评估指标…

b)   对ITE/HTE的理解

c)   匹配方法:CEM/PSM建模流程、对con-founders的理解、平衡性检验怎么做?

d)   针对平衡性检验追问:为什么偏态分布的指标不能用t-test?

3.   业务题

a)   抖音的DAU出现异常波动,怎么做异动分析?

4.   机器学习

a)   如何基于历史数据,预测60天后的DAU?

b)   假设能获取所有用户数据,如何基于个体预测的方法,建立模型?其中可能有什么卡点,如何解决?

  • 纯预测 or 兼顾解释性:深度学习(RNN, attention...)VS. 传统统计模型(ARIMA等时序模型)
  • 卡点:不同生命周期的用户,时序长度不一致 -> 一般用padding,但个人认为不靠谱

c)   面试官解密时刻:如何解决时序长度不一致的问题?

5.   反问

#字节跳动##数据科学##面经#
全部评论
同是数分,大佬好强!
点赞 回复 分享
发布于 2022-10-17 19:00 湖北
老哥 你这是实习吗
点赞 回复 分享
发布于 2022-10-24 17:52 上海
公式推导是口述嘛
点赞 回复 分享
发布于 2023-09-15 09:56 陕西
好难的题
点赞 回复 分享
发布于 2023-09-23 18:35 安徽
请问大佬最后去了么
点赞 回复 分享
发布于 09-10 22:28 上海

相关推荐

11-07 14:22
已编辑
华南师范大学 Unity3D客户端
不知道是敏感词检测还是字数限制,时间线的帖子无法编辑添加这段文字,把新的感想丢这个新帖了*负能量警告⚠️*11.6后已无流程在跑整场春秋招下来,属于比上不足比下有余的情况。面试机会其实拿的也不少,鹅猪米除了米都有机会面。但是每次问基础问题总回答的不算完美,容易漏点。深入的又不会。面试机会感觉更多是末2帮忙过了个筛,其实很多双非牛油都比我沉淀的要好多了。口语表达能力确实需要锻炼,明明会的的东西答不好,太吃亏了。天天网络冲浪,话都不会说了。深入的则是没有沉淀,如果拿科韵路小厂实习换成沉淀技术感觉会更好,虾皮的面试官也直说了这个实习带来的效益太低,还是游戏人懂游戏人,一眼看穿😭当时5月也有其他同学拿了鹅实习,如果再坚持下说不定有神秘事件。这个小厂实习,真的磨灭太多游戏开发热情了不如当做一个爱好,去干点其他方面的工作,正如牛油们说的别把爱好当做工作*你只是爱打游戏,不是会做游戏*小时候到高中这段时间的梦想是当飞行员,但是刚好遇到地球online全服事件导致缩招了,hc锐减。高中时体检也很顺利能够进入最终battle。然后就见识了人生的第一次泡池子,也收到了人生第一封感谢信。(其他没过都是现场赶走的)如果这个hc人数还是上一年那么多,感觉能留下来。好像最后剩50个留40个,上一年是200个hc,唉海投的时候看到个南航的宣传贴,提交了一个工程岗位申请后,我看到了那个“申请飞行员”的选项*还能追梦毕改飞吗?*我现在也不行,身体已经没那时那么好了整个4年从南航的感谢信开始,基本就不断收感谢信。从第一封感谢信开始浑浑噩噩地过了大学生活,计算机也是随大流选的,进来发现好多oi爷或者自学爷。对时势的认识不清,没啥技术大一大二乱投实习,结局当然是看都懒得看,唯一拿到一次线下面试也是kpi,一看是大二的做不了太久。而且技术方面沉淀的也不好,早期思维跟着学校的吹水一起幻想时间了,以为学校教的管够。25届21入学,在当时之前的数据应该和牛客上早年的数据还挺好看,认识个学长说自己一堆挂科啥都不会照样进个中厂。求职后发现,好多9爷研爷,还有沉淀高手,难以战胜,也看到了好多佬的不顺利经历。打不过佬们也正常,即使莫名打过了也不开心,我想的是大疪天下寒士俱欢颜😭,比我努力的更应该获得回报。大家就不能都有好东西吃吗?*梦碎总是贯穿始终,我真不想跑了*与咖喱人交流时曾提出不考研不考公,誓要出来打工稳食,现在连新手关卡都过不了,纯纯的five总的来说还是技术沉淀不到位,我太弱了,什么都做不到.jpg #秋招总结#  #25届秋招总结#
投递完美世界等公司10个岗位 25届秋招总结
点赞 评论 收藏
分享
投票
电科 销售管培生 年包16到22 本科二本, 硕士双非
点赞 评论 收藏
分享
27 164 评论
分享
牛客网
牛客企业服务