字节跳动数据分析面经(已oc)
第一次投游戏业务朝夕光年,二面挂,被抖音部门捞起来,三面挂。
–––––––––朝夕光年–––––––––
8.11游戏一面
问了实习和游戏的经历,实习问的比较细,实习里的业务指标的定义也会被问到。后半场全是游戏业务问题,问了我王者荣耀为什么那么受欢迎,这题答得不太好。
8.13游戏二面
问了项目和比赛,但问的不是很深,把流程叙述一遍就好了,有问到项目原始数据的选取。介绍一款游戏,然后问如果这个游戏推进一个活动,哪些指标可以衡量活动好坏。游戏里氪金的方式有哪些。游戏如何维持各氪金程度用户继续氪金。除了最后一个问题,觉得大体都答出来了,但还是收到感谢信。
复盘一下,游戏业务挂的原因可能是我对游戏了解太少了,业务理解比较浅,回答没有亮点。
––––––抖音/抖音火山版/直播––––
8.19一面
感觉碰上技术大牛,项目会挖的很深,问了项目里用的交叉熵函数,没答上来。问了一些统计知识,像是相关系数,p值含义等,问了数据清洗,zscore和最大最小值法的区别,以及他们的应用场景,还有召回率的应用场景。写了道SQL,找出工资top10的员工,这里order by默认升序我记反了。最后反问,我提到业务问题,面试官让我说一下竞品分析,也就是抖音和快手的区别。面试官又问了一个全屏沉浸式瀑布流和分栏式瀑布流对社区(?这里记不清了)和日活的影响。
一面完以为凉了,结果还是收到了二面。
8.21二面
二面问了业务问题,哪些指标可以衡量抖音推荐
算法是否准确。答了完播率,转赞评率,平均使用时长等,面试官接着让我从里面挑一个核心的指标。接着出了SQL题,问了开窗函数,连续登录2.3.5天以上的用户ID,多表链接问题,但我只答出登录连续两天以上的问题。然后面试官出了一道智力题,25只乌龟,5个赛道,找出速度top3的乌龟,至少需要几轮,这题做出来了,7轮。
二面面试体验最好,在回答业务问题时,面试官会和你探究,交流,出现错误的地方他也会暗示你,整个人很亲切。
8.24三面(2小时.......)
三面可以用魔鬼来形容,我太菜了,已经跪了。
面试官上来怼了我的项目,认为bp神经网络预测股票不该用交叉熵函数。接着手推算法,我选了线性回归.....我想从一元推起,然后推广到多元,面试官直接让我推多元,推到dl/dai=0就推不动了,又被怼了一波基本功。接着让我分析一个case,case背景是陌陌换了匹配算法,要做abtest,这里我用的是匹配之后的搭讪率,我提到统计变量是转化率用卡方检验,被追问为什么,没答上来。又问了样本量分配的问题,列了一波公式,勉强过关,接着被问小样本做实验可能出现的问题,没答上来。(答案:小样本可能会存在多次重复匹配同一个人的现象),对了还问了辛普森悖论,以及如何避免这种现象。
接着最魔鬼的部分来了,手撕SQL,第一道题不难,做出来了,但是面试官觉得我的SQL执行起算来效率不高还占内存,让我换种方法写,没写出来....第二道SQL,题意比较复杂,我第一次理解错题意了,写错了,第二次改还是不对....然后没有反问环节,面试就结束了....
面试时,Sql题是口述的,我凭回忆整理列下面
补充一下,求和是指求整张表里这些数的分组总和..题意比较绕人,例如
uid1 uid2 value
1 2 2
2 3 2
1 4 3
1 2 4
给定值为1,2和4都和1同行,对2进行求总和:2+2+4(第一行,第二行,第四行的value值),对4求总和:3(第三行),到现在还是没写出来,欢迎大家讨论
–––––––––––––––––––––
自己项目细节确实没弄清楚,唉....一开始挺难受的,现在已经想开了,不纠结字节了,大不了去小公司,下面的好好准备。面经发出来供大家参考,顺便攒一波人品,大家加油!
–––––––––––9.16更新––––––––
三面回答的很不好,一度以为凉了...但没收到感谢信,打电话问了HR,HR说三面过了,接着就是漫长的审批环节.....8.24终面,9.15等到意向书……太不容易了.....最后,表白我的对接HR小姐姐,负责耐心又温柔!祝愿大家早日上岸,都会收到喜欢的offer的!!#面经##字节跳动##数据分析工程师##实习#
–––––––––朝夕光年–––––––––
8.11游戏一面
问了实习和游戏的经历,实习问的比较细,实习里的业务指标的定义也会被问到。后半场全是游戏业务问题,问了我王者荣耀为什么那么受欢迎,这题答得不太好。
8.13游戏二面
问了项目和比赛,但问的不是很深,把流程叙述一遍就好了,有问到项目原始数据的选取。介绍一款游戏,然后问如果这个游戏推进一个活动,哪些指标可以衡量活动好坏。游戏里氪金的方式有哪些。游戏如何维持各氪金程度用户继续氪金。除了最后一个问题,觉得大体都答出来了,但还是收到感谢信。
复盘一下,游戏业务挂的原因可能是我对游戏了解太少了,业务理解比较浅,回答没有亮点。
––––––抖音/抖音火山版/直播––––
8.19一面
感觉碰上技术大牛,项目会挖的很深,问了项目里用的交叉熵函数,没答上来。问了一些统计知识,像是相关系数,p值含义等,问了数据清洗,zscore和最大最小值法的区别,以及他们的应用场景,还有召回率的应用场景。写了道SQL,找出工资top10的员工,这里order by默认升序我记反了。最后反问,我提到业务问题,面试官让我说一下竞品分析,也就是抖音和快手的区别。面试官又问了一个全屏沉浸式瀑布流和分栏式瀑布流对社区(?这里记不清了)和日活的影响。
一面完以为凉了,结果还是收到了二面。
8.21二面
二面问了业务问题,哪些指标可以衡量抖音推荐
算法是否准确。答了完播率,转赞评率,平均使用时长等,面试官接着让我从里面挑一个核心的指标。接着出了SQL题,问了开窗函数,连续登录2.3.5天以上的用户ID,多表链接问题,但我只答出登录连续两天以上的问题。然后面试官出了一道智力题,25只乌龟,5个赛道,找出速度top3的乌龟,至少需要几轮,这题做出来了,7轮。
二面面试体验最好,在回答业务问题时,面试官会和你探究,交流,出现错误的地方他也会暗示你,整个人很亲切。
8.24三面(2小时.......)
三面可以用魔鬼来形容,我太菜了,已经跪了。
面试官上来怼了我的项目,认为bp神经网络预测股票不该用交叉熵函数。接着手推算法,我选了线性回归.....我想从一元推起,然后推广到多元,面试官直接让我推多元,推到dl/dai=0就推不动了,又被怼了一波基本功。接着让我分析一个case,case背景是陌陌换了匹配算法,要做abtest,这里我用的是匹配之后的搭讪率,我提到统计变量是转化率用卡方检验,被追问为什么,没答上来。又问了样本量分配的问题,列了一波公式,勉强过关,接着被问小样本做实验可能出现的问题,没答上来。(答案:小样本可能会存在多次重复匹配同一个人的现象),对了还问了辛普森悖论,以及如何避免这种现象。
接着最魔鬼的部分来了,手撕SQL,第一道题不难,做出来了,但是面试官觉得我的SQL执行起算来效率不高还占内存,让我换种方法写,没写出来....第二道SQL,题意比较复杂,我第一次理解错题意了,写错了,第二次改还是不对....然后没有反问环节,面试就结束了....
面试时,Sql题是口述的,我凭回忆整理列下面
补充一下,求和是指求整张表里这些数的分组总和..题意比较绕人,例如
uid1 uid2 value
1 2 2
2 3 2
1 4 3
1 2 4
给定值为1,2和4都和1同行,对2进行求总和:2+2+4(第一行,第二行,第四行的value值),对4求总和:3(第三行),到现在还是没写出来,欢迎大家讨论
–––––––––––––––––––––
自己项目细节确实没弄清楚,唉....一开始挺难受的,现在已经想开了,不纠结字节了,大不了去小公司,下面的好好准备。面经发出来供大家参考,顺便攒一波人品,大家加油!
–––––––––––9.16更新––––––––
三面回答的很不好,一度以为凉了...但没收到感谢信,打电话问了HR,HR说三面过了,接着就是漫长的审批环节.....8.24终面,9.15等到意向书……太不容易了.....最后,表白我的对接HR小姐姐,负责耐心又温柔!祝愿大家早日上岸,都会收到喜欢的offer的!!#面经##字节跳动##数据分析工程师##实习#