字节-中台数据分析-一面、二面凉经
本人两年机器学习工作经历,社招
2021.8.30 一面
1. 自我介绍3min
2. 仔细描述一下自我介绍中提到的项目
追问:
- 特征都包括什么特征,都有哪些维度,怎么选特征的,怎么确定哪些指标是有效的
- 介绍一下XGB和RF,说说不同点
3. 你平常用什么APP(微信小红书抖音),那我们来聊聊小红书吧
- 有什么优缺点(答优点推荐做的好,缺点对于关注的用户没有分类,比较难从关注的用户里找到想要的信息)
- 你觉得小红书对于商品的评价和淘宝对商品的评价有什么区别,答淘宝比较中肯,小红书侧重好评,追问:还有吗,答淘宝是短评,小红书更为深入和全面
- 你刚刚提到小红书推荐做的比较好,那如果让你评估推荐做得怎么样,你会怎么分析(可以想1-2分钟之后作答)
- 你刚刚提到点击率和浏览时长,还有什么指标可以衡量推荐好坏(答不出来),那如果推荐分为3块,用户发起请求,服务端接受请求调用算法,算法结果展示给用户,除了用户历史行为特征和推文本身的内容和特征(之前讲的时候我有提到),你觉得每一块哪一些其他的因素会影响推荐效率(继续答不出来),面试官说那比如发起请求时会遇到网络问题,可能会影响推荐效率,还有吗(仍然答不出来,关于推荐指标这里纠结了20min,我实在是想不出,求大神们赐教)
- 你觉得用户历史喜欢的东西是会一成不变的吗,答不会,追问:那这个就是时效性,你觉得模型设计的时候要怎么考虑这个时效性
- 你觉得推荐的时候如果除了用户喜欢的内容之外,同时也推送一些其他品类的内容,会不会好,我说应该是会好的,但是要关注喜欢的内容和不喜欢内容的推送比例,面试官追问,那如果让你设计一个实验确定哪个比例会更好,怎么设计(答多实验AB测试),讲一下设计这个实验的流程
4. 反问
2021.9.1 二面凉经
1. 直接介绍一个你做过的项目(跳过自我介绍,还有点蒙)
2. 项目深挖:
- 具体讲讲特征挖掘怎么做的(答通过和业务沟通拆解产品细节,确定特定场景和可能的阈值,每个阈值下的特征数据都会和模型目标做关联性分析,最终确定效果)
- 除了业务沟通还能怎么做(答暂时没有想出来,因为模型追求可解释,所以对于业务来讲关注的指标希望是可拆解可管控的指标,所以没有使用特征交叉的方式进行特征融合,这样会失去解释性)
- 那听你描述下来除了和业务沟通还是和业务沟通,暂时没有别的想法了是吗(我人傻了,答确实没有,面试官无奈笑笑)
3. 你平常都常用什么app(微信淘宝小红书抖音)那讲讲小红书吧
- 你之前的工作经历中你觉得有什么可以用在小红书上的(答研究生毕业设计做的推荐系统,觉得推荐多样性可以引入到小红书当中)
- 具体怎么融入多样性这个指标,答在算法目标设计的时候融入推荐列表中各品类的比例加权平均
- 怎么评价引入多样性之后的效果,答可以通过AB测试验证因果关系
- 为什么会AB测试可以验证因果关系
- 那你细致讲讲具体怎么样去设计这个AB测试的
- 具体怎么计算多样性呢,有什么公式(一开始还想不出来一直讲和业务沟通,最后面试官说:你讲了这么多我还是不知道你到底要怎么算,然后我说可以通过看比例去计算余弦相似度,问余弦相似度靠谱吗,答不确定但是想不出来别的了,面试官开始第二次冷笑,从此觉得自己凉了)
- 从产品设计的角度来说怎么引入这个多样性,这个多样性的设计会应用所有人吗还是只是部分人
- 你刚刚提到弹窗,你觉得这个弹窗应该在什么时间点出现
- 你觉得弹窗应该长什么样,怎么设计
- 比如小红书有30多个品类,你怎么确定推哪些品类给用户
4. 职业规划
5. 反问
两面下来个人感觉,字节的对于数据分析岗位的理解更偏向于产品,面下来几乎全部都是业务问题,case分析,会深挖的很细,要求产品sense很强(对于本人算法经验的人来说太不友好了),如果大佬们有什么case interview的面试经验和答题套路求分享求分享!