秋招数分/数仓面经
就个人经验分享一下在秋招中的一些菜鸡的面试经验,作为个人总结记录,也希望能够帮助到大家以后的一些面试。
一、数据分析
一般数分的面试分为三场,一面看对简历的剖析以及涉及到的专业知识的掌握程度,二面看对业务的理解能力,三面一般是hr面。主要分享下碰到的问题以及涉及到的知识。
一面
统计:(不是特别记得,因为不太会hhhhhh
1、常见的概率分布,举例子
2、介绍一下正态分布
3、幂律分布
4、置信区间,哪些场景会用到?
5、极大似然估计
6、假设检验介绍
7、中心极限定理
8、大数定律
9、多重共线性
10、线性回归假设
11、显著性相关知识(跟abtest相关的东西都要搞明白
机器学习or Python:(一般针对的是简历中所写到的一些方法,必须了解方法原理、类似方法以及优化方法
1、过拟合,以及如何解决
2、bagging和boosting区别
3、简单介绍一下逻辑回归
4、xgboost与lgb有什么区别
5、数据标准化以及归一化,作用是什么
6、模型评估方法(有被问到过如何用sql算AUC,要懂得计算原理才能更好的写sql
7、python常用包,pandas切片
8、正则化是目标函数的哪一部分,加入正则化的理由是?
9、kmeans的具体过程?为什么用kmeans?是否有了解过优化方法?kmeans和dbscan的区别?(这是因为简历中有提到kmeans
10、怎么用朴素的语言介绍机器学习
11、python中字符的类型
12、缺失值、异常值、数据分箱等
13、特征构建、特征选择
14、独热编码、目标编码
15、介绍下你了解的一些算法
15、简单介绍LSTM,与RNN有什么区别(简历
16、最短路径方法有哪些?那dijkstra能介绍一下吗?(简历,说到啥问啥,坑爹,祸从口出...
问到的机器学习类问题不是特别多,但都比较基础,熟悉一下常见算法的原理和优缺点感觉就够了...吧...
sql:(数分的sql不会问的特别深入,主要问的比较基本
1、sql执行顺序
2、常用的窗口函数/排序函数,说说她们的区别
3、平时用什么优化方法
4、数据库的索引问题(比较浅,简单提一下干嘛用的,有什么类型,每个类型是干嘛的差不多就可以点到为止了...
5、count(1) count(*) count(列名)的区别
6、行转列、列转行(常考,这个必须要记住一种方法,数分一般都是问一问,所以口头上能答出来即可
7、数据库范式(三范式每个举一个例子,这样更好理解,也能让面试官知道你是了解的。常见的就是学号、学院、校长的例子
一面总结:
从自己面试的经验感觉到,一面最重要的是对自己简历的熟悉程度,以及你对简历的梳理是需要符合数据分析师的逻辑的。因为数分其实也有业务向的和技术向的,在面试前需要去仔细看看JD是偏向哪个方向,对于业务向的需要更多的发散自己产品的思维和对指标的感受,更好的去准备简历里的东西,如果是技术向的,就要更多的去复习一下机器学习方面的知识,以及思考机器学习如何为业务赋能。
我的话其实产品感比较弱,量化能力也比较差,感觉这个也不是一时半会能培养出来的hhhh,如果有时间的话,可以多看一下“人人都是产品经理”,去了解下企业的文化、产品,平时也可以多累积累积数据分析师常用的话术啥的。然后一面的话一般都是同事或者之后的直属领导,问的问题不会太刁钻或者太难思考,比较基础,不要太紧张,自信一点,胡诌一下就好啦。
然后我一面挂的也挺多,总结一下有一下一些原因:1)对自己的简历把握不够,没有做额外的延申;2)叙述简历项目时没有加入自己的思考,只是叙述,且无法量化指标(说实话我的实习能做到的都是每个项目中的一小环,如果不加入自己的思考,就会显得经历很单薄,其次数分很看重指标和量化,需要清楚的用一个指标去衡量);3)方向不符合,问的都是好难的机器学习555
二面
AB实验:(很重要,没有尝试过的也不能说不会,要说如果我有机会能这么做的话,我会怎么做...
1、ABtest是什么,什么情况会用到
2、背后的理论支持是什么
3、样本量影响的因素
4、人群是如何圈选的
5、ABtest的流程(一般会问:你如何证明xxx有更好的转化率呢?
因果推断:(我的话只是了解过...但正好近期被问了,就整理一下
1、因果性和相关性
2、因果推断的核心
3、主要方法
4、有没有在数分项目中用到过因果推断(真没有...就随便扯了做的论文...勉勉强强结束这个话题
其他常问:(以下的问题都挺大的,都能出一个模板的那种,大家随便看下...
1、异常排查的流程
2、用户增长模型AARRR(了解下就行吧...然后有时候问问题的时候随便扯一下这个,自我感觉就很厉害hhhhh
3、指标异常分析体系——例如dau下降怎么分析(任何指标下降都有一个模板的,套一下,当然有自己的思考更好
4、对于反馈的问题,你会如何定量化的指标?如何做验证?
5、渠道质量分析(这太难了,我每次都被问懵,而且还是不知道怎么回答,有了解的xdm拜托能不能教教我...
6、活动效果评估
7、如何找到影响y的多个x
8、留存率下降,判断是否是水军的原因
9、辛普森悖论(笔试还挺常见
10、费米问题(考拆解问题能力,经常被问,经常拆不来。这个的话感觉面试官是期待你问他xxx数据是怎么样的
11、归因分析(了解下就行
12、搭建指标体系(这个很重要,但我不会...
二面总结:
二面都是看运气:( 很常见的就是会给你出场景题,问你怎么看啊,会怎么解决啊,具体怎么做啊balabala的。要去了解的业务知识太多了,二面上面我也没有特别多的经验可以聊,因为我都不太会5555
三面
1、职业规划(必须清晰,论点、论时间段
2、评价你的实习经历(特别如果是两段互联网的,他会问你有什么异同点
3、对我们公司有什么了解吗
4、实习或学习中遇到过什么困难,是如何解决的(突出一下自己的能力
5、你的优势和劣势(各准备三点,劣势不能和岗位起冲突哈,瞎吹自己一下
6、平时喜欢做什么(哇,这个简直,经常被问,不能说的太休闲哈,凸显自己爱学习、爱运动等等等
7、你理解的数据分析是什么样的
8、实习的高光点/比较有成就的事情
9、你能给公司带来什么?
10、你的offer情况
三面总结:
就是和hr聊聊天,一次性准备好之后都不用怎么再准备hr面了,之前的两面都需要反复的去更新自己的手稿。hr面就,随便聊,立一个和自己比较相符的人设,这样又诚实又能爱岗敬业。
写面经好久哦,感恩在秋招中看到的其他大佬辛苦些的面经了,教会了我很多。今天有空先写了数分的,有啥其他记起来的再更新。