【数据分析岗】面试大纲总结(含8大类题型真题)
------正文手动分割线------
本文结构速览:
一、个人信息
二、职业规划
三、项目经历
四、SQL篇
五、AB实验
六、数据分析方法论
七、机器学习
八、开放性问题
一、个人信息
个人信息主要包括
- 基本信息:姓名、地域、学校、专业等
生活习惯:兴趣爱好、生活经历等
个人评价:优缺点、自我评价、他人评价等
常见相关面试题:
- 你是什么样的人?
你对自己的评价是什么?
在别人眼中,你是一个什么样的人?
自我感觉性格怎么样?
实习中最有成就感的事情是什么?
什么时候让你压力很大?
有什么兴趣爱好?
最开心的一件事情?
你觉得自己最大的缺点和优点分别是什么?
对你影响最深的一个人是谁?为什么?
这些面试题大部分出现在HR面。
▼考点:主要是通过个人表达及一些信息碎片,便于评估应聘者的性格、表达能力和抗压能力。
二、职业规划
职业规划这类问题相对比较主观,没有特定的答案。
一般常出现在HR面,高p面也偶尔会有,常见的面试题有:
- 为什么选择本公司本岗位?
为什么选择数据分析岗位?
互联网数据分析在你心中是什么样的职位?
个人职业规划?
求职过程中都有哪些准备和思考?
你都面试了哪些公司,如果有多家offer,你会怎么选择?
为什么要转行(选择)做数据分析师?
期待什么样的工作氛围?
对你面试的岗位,你了解过吗?符合你的预期吗?
三、项目经历
项目经历这一块,可以分为以下三个方面:
- 实习经历
比赛经历
科研经历
▼注意:这里的经历切记一定要和面试岗位相关。
如果相关性不大,也要尽量找出一些和数据挂钩的点进行阐述说明。
针对不同类型的经历,如何做提炼和准备六哥已区别说明 并划了重点(贼贴心了😁)
【实习经历】
优先选取有结果、匹配度高的实习经历。
可以从以下方面进行准备和阐述:
- 项目背景
在这个项目的角色
在这个项目的价值
说明项目的价值,以可量化为准
从这个项目中学到了什么
如要继续优化,可从哪些方面进行尝试
阐述时需重点强调项目的结果/价值
以及突显个人在该项目中不可或缺的贡献。
如果项目失败、未落地、未跟进完也可以说说个人在该项目的思考和沉淀经验~
【比赛经历】
最好是有获奖、有业务背景的相关比赛,比如京东算法大赛。很多互联网大厂都会举办一些比赛项目如果比赛获奖且刚好应聘该公司,这种经历必然非常加分。
比赛项目的阐述可以从下面几个方面来准备:
- 比赛项目背景
比赛结果(获取的名次)
比赛过程中的组员情况及分工情况
比赛所运用的方法及过程中的一些尝试方法
从中收获与思考(作为总结部分)
【科研经历】
同样的,科研经历尽量选取相关性高的项目。如果实在不挂钩,不建议主动进行详细阐述。
除非面试官主动提及并进行深度提问。
科研经历的准备方法如下:
- 项目背景,要解决的问题是什么、目标是什么
项目处理,做了哪些数据处理、使用了哪些数据分析相关的方法
项目结果,比如在**发表,影响因子是**,或者发明了技术专利,或者是提出了新的方法论等等
四、SQL篇
关于SQL,需要掌握SQL常用的语法以及相关大数据技能。
常用的SQL语法如下:
- 查询语句(select)
过滤语句(where)
模糊匹配(like)
合并数据(union)
分组(group by)
链接:LEFT JOIN 、INNER JOIN、RIGHT JOIN、FULL JOIN
表操作(插入、更新、删除等)
窗口函数:累计计算、分组排序、偏移分析窗口函数
日期函数
字符串函数
SQL基础语法的掌握门槛并不高,重点在于如何进行活学活用。如果这部分较为薄弱,还需要自行加强SQL题目的练习。
以下引用【春节不打烊】活动中六哥给出的一道SQL题,可自测下自己的SQL能力题目:现有一张用户关系表,表结构及数据如下:
假设A和B是好友,B和C是好友,C和A不是好友。那么有以下关系:
B是A的一度人脉
C是A的二度人脉
A是B的一度人脉
C是B的一度人脉
B是C的一度人脉
A是C的二度人脉
请计算每个用户的二度人脉数量。输出以下字段:
用户ID
二度人脉数量
【答案】 :如需答案及测试集,课联系六哥进行获取
五、AB实验
互联网对AB的应用和分析越发增强。
AB作为策略评估、ROI评估的黄金准则,在数据分析工作中必不可少。
如何有效设计和评估AB实验非常关键。
作为求职应聘者,对AB相关的知识点掌握越多、越深、越细就越踏实。
AB实验相关的问题可以分为以下几类:
- 随机事件与概率基础
随机变量及分布:正态分布、0-1分布、泊松分布等
大数定理、中心极限定理
假设检验
参数检验
非参检验
AB实验分析流程
AB效果分析
六、数据分析方法论
很多分析方法都较为依赖统计学知识。
因此除了数据分析方法的掌握,基础的统计学知识也必不可少。
之前已梳理了部分数据分析方法
以下罗列了面试中,高频提及的分析方法以及一些相关的常见统计学知识(AB实验相关不做重复罗列):
- 方差分析
描述性分析
相关性分析
参数估计
幸存者偏差
辛普森悖论
RFM分析模型
AARRR模型
SWOT矩阵
MECE分析模型
漏斗分析模型
下钻分析(维度拆分)
七、机器学习
这一块,虽不用像算法岗位准备的面面俱到
但常见的一些传统算法
在实际数据分析工作中也较为常见
故也成为面试常见考点之一
- 线性回归、逻辑回归
决策树
随机森林
GBDT
XGBoost
K-Means
K近邻算法
朴素贝叶斯
神经网络:注意神经网络在数据分析工作中应用并不常见
降维算法
模型评估指标(AUC、MSE、ROC等)
过拟合及处理方法,结合具体算法进行学习和准备
欠拟合及处理方法,结合具体算法进行学习和准备
样本不平衡(重采样、欠采样、样本构造等)
常见的损失函数及差异
▼注意: 尤其是简历中提及的相关算法,务必做好被深挖的准备
八、开放性问题
面试框架梳理篇为大家梳理过开放性题型,主要是以下几大类:
- 异常归因类
AB实验类
专业知识类
估算类
指标体系设计类
软问题类
反问类
了解相关题型后,大家还应该从以下几个角度进行准备:
- 面试前提前了解应聘岗位负责的产品,最好是尽量深入体验一下
结合JD,摘出关键字,进行针对性准备
常见面试题做思路拆解,多多训练不怯场~
#数据分析##学习路径##数据分析师##面经##春招##实习##面试题目#