数据分析师(技术向)校招技术栈
说明:
- 本篇为数据分析师(技术向)的校招技术栈,都掌握了,加上项目部分和算法部分,去掉运气的部分,大厂是没什么问题的。
- 个别特别细节的本篇没有覆盖到,比如paper这些
*需要注意的是,数据分析师比较偏非技术岗,很难以技术岗的技术路线这种方式来完全描述描述面试要求。面试除了知识点考察,相当一部分会看软实力。比如,项目的分析思路,行业了解,聪明程度甚至学历学校等等。
数学:
概率与统计:
- 概率论基础
- 常见概率分布
- 贝叶斯公式
- 假设检验
Hive SQL:
DDL:非常简单,需要掌握但是很少考察
DML:非常简单,需要掌握但是很少考察
DQL:以下操作的语义和实现
- Distinct
- 聚合:group by,group by distinct
- 关联:inner join, left/Right Outer join, full outer join, Cross join
- 过滤:where
- 排序:order
- Window(开窗函数)
- UDAF和UDTF
Excel:
VlookUp
数据透视表
Python的使用:
- 使用numpy,pandas,sklearn处理数据
- 使用pyspark处理数据(加分)
熟悉AB test
了解领域知识:
如果是互联网:
- ABtest
- 埋点,离线数据流,前后端
了解数据仓库建模:
数据仓库分层:
ODS,DWD,DWS,ADS
关系建模:
也叫范式建模,了解前三范式
维度建模:
- 星型建模
- 雪花建模
实体表,维度表,事实型事实表,周期型事实表
全量表,增量表,拉链表
数据可视化:
需要掌握一个,但是每个公司用的不一样。比如Tableau,PowerBI