数据分析师(技术向)校招技术栈

说明:
  • 本篇为数据分析师(技术向)的校招技术栈,都掌握了,加上项目部分和算法部分,去掉运气的部分,大厂是没什么问题的。
  • 个别特别细节的本篇没有覆盖到,比如paper这些

*需要注意的是,数据分析师比较偏非技术岗,很难以技术岗的技术路线这种方式来完全描述描述面试要求。面试除了知识点考察,相当一部分会看软实力。比如,项目的分析思路,行业了解,聪明程度甚至学历学校等等。

数学:

概率与统计:

  • 概率论基础
  • 常见概率分布
  • 贝叶斯公式
  • 假设检验

Hive SQL:

DDL:非常简单,需要掌握但是很少考察
DML:非常简单,需要掌握但是很少考察
DQL:以下操作的语义和实现


  • Distinct
  • 聚合:group by,group by distinct
  • 关联:inner join, left/Right Outer join, full outer join, Cross join
  • 过滤:where
  • 排序:order
  • Window(开窗函数)
  • UDAF和UDTF


Excel:

VlookUp
数据透视表

Python的使用:


  • 使用numpy,pandas,sklearn处理数据
  • 使用pyspark处理数据(加分)


熟悉AB test

了解领域知识:

如果是互联网:


  • ABtest
  • 埋点,离线数据流,前后端


了解数据仓库建模:

数据仓库分层:

ODS,DWD,DWS,ADS

关系建模:

也叫范式建模,了解前三范式

维度建模:

  • 星型建模
  • 雪花建模

实体表,维度表,事实型事实表,周期型事实表
全量表,增量表,拉链表

数据可视化:

需要掌握一个,但是每个公司用的不一样。比如Tableau,PowerBI

 


全部评论

相关推荐

vip牛牛:测试吧,开发现在至少212
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客企业服务