我的数据分析校招经历复盘(下):数据分析知识体系与校招时间线
本养成计划一共分两个部分,第一部分会整理数据分析的知识体系,我们来聊聊一下近些年大火的"数据分析能力"到底指包含哪些知识点。第二部分会讲在校招前和在校招过程中需要做的准备和大致时间线,这一部分会有比较强的普适性,适用于大部分的校招岗位。
首先是第一部分:数据分析知识体系整理
如果你百度"数据分析知识体系",会看到各种五花八门的整理,但是不同整理的内容与方向会差非常多,那是因为"数据分析"其实是一个非常宽泛的概念,想要满足JD中"拥有一定的数据分析能力"与想要成为专职的"数据分析师"所需要掌握的知识是不同的;不同方向,不同领域的数据分析师,要点的技能树也是不同的。但是在五花八门的技能树里,是有一些交集的。我会从这些交集入手,按需求将知识体系进行拆解。
首先是数据分析通用能力,也就是说不管你是想要拥有"一定的数据分析能力",还是要成为某个领域内的"数据分析师",都需要点上的技能点。
1:统计学
数据分析核心理论基础之一,不管哪个领域都需要用到。
具体知识点:
-
统计学两大基础定理:大数定理,中心极限定理
-
常见分布的图像,性质与应用(ex. 正态分布,泊松分布。。。)
-
假设检验 & AB测试全流程(统计学在数据分析领域中的重中之重!!)
-
条件概率 & 贝叶斯公式
-
排列组合(虽然是高中知识但是大厂笔试特别喜欢考这个)
-
常用统计软件的使用(ex. SAS, SPASS etc.)
推荐学习资料:
-
浙大版《概率论与数理统计》
2:SQL(结构化查询语言)
数据分析最重要的工具之一(也许没有之一),以致于很多基层数据分析师被称为SQLBOY & SQLGIRL。
具体知识点:
-
SQL基本语法与执行顺序
-
窗口函数
-
SQL常用技巧(如自连接,子查询等)
推荐学习资料:
零基础入门
-
《SQL必知必会》(SQL金牌工具书)
-
Datacamp SQL教程(从零开始手把手教+练)
有了一定基础后就是刷题啦
-
Leetcode
-
牛客网SQL专项
刷题的难度与数量可以根据个人需求自行调整,如果想要获得"一定的数据分析能力"的话,刷完简单和中等,能独立在数据库完成基本的"增删改查"操作就已经是一项非常加分的技能了。但对于专职数据分析师来说,光会是不够的,必须要做到非常熟练(字节面试曾让我五分钟之内写完两道SQL题,第二题还需要用多种方法),所以,刷题吧骚年!
3:Excel
Excel作为一个老牌数据分析工具,因为比较容易上手经常处于数据分析工具鄙视链的底端,但是一个工具好上手不代表上限低,也不代表功能性逊于那些复杂的工具,在对少量数据做简易处理时,Excel依旧是首选(按两下按钮可不比写一大串代码方便吗XD)
具体知识点:
-
各种常用函数(VLOOKUP,SUMIF等)与快捷键
-
数据透视表
-
数据可视化(各种图)
推荐资料
-
《Excel图表之道》
4:Tabelau & Power BI
众所周知,Excel画图虽然方便,但是丑(笑),而且不太好画复杂的图,Tabelau,Power BI这种专业的数据可视化软件完美的填补了这个缺陷,助你画出高逼格的图。这块内容面试很少问所以我就不总结知识点了,资料直接看软件官方教程就可以~
5:业务
数据分析人才和提数工具人最大的区别,就是懂不懂业务————尼古拉斯·小狈
数据分析要面对的从来都不止是数据,单纯的SQLBOY & SQLGIRL是很容易被取代的,所以培养业务思维是一个合格数据分析师的必修课,毕竟只有符合业务实际的数据分析才是有意义的数据分析。当然啦,一般公司不会苛求还在读书的学生在面试的那几分钟内想出完全切实可行的方案,但是校招生需要向面试官展示自己清晰的逻辑来证明自己是一块"可塑之才"。(我在面试某生鲜平台时,拿到的却是一道珠宝行业的业务题,说明面试官并不care我对生鲜领域知识的了解程度,而更看重我的商业思想与逻辑能力)。以下列举一些互联网领域常见的业务题:
-
日活突然下降了10%,应该怎么分析?
-
请针对某款产品/业务,搭建相应的指标体系
推荐资料
-
网站"人人都是产品经理"
接下来是一些进阶能力,一般是只有专职数据分析师才需要点的技能树(非专职数据分析师的朋友也可以加以了解,数据分析领域实在是太广了,不同方向的数据分析侧重点也不同,会的东西当然是越多越好啦XD)
6. 数据预处理
"数据决定了机器学习的上限,而算法只是尽可能逼近这个上限"。这里的数据,并不是指原始数据,而是经过预处理的数据。数据预处理包括数据清洗,特征工程等多个过程,可以作为数据挖掘&机器学习之前的准备,亦可以用在普通的数据分析工作中,可以说对数据分析师来说非常的重要,也是各大厂面试的高频考点。
具体知识点:
-
空值与异常值的处理
-
数据标准化&归一化
-
数据规约
-
标签编码&独热编码
推荐资料:由于这块知识比较零散,不是很好找单独的资料,强烈建议想要学习的朋友去打一场kaggle or 阿里天池的竞赛,可以很好的熟悉整个数据预处理的流程。
7. 数据挖掘 & 机器学习
近些年大热的领域,虽然大公司里一般都会有专门的算法工程师&机器学习工程师,但是数据分析师掌握一些基础的机器学习知识依旧会对工作有非常大的帮助,美团面试时面试官就特意和我强调他们喜欢懂机器学习知识的应聘者。
具体知识点:
(注1:数据挖掘 & 机器学习知识应用非常广,以下只是在数据分析领域应用的高频知识点
注2:本条技能的知识点为由易到难排序
注3:即使是第一条知识点也不简单XD)
-
bias-variance trade off与交叉检验
-
常用的模型评估方法(R^2, RMSE, AUC etc.)
-
常见的回归,分类,聚类算法的假设,基本原理,参数,优缺点与使用场景(常见模型有:线性回归,逻辑回归,岭回归,LASSO,决策树,SVM,XGBoost,随机森林,k-means etc.)
-
模型调参
-
神经网络
-
手推算法
推荐学习资料:
-
宝藏Youtuber "StatQuest"(力荐,把每个机器学习算法原理拆解的非常清楚易懂)
-
Kaggle,阿里天池等的竞赛同样对这块知识很有帮助
8. Python & R
之前提过,做简易,少量的数据处理Excel是一个很好的选择,但是Excel的局限性也非常明显,在面对大量数据复杂处理时(比如上面提到的6和7),Excel就有点捉鸡了,而Python & R确是个中好手,这也是大数据时代Python & R大火的原因之一。
具体知识点:
-
数据分析的常用库(Numpy,Pandas, Scikit-Learn etc.)
-
正则表达式与爬虫
-
基础数据结构与算法
推荐资料:
-
莫烦Python
-
Leetcode & 牛客网基础算法题
9. 大数据架构
大数据时代数据分析师也得学会如何与超出普通电脑储存极限的海量数据打交道。
具体知识点:
-
Hive & Hadoop核心架构与基本原理(HDFS, MapReduce etc.)
-
数据倾斜原理及解决方案
-
Spark与Hadoop的对比
推荐资料
-
尚硅谷Hive&Hadoop&Spark(b站就有,全免费)
校招前N月:充实简历内容。不可否认写简历是有很多技巧的,但是巧妇难为无米之炊,没有一点实打实的东西的花架子是逃不过招聘官千锤百炼的双眼的,充实简历内容包括有:
1. 强化量化成绩
2:增加相关项目与实习经历
对于绝大多数岗位来说,实习和项目经历都是面试的时候面试官最喜欢问的部分。丰富的实习与项目经验可以让你的简历丰满很多,实习与项目中积攒的经验也能帮助你在面试流程中游刃有余。需要注意的是,在实习与做项目的时候,尤其是你打算写进简历里的那些,千万不要摸鱼,因为面试官不会放过实习&项目中的任何一个细节。
校招前三个月:选定目标岗位 & 针对性查漏补缺与刷题
首先说明一下,目标岗位≠职业大方向,职业大方向一定是越早确定越好的,目标岗位相对职业大方向是一个更细化的过程。比如我的职业大方向是做数据,但是数据类岗位下面会有数据科学家,数据分析师,数据工程师,数据运营,数字化产品经理。。。每一个细化的岗位要求的技能树都是不一样的,并且学校学习的知识也很难完美贴合其中任何一个岗位(大多数情况是都沾点边XD),所以选定了目标岗位后,就需要针对性的查漏补缺和刷题啦。这里补充一点,除了各自岗位的专业知识外,各大公司还喜欢在笔试环节增加行测题(非技术岗尤其),行测题又以北森的题库最为常见,所以强烈建议大家在秋招前,刷一刷北森的行测题库(淘宝有卖)。
校招前一个月:准备简历
对于大部分岗位来说,简历的模板其实都是差不多的,一份优秀的简历应该包括学校经历(GPA&相关课程)+获奖经历(没有高含金量的可以不写)+实习经历+竞赛&项目经历+技能树,一般都需要在一页纸之内。以下列举一些本人的小建议:
-
简历务必精简,又臭又长是大忌
-
推荐模板:百度或者微信公众号搜"超级简历"
-
实习经历与竞赛 & 项目经历是面试官最看重的部分,请务必给足空间(个人建议至少占一半的空间)
-
简历务必贴合目标岗位的职位要求,无关的自我介绍和个人爱好是纯粹的浪费空间
-
即使是同一个岗位,不同公司具体要求也会有区别,建议在投递每个公司前都对简历进行审核与修改,这样可以大大增加过审的概率。比如我在投递网易互娱时,就针对JD中,拥有丰富的游戏经历这一条,在简历中加上:
狂热游戏爱好者,网易阴阳师骨灰级玩家,签到超xxx天;英雄联盟,荒野乱斗,部落冲突等游戏资深玩家
并且在网申的调查问卷中写上:
网易阴阳师 游戏名称:小狈是天才;角色成长:满级,签到超xxx天;成就:斗技八段选手,为崽而战多个高级徽章拥有者。英雄联盟 游戏名称:ShuaiBei(美服);角色成长:xxx级;成就:排位黄金选手,云顶之弈白金选手。部落冲突 游戏名称:小狈最帅;角色成长:大本营已升至最高等级;接近满防御满科技;成就:解锁传奇联赛(最高等级联赛),世界排行上榜玩家。荒野乱斗 游戏名称:TiancaiBei(美服);角色成长:集齐大部分英雄;成就:解锁最高阶模式:星徽竞技场。
注:以上游戏名称纯属虚构,如有雷同,不胜荣幸。
校招开始后需要做的有:
1:收集招聘信息,以下列举一些常用途径
-
公司官网
-
求职公众号
-
求职网站
2:找内推 & 刷面经
这两步强烈安利牛客网(尤其是互联网领域),真的很好用。
3:归纳整理&查漏补缺
每次笔试&面试都是一次练兵,勤归纳才能越战越勇。
补充说明一下校招开始的时间点
-
秋招:提前批6月开始,正式批8月开始,一般来说越大的厂开的越早
-
春招:提前批年前开始,正式批年后开始,同样的,一般越大的厂开的越早