我的数据分析秋招经历和学习心得【万字长文】
刚刚签掉三方,秋招算是告一段落了。
很早就想写一篇文章了,给明年秋招的同学,以及准备进入数据分析领域的朋友,以期能给你们带来一些小小的帮助。
写这篇文章的主要原因一个就是想做个劝退,另一个是系统地给非专业的同学做一个数据分析求职指南。
首先介绍下我自己的情况,双非渣硕,非相关专业(本电子信息,硕电子与通信),0相关实习,转行时间极短(准确地说是今年4月中旬转的数据分析),可以说是叠满了debuff。
秋招情况:投递:167家,笔试:70+家,面试:15家,offer:5家
目前手上的offer有点杂,啥行业的都有:通信、制造行业(中兴通讯等),游戏(诗悦网络),金融(同花顺),银行(泰隆银行)
看到这,你是否觉得数据分析也不是很难?但真的不是哦,这篇文章的主题之一是劝退哦。
劝退篇
温馨提示:劝退的内容主要是写给我这一层次的同学,大佬请自觉跳过。
1.岗位hc少,报录比低:
截图来源于某站的公众号,官方劝退,最为致命(手动狗头
2.学历通货膨胀速度过快和数分岗位hc收缩之间的矛盾
在读研期间,我亲身经历了算法岗(cv、推荐等方向)从当红炸子鸡,到诸神的黄昏,到现在的灰飞烟灭。
而数据分析领域也愈加有此趋势。
作为一位双非渣硕,今年秋招我享受过pdd三次连简历筛选都没过的待遇。
也享受过某大厂笔试算法题全a,结果笔试挂了的待遇。
其实秋招高薪offer的决定性因素还是最简单的市场供需关系。
疫情和经济形势加剧了海外同学回国工作的数量,也注定了我被某些大厂疯狂刷kpi的命运。本人有幸接触过手握pdd,字节,美团offer的大佬,他们真的很优秀。
但有时候并不是你不够优秀,而是他们真的没hc了。
上面这些劝退最主要还是写给像我差不多同学,其实个人奋斗固然重要,但也要考虑历史进程!
讲个题外话,今年的前端、客户端(IOS,Android)的报录比都挺舒服的,相信大多秋招同学的目的也就是找一个薪水可以的工作,面向薪资编程而已,但有时候选择往往比努力更重要。当然了,每年各个岗位的报录比都会动态变化,请各位结合身边的信息自己做出决定哈。
如果你看到这,还没被劝退的话,那请继续往下看,我会在接下去的章节分享我在数据分析领域的学习心得以及秋招的经历。
数据分析之路
前面说过,我是今年四月中旬转的数据分析,在九月中旬拿到第一个数据分析offer的。期间走了不少弯路,其中耗费精力最多的是如何找到数据分析的学习路径。所以接下来这一部分我会重点讲讲数据分析所需要的基本技能,甚至会手把手介绍相应的书籍和资源,最大程度地帮助后来的同学,少走点弯路。
当然,事先声明,我的建议只能帮助同学达到在校生秋招的程度,如果是社招或者是校招想去大厂,那我这点建议是远远不够的,毕竟数据分析,道阻且长。
还有,以下推荐的书籍都是我在这几个月个人购买的且觉得有所帮助的,全程无广哈。
1.统计学
作为一个工科生,多多少少是接触过概率论和数理统计的,但是和统计学科班出身的同学还是有一定差距的。所以我刷了贾俊平版本的《统计学》和《面向数据科学家的使用统计学》。前者是基础,不做多赘述。后者是统计学在数据分析领域的应用,有几个章节还是值得一看的。
简单展开讲讲,你要对以下知识对答如流:
- 常见的分布函数/概率密度函数,以及其特性。
- 大数定律,中心极限定理的原理及其应用。
- 假设检验的原理,以及衍生的概念,如p-value,显著性水平,检验效能。
- z检验,t检验的原理及其应用场景。
- 贝叶斯原理及其衍生。
目前想到的就有这些,以上知识点,最好能用自己的语言加以消化。
2.机器学习
因为我在研究生期间打过蛮多数据挖掘竞赛,所以这一块我花的时间并不多。
但是知道如何使用是一回事,知道原理又是另一回事。数据分析的面试官考察的大多是算法的原理,甚至手推,而非哪个算法用着顺手,以及炼丹心得。
所以我主要看了三本书,先讲《百面机器学习》和《机器学习基础:从入门到求职》
这两本书把面试中可能遇到的机器学习问题提炼出来,并进行了相应的解答。两本书有一定共通的地方,可以相互印证着看,对于我这种调包侠帮助还是蛮大的。
《机器学习实战》:这本书上面有许多机器学习算法的实现,我平时是当成字典来用的。喜欢的同学可以看看。
所以简单展开讲讲,在机器学习领域,你要对以下知识胸有成竹:
- 数据预处理(清洗)的基操以及优缺点。
- 特征工程,如归一化,类别特征处理,高维组合特征处理,Word2Vec等。
- 模型评估,如过拟合和欠拟合,超参数调优,模型评估指标以及调优等。
- 典型算法的原理及应用,优缺点(SVM,决策树,RF,Xgb,lgb,catboost等)。
- 神经网络种类,原理,调参等。
- 优化算法如有监督学习的损失函数,经典优化算法,梯度验证,随机梯度下降及其加速,L1\L2正则化与稀疏等。
- 集成学习如boosting和bagging等。
目前想到的就有这些,以上知识点,最好能用自己的语言加以消化。
3.python
python是我的日常语言,所以我并没有花太多时间在这上面。但是知其然,还要知其所以然,所以我还看了看《利用python进行数据分析》和《数据科学家手册》这两本书。前者是python的基操,后者主要讲了numpy,pandas,可视化,机器学习等实例。两本书有一定共通的地方,可以相互印证着看,对python熟悉的朋友可以当字典用。
这边还要提下刷算法题的情况,如果同学一门心思想找数据分析的工作,基本的算法还是有必要刷一下的,因为很多公司在笔试阶段也会放算法题,数据分析/数据挖掘/商业分析/算法这几个岗位在绝大多数公司并不是分得很清晰,如果之前没接触过算法,建议把牛客上的《剑指offer》刷完就能凑合着用了。如果想同时投递 数据分析/数据挖掘/开发 岗位的话,leetcode要早早刷起来,我的做法是《大话数据结构》和《算法导论》两本书组合着看,每看完一个章节就去leetcode上找到相应类型的题目进行刷题巩固。
我的个人公众号(顾先生的数据挖掘)上面的“leetcode刷题系列”就做了算法题的类型归类总结。喜欢的同学可以去看看。
4.sql
在这之前我几乎没接触过sql,所以我先快速刷了一遍《MySql必知必会》,然后再刷了一遍《利用Excel,轻松学习sql数据分析》,张俊红大佬写的。
刷完基础就该练习了,我先刷了牛客网的数据库题目,这个难度不大。再刷leetcode的数据库题(这个要开会员,但是这点投资是值得的哈哈)。
刷题过程中遇到不懂的就直接翻书查漏补缺即可。
之前我在公众号上发过关于sql的文章,有兴趣的同学可以看下(https://mp.weixin.qq.com/s/YBuXbXua1leOy0EWmwyODQ)
接下来就是hive的问题。因为本人没接触过hive(0相关实习orz),所以我曾经尝试着在自己的虚拟机上面搭建hive环境来进行练习。但其实最好的方式还是找个实习哈哈。还有数据倾斜这块,我主要是看了《离线和实时大数据开发》这本书来加以理解的。
大家可以关注我的微信公众号(顾先生的数据挖掘),发送”数据分析资料“来获得数据分析相关领域的电子书,里面包含了这本书的电子版。后期我也会写相关的文章来发送到我的公众号上面。
5.业务知识
在铺垫完基础知识后,终于到了业务这一章了。
请各位同学务必认真看这一章节,本章节非常重要,可以说是直接决定了你秋招offer的层次,对于一个数据分析师来说有没有业务思维,就好似没有灵魂。
废话不多说,我们开始吧。
其实快速提升自己业务能力的方式依旧是找一份实习。但是如果是像我这样0实习的靓仔,或者数据分析初学者,该如何解决冷启动这个问题呢?
我的解决方案是书籍和优秀公众号的阅读。
前者所包含的知识密度足够大,能很好地带你入门,后者能快速汲取大佬优秀的思想。阅读一个好的公众号就像是一位数分领域前辈和你娓娓道来,受益匪浅,常给人一种醍醐灌顶的感觉。
下面先介绍书籍。
第一本书是强烈推荐购买的!!!徐麟大佬今年刚写的书《数据分析师求职面试指南》。
这本书涵盖了数据分析师岗位主要考察的知识点,在求职路上有这么一本书指点迷津,还是件幸事。该书我反复阅读过多次,有些关键章节甚至能背下来了。
下一本书是《精益数据分析》,大家应该不陌生,主要深入理解了数据分析和数据驱动的思维模式,介绍了六个典型的商业模式并应用到各种规模的新企业等。
下一本书是《数据驱动》,是神策数据的创始人写的。亮点在于介绍了很多实际工作中遇到的问题以及解决方案,高屋建瓴的插入,配合多个实际案例分析,很适合我这种0实习的同学对于业务的理解。
下一本书是《产品思维》。
有点奇怪吧,为啥数据分析和产品还联系上了?
因为我认为(以下都是个人观点)数据分析不仅仅是懂得了jd上的所需要的工具使用,它最核心也最重要的是业务思维这些看起来形而上学的东西。
这里讲业务思维太形而上学了,倒不如说每个数据分析师都是用户研究专家+产品经理+数据分析师的结合体。
为什么产品思维和用户思维这么重要呢?因为基本的技能都是可以训练的,但数据分析本身是服务于业务的,在平时,数据分析师的主要工作是迅速定位排除问题,确保业务平稳运行。但同时,数据分析师还可以用业务来驱动数据,获得业务的增长,甚至进一步获得新的产品和业务的发展机遇,这才是数据分析师的核心竞争力所在。
如果只会完成需求,那么和基本的数据专员有什么区别呢?既不能体现自己的核心竞争力,也不能给公司带来利益。
作为应届生,我的观点可能比较稚嫩,也欢迎有不同想法前辈和我来交流。但是基于这个思想,我看了产品方面的书籍。
产品方面我主要看了《产品思维》这本书,全书分三个部分,第一部分“认知用户”讲述如何建立用户模型,即深度了解用户,洞察用户核心需求;第二部分“创造价值”核心讲述在了解用户模型的基础上,如何做出高质量的决策,实现产品和用户的价值;第三部分“产品落地”则讲述了一些通过迭代快速验证产品决策有效性的方法。
对于我这个产品小白来说,这本书对我的帮助还是蛮大的。同学们在拓展产品知识的时候,除了看书,还可以多去人人都是产品经理(http://www.woshipm.com/)逛逛,也能收获不少。
下一本书是《增长黑客》。
在找数据分析工作过程中,往往会有用户增长这一个分支岗位,届时这本书的知识就能派上用场了。《增长黑客》这本书干货很多,包括方法和实战两部分,甚至还讲到了增长团队如何组建,非常值得一看。
下面在介绍两本运营方面的书籍:《数据化管理》和《数据化运营速成手册》。
这一方面是为了应对数据分析的一个分支岗位:数据运营。另一方面是为了了解数据分析在运营领域的运用:人货厂思维如何在运营领域起作用?运营指标如何选取?效果如何量化和评价?有哪些运营陷阱?运营报告如何展示?
最后介绍一本《金字塔原理》,这本书本身和数据分析没有太大联系,但很有意思。
全书总结成一句话就是:金字塔原则就是,任何事情都可以归纳出一个中心论点,而此中心论点可由三至七个论据支持,这些一级论据本身也可以是个论点,被二级的三至七个论据支持,如此延伸,状如金字塔。
作为一个数据分析师,对问题的归纳、总结和输出,以及这种一针见血的技能还是蛮重要的。喜欢的朋友可以看看。
安利完书籍,我们来聊聊前面说过的微信公众号。这些都是我在学习过程中带给我巨大帮助的公众号,感兴趣的同学可以拿出手机打开微信准备关注了哈哈
1.接地气学堂
作者是一位资深的数据分析师,在这个公众号我学到了很多数据分析师的实战经验。
比如同样是用户画像,作为初学者我们的常规做法就是本能地开始把数据库里的用户标签往外搬。或者陷入无限拆分的逻辑怪圈。比如类似“流失用户画像分析”一类相对具体的分析题目,就开始无限拆解数据。分性别,年龄,地域,设备,注册时间,来源渠道,购买金额……拆了几十个维度看流失率。最后,只看到有的维度差5%,有的差10%,当然没有最后结论啦,越看越糊涂。
导致的一个结果就是做了一大堆数据,也没分析出什么东西啊?
而作者教会了我,以上问题,都是太过纠结于用户画像四个字,忽视了分析两个字导致的。用户画像作为一个基础数据体系,本身并没有分析功能。单纯的罗列用户标签或者拆解用户指标,也起不到分析作用。像利用好用户画像,还得按分析套路一步步来。
比如:第一步:转化商业问题第二步:宏观假设验证第三步:构建分析逻辑第四步:获取用户数据第五步:归纳分析结论
2.数据管道
这个号的主人是宝器大佬,更新很多,干货也很多,建议标星。
3.数据森麟
徐麟的公众号,也是前文提到的《数据分析师求职面试指南》一书的作者。这里再次安利下他的书,良心之作(徐大记得结下广告费哈哈~~
4.胖里的日常
号主胖里,她的文章比较适合秋招和找实习的同学,论点详实,在我求职过程中给予过很大的帮助,感谢。
4.数据不吹牛
号主小z,也是一位数据分析领域的大佬。
5.顾先生的数据挖掘
这个号的号主,就是我自己啦哈哈。很不要脸的把自己的公众号也放在一群大佬中间了。
我的公众号在接下去的日子里会更新数据分析的相关文章,同时之前在研究生阶段我写过四十余篇原创文章,包含偏算法的“leetcode刷题系列”,偏数据挖掘的“机器学习系列”,还有数据分析门下的“业务理解”和“数分基操”。感兴趣的朋友可以关注下。
现在关注我的公众号,发送“数据分析资料”,即能获取数据分析领域的电子书,这也是我在秋招过程中收集来的,希望能给你们带来些帮助。
接下去我会集中分享一些公众号,大家可以按需了解关注。
偏数据分析的公众号
赵小洛洛洛:号主是一位数据分析师
一个数据人的自留地:一群产品数据经理举办的公众号
数据科学家联盟:一群数据科学家做的公众号
DataGo数据狗:数据分析,号主是个人
猴子数据分析:适合数据分析入门的朋友
偏数据挖掘的公众号
小小挖掘机:分享数据挖掘的知识
Datawhale:一群热爱机器学习的同学们建立的一个组织
DataFunTalk:分享数据挖掘的知识
kaggle竞赛宝典:一群热衷于数据挖掘竞赛的大佬做的公众号
Coggle数据科学:同上,分享数据挖掘竞赛相关资讯
麻婆豆腐AI:分享数据挖掘竞赛的资讯
最后再简单展开讲讲,你要对以下知识对答如流:
- ABtest,感兴趣的同学可以看看我总结的文章(https://mp.weixin.qq.com/s/Ynq7iqOlOEEMwTVWLgrWug)
- 完整的指标体系构建
- 数据监控以及报表设计
- 如何设计一份优秀的数据分析报告
- 构建用户画像
- 完整的数据挖掘项目流程
目前想到的就有这些,以上知识点,最好能用自己的语言加以消化,因为这部分内容比较重要,我之后也会在我的个人公众号上面发送相应的文章。(先给自己挖个坑哈哈
ok,我们进入下一部分:秋招。
秋招篇
说起秋招,那绝对绕不开简历这一关。
谈起简历,绝对是我的血泪史,我这份简历前前后后改了十多遍,还请教了大佬(手动@胖里)帮我修改才搞定的。作为我们的门面,简历直接决定了hr会不会捞我们,重要程度不言而喻。
因为篇幅有限,我就直接挑重点讲吧,后续详细内容我会新写一篇推文发出来的(坑+1)。
实习
首先是实习了,实习经历绝对是数据分析校招求职的重中之重。今年大厂的hc很少,而这本就不富余的hc中,实习转正的同学又占了不少坑位。所以实习,特别是大厂实习就显得非常重要了。因为它进可拿到直通大厂的门票,退能给自己的简历添上浓墨重彩的一笔。
像我这样0实习的靓仔,只能把本科时期在电商公司运营的实习经历写上去了,聊胜于无吧。不过明年秋招的同学现在可以实习起来了,实习真的非常非常非常重要!!
项目
下面是项目。因为我没有做过正儿八经的数据分析项目,也没进过大厂实习,所以我把之前数据挖掘比赛中,拿到top名次的比赛的特征工程拎出来,写成了数据分析的项目。
同时针对自己投递的公司,选择不同类型的比赛项目,比如用户复购率预测(电商、用户增长等),广告反欺诈大赛、诈骗电话识别大赛(银行、风控等),自己还做了个数据分析的项目:(https://mp.weixin.qq.com/s/htk-FI6lhocJg96Nov5tgQ)
简历润色
最后再给简历润润色,核心就是用数据说话。举个栗子吧!
润色前:“经过模型选择,调参,特征选取,最后取得了优异的成绩”
润色后:“通过特征⼯程设计(统计与trick特征提取),预测模型的选择(XGBoost、LightGBM,CatBoost、DNN),参数优化,并根据特征重要性,以及线下效果进行迭代,最后筛选出 25 个最具代表性的变量。该模型决赛 a 榜第 12 名,最后b榜排名:7/995,具有较好的泛化能力”
是不是看着舒坦多了呢哈哈。
简历投递
最后就是投简历的事情了,之前说过,我目前投递了167家,笔试了70+家,面试了14家。
也有同学问过我,哪来这么多公司给你投?
其实我也就在牛客的校招界面进行的投递,那里大概有几百家公司。同时发扬贼不走空的精神,本着来都来了,投一个呗的想法。我每进一家公司,先看看有没有数据分析岗位,没有就投机器学习/数据挖掘岗位,没有就投开发岗位,再没有就投产品经理岗位。
在这个策略下,我手上的offer包含了数据分析/数据挖掘/开发岗,也算是种豆得豆了。
同时还建议同学们把笔试面试做好时间和记录,方便后期复盘和面经的总结,下面是我的记录。
心态问题
秋招最后一点就是心态要好。
为啥心态很重要呢?就拿我的栗子来说吧,人贵自知,我本身学历和经历就不占优。而秋招就像一个漏斗模型,转化率在短时内已经得不到大幅度提升了,不如把基本盘做大:海投简历。
秋招简历投递的窗口期很短的,大概从七月下旬到九月上旬,接下来的时间就要应对铺天盖地的笔试面试了。
我也从不会去专注于某家公司,花心思去打听进展。有这个缘分,hr自然会找我的,有这闲工夫不如多投点简历呢,谋事在人,成事在天。
但是每一场笔试和面试我都会认真去做,事后认真复盘。不做无意义的事情,但也要珍惜每一个机会。
虽然有时候会遇到一些一言难尽的事情。比如某厂发了三次笔试通知,甚至在有朋友接到该厂oc后,还给我发了一次笔试通知。但我还是像前两次一样认真去做了,因为骚操作是hr的事情,但凡这次笔试能让我检查出一丁点知识漏洞,我也是赚的。
同理,大家也有可能会遇到kpi面试。举个栗子:某大厂第二次捞我起来面试的时候,我心知肚明这是一次kpi面,因为hc早没了,我的水平和背景也不值得特批申请。但是我还是像之前那样去准备,了解公司业务组成、财报,面试部门所在细分领域的背景,同赛道友商的情况等。
虽然在面试结束五分钟后,不出所料再次受到了贵司的感谢信,但是通过和面试官的交流以及面试官对我面试前准备好的问题的答疑,我对短视频赛道有了更加深刻的理解。
offer选择
最后写一下我对数据分析offer选择的一点个人想法。
通过对业界前辈的咨询和个人的认知理解,我觉得数据分析岗在挑选offer时候:
部门业务>>行业>公司平台>薪资
第一个部门业务这个很好理解,如果顶了个数据工程师的title,进去之后沦为一个sqlboy的话,你未来的核心竞争力在哪儿呢?对于职业生涯的影响还是蛮大的。
所以每次面试后,我都会认真询问公司的部门业务,应届生进去后的日常工作,以及对应届生的培养体系,作为未来选择的一个参考点。
第二个行业,其实很看个人选择了,但是遇到自己喜欢的行业,比如我闲着没事喜欢炒点股票,玩玩基金,对投资理财有自己的一些心得。所以在遇到相关行业面试的时候,就很亲切,和面试官很聊得来。虽然咱大多数打工人找一份工作都是为了混口饭吃,但是能进一个自己感兴趣的,特别是在风口的,未来有发展潜力的行业赛道,对自己的职业发展还是很有好处的。(这里已经明示了我最后的选择了吧哈哈)
第三个就是公司平台。毕业生的第一份工作,选择一个大平台有多重要,我就不用废话了吧。
最后一个是薪资。说到钱,我就更不用废话了哈哈。不过同学们第一份工作不要太看重1-2k的薪资差,这不是鸡汤,能在一个好平台学到东西更重要。当然,如果薪资差异过大的话,也就别相信hr说的会重点培养你之类的话了,向钱看吧骚年!
不知不觉,写了这么多。其实写这篇文章的初衷不仅仅是劝退,更多的是通过自己的经历,来帮助想进入数据分析这一行的同学。
同时也希望通过自己的秋招经历,给明年找工作的同学一点小小的启发。
因为现在互联网已经从增量博弈进入到存量市场竞争阶段,不再需要太多普通的程序员/数据分析师,所以我们就能见到一个奇观:一边是互联网寒冬缩招,一边是校招起薪再创新高。
互联网普遍红利的时代已经过去了,未来两极分化将会加剧。
所以作为在校生,努力提高自己的认知水平,加强自己的核心竞争力,增强自己的不可替代性吧,机会永远是留给有准备的人的,加油吧骚年!
哦,对了,记得关注我的公众号啊!顾先生的数据挖掘!!!