【数据分析】秋招经验分享
秋招过程中在牛客社区受益颇多,所以希望能写点东西回馈社区的大家。这篇帖子主要讲讲秋招的个人经验和对行业的理解,希望能抛砖引玉,找到同样热爱数分的战友来共勉。
【笔面试准备方法】
要回答"如何拿到理想的数据分析offer"这个问题,首先需要定义"什么是理想的数据分析offer",其次才是考虑"如何拿到这个offer"。前者涉及评价一个数据分析职位的标准,可以从行业、成长空间、薪酬等维度来判断,最终取决于个人的兴趣和职业目标;后者才是讲具体的笔试面试方法。因而我会主要分享两方面内容:1)在实操层面上如何准备笔面试 2)对数据分析在不同行业的情况的理解,以及职业前景。这两方面分别针对还在求职的小伙伴和已经在offer比较阶段考虑未来职业规划的朋友。
从实操层面上来讲,互联网企业的数据分析主要要求以下几方面的技能:
1)概率统计:包括概率论和统计推断,掌握常见概率分布、抽样以及假设检验方法即可。除了了解基本概念外,最好能总结下各个方法的应用条件、优缺点,以及改进方法,这样可以将类似的概念横向对比,加深理解。
2)编程:主要是SQL和基础python编程,也有部分大厂会考察算法编程。对于SQL来说要特别关注一些热点问题,比如rank()、dense_rank()、row_number()的区别,常见的数据倾斜原因和解决方法,以及常见的SQL调优方法。
3)机器学习:主要是经典机器学习和数据挖掘算法,不包括各类深度学习算法。这一块也要特别关注相应的热点问题,比如XGBoost、LightGBM相比传统树型算法的改进和优缺点。
4)产品/运营/商业 思维:主要考察产品/运营优化过程中的常见问题,比如异常指标归因分析、活动效果评价等。产品思维这一块最好能依托自己熟悉的产品进行全面梳理,比如如果喜欢用抖音快手的话就可以深入了解下短视频UGC赛道的市场环境、商业模式、运营指标等等。
5)跨部门沟通协作能力:主要考察对分析师职能和实际工作流程的理解,通常在终试和HR面中被问到。
注重归纳总结
总体来说除了"跨部门沟通协作能力"需要个人亲身经历感悟之外,其他几项都能通过"刷题"来解决。所谓"刷题"就是归纳总结常见问题,这一点要感谢各位牛友的分享,因为实际笔试面试中的绝大部分问题大都能在牛客的笔面经帖里找到。
我认为对于即将成为分析师的我们来说归纳总结能力格外重要,而准备笔面试的过程就是第一个考验。归纳总结可以帮助理清思路,得到方便记忆的结论。比如下面这个例子:
-----------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------
类似地还可以对以上各个方面进行归纳总结,以下再列几个例子供大家参考:
1)归纳总结各种假设检验方法的作用、适用条件、优缺点,以及相应的改进方法
2)归纳总结SQL中各种排序函数的用法、性能、区别
3)归纳总结AARRR模型中各个阶段的常用指标
我们其实可以把"归纳总结常考题型"这个行为理解为重建"笔面试题目"这个随机向量的概率密度,即基于牛客笔面经帖的采样来重建(概率&统计, 编程, 机器学习, 产品/运营/商业思维, 跨部门沟通协作能力)这个5维随机向量的联合概率分布,然后找到概率最大的一批往年考题就是常考的试题。这5个维度的变量很大程度上是相互独立的,所以我们只需要分别找到每个维度的高概率试题再分别准备就可以了。当然这个过程中不会很顺利,因为我们在牛客看到的全部笔面经帖很可能不是总体的无偏采样:不同公司不同年份的数据分析师岗位考察的问题可能并非同分布的,而且牛友在分享笔面经的时候可能会因为各种因素漏掉某些考题,因而需要重点关注高频题的同时对低频题也给一些最低限度的照顾。简单来说就是笔面经帖子里出现过的题目可以区别对待,但是必须都要有基本了解,切忌因为某些问题只出现过一次就不准备了(期末往往是什么没准备就考什么,血的教训...)
注意技术细节
除了被动地对面试官所提问题给出及格回答外,主动提及一些技术细节也能加分不少。在大多数人都只对算法原理懂个大概的时候,技术细节可以产生很好的区分效果。比如下面几个例子:
1)假设检验中影响统计功效的有哪些变量?
2)正则化的统计理论依据是什么?
3)极大似然估计和最大后验概率估计的关系是什么?
4)数据不平衡时能否用AUC作为评估指标?
5)能否直接用AUC评价SVM的性能?
类似的细节问题还有很多,常考的那些题目真的只是冰山一角,感兴趣的朋友可以进群交流。链接放在了一楼,大家后面可以聊聊笔面经和offer对比。
【数据分析的职能定位】
"对数据分析的理解"也是面试中常考的问题,但这个问题往往默认了互联网行业这个前提。实际上如果从各个行业整体来看数据分析的定位就会有不一样的理解。
基于个人经历和前辈们经验,目前数据分析在几个主要行业的情况如下:
行业 | 职能定位&工作内容 | 特殊技能要求 |
互联网 | 支持产品/运营/算法团队 | 可能要求熟悉linux、大数据生态工具 |
零售 | 供应链: 1.独立负责供应链分析 2.或支持供应链管理团队 | 运筹优化、对供应商/物流/仓储等业务的布局情况高度熟悉 |
Marketing&Merchandising: 1.独立负责市场/用户分析、定价等问题 2.或支持销售团队 | 市场/用户研究等经管专业的技能 | |
E-commerce(互联网零售): 支持产品/运营/算法团队 比如沃尔玛的线上零售业务,这一块在国内完全被电商取代 | --- | |
咨询 | 独立负责行业分析业务 | 市场/用户研究等经管专业的技能 |
制药 | 独立负责临床实验相关数据分析 | 制药及临床实验的一般性常识、SAS或R |
银行 | 独立负责风控相关数据分析业务 | 风控的一般性常识、SAS或R |
制造 | 独立负责QA、最优化等任务 | QA常识、运筹优化 |