阿里巴巴-集团管理线-数据分析师面经【商业智能部】
概况
基本信息:
2019.10.30: 入职管理咨询公司,任职商业数据分析师。
2019.09.08__2019.10.21:回国参加秋招。
2019.06.15__2019.09.08: 加勒比实习,英国伦敦和欧洲辗转。错过了互联网秋招的黄金准备期。
阿里是我投的第一家,岗位是集团管理线-商业职能部-数据分析师。最初我通过内推端口,投递了淘系技术部的数据分析师。在加勒比实习期间,主要关注大厂的商分数分岗位(校招和社招都有尝试)。
在LinkedIn上看到阿里商业智能部--数据分析师的校招信息,初步了解后对BI的数据分析师更感兴趣;把简历发给HR后,她们提议将我的简历信息从淘系技术部抽调出来,重新走商业智能部的内推流程。后来抽调简历折腾了一段时间,经多次沟通淘系技术部也同意放人,8月29日才正式开始BI数据分析师的内推申请流程。
时间轴:
2019年8月29日:从淘系技术部抽调简历,启动商业智能部的内推流程。
2019年9月5日:收到一面时间预约电话。
2019年9月6日:一面。
(感觉隔了很长时间,国内中秋假期,中间有联系HR,反馈说已到二面阶段,也在约面试官的时间中。所以等待的过程不必过于焦急,招聘团队有决议后,还需要约定所分配面试官的时间,如果分配到的面试官刚好有时间,面试进程就会快些。如果相对较忙,可能需要等候更长时间。)
2019年9月20日:二面。
个人背景: 本科985 211,英国LSE硕士,硕士之前有一年华为全职工作经历,一段加勒比海地区暑期实习;基本择向为商业数据分析,战略管理,咨询。拿过国家奖学金,经历和实力都很平凡。
阅读提醒:这是一篇凉经。我最后也走上了和硕士专业更契合的方向。想记录下来,是因为这篇凉经刚好串起了几个不同的阶段,这些阶段很难忘,但这段面试是充满遗憾,感觉是一物换一物,回想起来也是颇有玩味和张力。另一方面也是为了整理一下数分商分的面试和准备,为后来者排排雷吧。后面如果牛友们还感兴趣,我也可以补上其他互联网公司和咨询公司的面经。
面试流程
第一轮电面,时长67分钟26秒
前期准备:2019年9月5日,人在法国南部,收到面试官约谈电话,面试时间为北京时间9月6日晚7点。因为我没有国内电话号码,所以加了“钉钉”联系方式,以及前期有留英国的电话号码。9月5日当天结束法国行程,飞回英国伦敦。
面试过程:
1.面试官交待背景,提到面试时长大约为45分钟(可最后我们还是谈了一个多小时才结束)。
2.自我介绍:时间逆序概述工作和学习经历,以及它们的内部联系。加勒比海地区商业分析实习⬅英国留学经历⬅华为全职工作经历⬅本科学习经历;当时讲得有点长,也不够清晰。
3.面试官就介绍中的加勒比海地区项目提问,主要工作内容,独立完成还是团队成员,过程中遇到的挑战/困难,如何克服,是否有用到课程中的知识,项目的落地和对实际业务的优化等等。
因为刚写完这个项目的报告,而且前期也有准备如困难的克服和方法等问题,所以还算熟悉。项目内容主要是帮企业做资产组合优化,指标整合、数据收集与分析、建模、迭代和模拟都是独立完成,当时也有提到和各业务部门的接口关系和跨部门合作。讲挑战/困难主要分两个层面,项目推进层面和技术层面。项目推进强调时间管理和流程把控、业务和技术的结合等,技术层面提到一个在模型的最后模拟分析阶段,对参数进行估计和假说检验时,提到参数比较的适用范围延申 (参数单独的置信区间<参数作差置信区间<单边Wald Test)。 以及整数规划模型的非线性。还有AMPL不同solver的转换,Python的借用,以及@RISK OPTIMIZATION的替代作用。
4.接着项目落地的问题,面试官很敏锐地发现一个机会点,说我项目中有用到一个假说条件(假设企业市场份额保持不变),如果企业把较多资源投放到当前利润率较可观的产品,这些产品的增量是否都能被市场消化,相同market segment下的同类产品需求是否能转化到重点投放的产品上。对于这个问题我们在模型迭代和落地推进的过程中,是有讨论过的,特别是和市场部门分析过市场消化能力及不同产品间消费力的转化等。还是给面试官点个赞,能在很短时间内就抓到其中的一些关键点。
5.因为我有提到课程学习和工作经验对我在加勒比海的实习有很大帮助。面试官就顺势问我硕士课程中有哪些统计相关的课程,具体的知识模块有哪些。还有在华为中的主要工作模块,有没有涉及SQL。
这一部分我没有回答好,没有很系统地把项目和学习课程结合起来。其实我们统计及数据分析的课程都是项目导向的,比如统计学与数据分析 (R语言项目),大数据分布式计算(PySpark, scalable Machine Learning项目), 运筹学建模(商业模拟项目)。可以讲述的知识线有很多,比如大数定理→标准正态分布→参数估计与置信区间,或者大数定理→标准正态分布→p-value→假说检验与Wald Test,置信区间与Wald Test的联系,这些都在项目实践中有所体现,进一步的有Basic Monte Carlo Integration和参数估计的结合,由此延伸到Random Fourier Feature优化非线性SVM和Kernel Functions对于大数据集的应用性。还有stochastic optimization,Chernoff Bound和置信区间的联系,variance reduction,模型训练的几种gradient descent, 模型evaluation的AUC-ROC等基础知识。还有很多内容当时都没有讲透,事后还是很遗憾。然后还提了一下华为的工作模块,主要还是资源的中长期资源规划和需求数据分析及预测,以及一些数字优化项目。提及我工作过程中没有系统用过SQL,但提到当前有利用课余时间在LeetCode和DataCamp等平台上自学。
- 6.基于我的工作经验和硕士学习,问到我的职业规划。
这部分我也没答好。我有提到经常比对同一职位的校招要求和社招要求,往往社招的岗位要求和工作内容就是应届生的短期进阶目标吧。然后提了下自己对商业分析的兴趣,提到自己职业规划和商业智能部数据分析师的匹配度,比如商业数字分析,异动点排查,机会点挖掘,策略制定及落地等等内容。如果前期有了解阿里BI数据分析师的具体分工,能结合内部的职业进阶路径及与上下游部门的接口关系谈整体的择业规划和未来发展方向,个人觉得会相对好些。
- 7.Mini Case Interview。淘宝线上成交额增长率下降,如何通过数据分析定位原因?
当时在电话里一直听不清(面试官用阿里的电话打长途,不知是否有这方面的影响),我还理解为是模型出现一些和权威经验不符的观测结果,该如何定位原因。后来反馈听不太清,面试官重新讲述了问题。我当时的回答还是从整体到局部,从整体行业到企业个体的思路来展开。
a).可先分析整体电商行业的增长变化趋势,是行业整体性的增长放缓,还是只有淘宝的增长放缓。
b).如果聚焦淘宝本身的线上成交额增长放缓,我们可以按不同行业,产品门类,品牌/企业,产品型号等指标细分market segments(其实就是从顾客淘宝线上购物的视角,通过商品类别逐渐索引);
c).然后分析每个market segment下的增长情况,重点关注成交额较大的segments(2-8原则)。然后面试官会追问,还有吗?还有吗?
d).通过这个细分思路,我们可知是那种商品门类下哪个品牌/企业的哪几种主要产品的增长率放缓导致整体成交额的增长放缓,如果往下延申,可以按定位到的segment逆向展开,比如X品牌的A类产品增长放缓,那该类产品的成交额可按不同地区不同消费者群体分,可进一步细化问题定位的颗粒度。
e).继续追问还有吗?可以将定位到的segment再横向对比,比如和竞争平台的对比(同一个segment),当时有问面试官数据的可获取性,与线下成交额的对比等。
- 8.提问题环节。说我有对比了解商业智能部数据分析师社招和校招的任职要求,问BI高级数据分析师的两类来源:直接从社招引进与从内部培养晋升的配比大概如何,有没有一个固定的统筹配额?这两类来源在能力矩阵上的优劣对比。以及高级数据分析师的职业进阶路径。
面试总结:总体来说,其实就是项目和课程学习两手抓,项目强调攻坚过程自己的思考及贡献率,以及对项目本身对日常业务的优化,落地进度,指标的量化体现等;课程学习强调和统计相关的知识脉络;最好是有提及课程学习或以往的实践经验在项目实习中的体现,以及通过项目实践更新和深化对理论知识的理解,具体体现在哪些模块等。至于mini-case,正常来说应该都可以应付的。如果想更高阶的练习,可以利用一些传统的咨询面经材料,像Case In Point新版以及一些线上的资源,也可以和同学一起约练case,如果按照咨询的强度来练,mini-case就完全是降维打击了。当然练case对于逻辑训练和sense的培养也是有一定帮助的,对以后工作也有裨益。
第二轮电面,时长19分钟36秒
前期准备: 感觉自己有些矫枉过正了,因为一面下来对自己的表现不太满意,觉得自己项目部分答得还过得去,但知识脉络梳理和职业规划两个模块答得很不好。在等进一步的消息期间,我从英国飞回国内了,顺便可以和家人过中秋。利用在家的时间,我将在一些关键项目中用到的理论知识又重新推导了一次,把上述提到的一些脉络多次梳理,如大数定理的两个分支应用(参数估计和假说检验Wald Test),Basic Monte Carlo Integration→样本平均值作为积分的近似值→与参数估计和置信区间建立联系,参数估计和Chernoff Bound建立联系等。关于职业规划方面,看了一些关于阿里巴巴战略、行业分析以及商业智能部的帖,写了一些总结。
面试过程:
1.面试官交待背景,提到有了解我的简历内容及一面面试官的反馈。
2.还是例行自我介绍。这次我的自我描述相对一面较简略些,基本每一段经历都是一些关键词加一两句话带过,感觉比第一次表现差。
3.提及加勒比海的实习项目,我的工作对他们实际业务带来的优化,具体在哪些指标有体现。
4.提问我在华为全职工作一年的角色,主要工作内容,参加过哪些数字化项目,有无涉及到统计学知识。
5.举其中一个项目作为例子,具体有哪些指标的优化体现。
面试总结:第二轮面试我没有发挥好,没有表达出我想讲的点;面试时长比第一轮短了很多,面完我就感觉凉凉了。第一轮面试我们能感觉到整个语境是立住的,第二轮有一种双方都想快点结束的感觉,没有找到契合的场。
总结
1.实习期间开始看国内的秋招,错过了大厂的黄金准备期。尤其对于留学生而言,需要尽早明确求职方向(国内/国外,技术/非技术),然后定好时间节点,需要补充的技能,面试/笔试经验积累等。
2.不同岗位的准备思路和方法也不一样,求职过程不仅是结果导向,也是对自己过去经历和技能包的梳理及查漏补缺。数据分析师会分为职能导向(产品、hr、商业分析)和技术导向。职能方向偏向于业务和战略层面的分析(互联网战投,咨询等),技术导向则是数据科学家、数据工程师的方向深入。如果往商业分析的数分方向走,除了掌握数据分析的基本技能和数理知识外,要多注意商业意识的培养和案例练习的积累,比如字节跳动的数据分析师就是产品导向的,阿里巴巴商业智能部是按业务分工的。如果是往技术向走,像咨询公司里也有专门的数仓团队、大数据和算法组的数据分析师,这就需要对数据收集与处理(爬虫、清洗)、算法、统计模型等都有更系统的理解和掌握。
3.建议意向数分的同学在技能准备的阶段,先从前面所述两个方向的交集入手,因为交集往往是最基础的。SQL、Python (关键掌握的一些modules像numpy、pandas、re)、Tableau基本是必修模块。掌握基础技能之后,就要有意识地按梯度整理自己的心仪公司,然后逐个整理对应公司的数据分析师的JD(Job Description),JD里提到最多的能力模块就是刚提到的需要夯实的基础。腾讯的数据分析师需要考算法,编程笔试题也是和算法组的同一套题。阿里巴巴的数据分析师要看部门,比如淘系技术部和商业智能部对数据分析师的要求是差别很大的。字节跳动的数据分析师不是分在技术分支下的,而是在产品分支下,所以能力需求和产品经理很像。拼多多的数据分析师就是专门考SQL。OPPO的数据分析师就考很多SQL,数据库相关的知识等等。如果是咨询公司的数据分析师,则要按商业分析师的JD去准备case interview,同时还要把基本的数据分析方法和工具熟练。
4.求职过程也是一个信息整合的过程,不论是新信息的摄取还是旧经历的梳理。因此切忌闭门造车,多上不同的平台去学习参考,还是多有裨益的。
写在最后
找工作的过程和结果都是有多方因素的交织,每个人的价值排序都不一样。这也仅仅是我们生活迭代的又一个新起点而已。
现在在俗称北京CBD后花园的某小区公寓里,敲下这段文字;明天又是周一,又是和一群国贸男女民工不知昼夜的生活。北京骤冷的天气和一以贯之的霾,仿佛借用了一些伦敦的色调,但近处端详起来,又多了几分质朴和光鲜。
依稀又回到了地中海边,再一次对未来充满了期待和不安。尼斯的蓝色海岸机场就在海边,降落时仿佛要掠过海面。那时刚好结束了加勒比海的生活,飞过北大西洋的对角线回到欧洲。不到15分钟的电车就可以从机场穿梭到市中心,沿着散步阳光的海岸线,混杂着各种口音的对话以及耳机里的《拂晓车站》,眼前的画面和回忆一帧一帧地循环。滑铁卢桥上裹得严实,幸亏簇拥的人群消解了部分寒意,零点钟声想起,伦敦眼烟花溅落,‘友谊天长地久’的合唱一如往年,交换着新生活的祝愿...
#阿里巴巴##数据分析师##面经##校招#