【数据分析/面经】数分秋招经验+大厂/中厂面经
牛客许愿还是很灵滴,回馈牛客~简单记录一下暑期+秋招心路历程~~和其他发帖的大佬比,我的能力+经历+收获弱爆了,但是自己已经很满足辽~
技术面+hr面 面经已更完~~~
个人背景:
本硕统计相关+暑期前互联网数分实习+保险公司数挖实习+小游戏公司打杂实习 这三段杂七杂八的实习+成绩中等(不咋样,成绩好真的是通行证
【更新了这一part】写在最前面的感悟+个人观点:
1.关于暑期实习&转正
暑期的时候苟到了鹅的风控,实习了挺久的,为了这段实习也放弃了一些其他的不错的实习机会,但是因为个人能力不足+向上管理做的不好+初次接触风控+兴趣点可能不在风控,转正就挂了。很多时候没有转正并不是一件遗憾的事,有一些同学因为不喜欢部门的业务、想要换base/换部门/换岗位等原因主动放弃转正,拿到了更好的offer,也有非常非常少的一部分同学因为转正了直接躺平没有秋招,最后all in xxx得到的薪资结果却不尽人意……
2.关于投递时间
11月1日的凌晨四点,回忆起从9月1号开始的秋招正式批,发现一个月前写下这篇帖子的我其实输出了一些错误的观念……
关于投递时间,秋招前,总是听学长学姐说正式批的机会很少、实习转正最稳妥,但是回头一看,发现自己的offer大部分都是在正式批拿到的;因为是边面试边丰富小题库,所以早早面完的只有白菜,九月下旬面的厂反而薪资结果比较满意。当然也并不是说约晚投递越好,而是尽早准备好,尽早投递!如果没有准备好,适当晚一点也没有关系,机会留给有准备的人而不仅是早早等待的人。(但是也不能拖到九月中之类的,比如猿辅导直接取消了数分的第三批)
实习转正挂了还有提前批,提前批没了还有大把正式批的机会,正式批也没想去的就去找能转正的实习,找不到就找日常然后备战春招,天无绝人之路(ps 春招说不定比秋招薪资高
面过的公司+流程时间(下方有面经):
1. 猿辅导-数据分析(第二批,一周一面,共三轮技术+业务面,无hr面)
2. 美团-快驴-商业分析(忘了9月什么时候面的,一周一面,两轮业务面)
3. 快手-策略产品经理(风控的,8月中就拿了)
4. 拼多多-拼越计划-数据分析(8月面的,两轮技术面,未加面,9.27意向书)
5. 字节data-数据分析(二面秒挂,游戏数分笔试挂)
6. Bigo-数据分析(9.22一面完,9.27二面,10.9三面,10.15 hr面)
7. 腾讯wxg-数据分析(9.23初试,9.24复试,9.25三面,9.30面委会面,10.13 hr面)
8. Oppo-数据分析(两轮技术面?,玄学面试,毫无内容可言,9.24hr面完泡池子排序,“荣幸”地成为备胎)
很快就面挂掉的,没写面经:
1. 腾讯视频-数据分析(9.3转推荐的,岗位职责是数据开发,面试题全是什么hadoop优先队列spark,完全不会!秒挂)
2. 网易互娱-数据分析工程师(8月初me计划一面挂,秋招第一场面试,自己也没准备好,面的也很不愉快,挂的合情合理,拒绝回忆面经= =)
3. 招联金融-风险管理(9.19一面挂的= =,往事随风已释怀,问了很多东西,都是风控相关的,想了解可以私戳)
其他没有面试的:
1. 笔试挂:网易云音乐、滴滴、京东(笔试没挂,但是也没有安排面试555)、微保、微众
2. 简历挂:b站(800:1的录取比,是天选之子才有资格得到的机会!不过今年b站撕意向书,我先骂了)
仿佛不招人的公司:哈喽出行、触宝、马上金融(这个还是招人滴)、shein、珍爱网……
其他有数分但是忘记投的公司:富途、度小满金融、唯品会、酷狗、同花顺、小红书、58、携程……
部分面经(不分几面,只记了经典题目):
一. 猿辅导数分
1. 最常用app、设计指标体系
2. 试听课的转化率如何提高
3. 怎么证明使用朋友圈频率越高的用户,越不容易流失
4. 怎么预测腾讯视频下一季度的会员购买人数
5. 如果生女孩就一直生下去,直到生到男孩为止,多年后男女比例(几何分布求期望)
6. 圆上三点构成的三角形包含圆心的概率
7. 解释临界值和p-value
8. sql三题,都是很简单的,用到lead() over、dense_rank() over即可
9. 机器学习相关,简单介绍随机森林和gbdt(从决策树讲起)
10. 共线性如何解决(因子分析)
二. 美团快驴商分
1. 这个基本纯聊天了,主要问简历
2. 商分数分区别
3. 美团快驴和传统的互联网产品,比如抖音的区别
4. sql:按营业额倒序,累计超过3000w的前面的所有公司,用sum() over
5. 直播平台做电商和电商平台做直播,哪个更有优势,为什么
三. 拼多多数分
1. python求阶乘后面0的个数(leetcode有原题,但是当时不记得了)
2. sort by 和order by的区别
3. 如果group by的key中有null,会怎么样
4. 机器学习相关问题,简单介绍lightgbm
5. 共享代码框,把机器学习建模,包括数据处理、one-hot、标准化等等操作的函数写下来,然后边写边讲解
6. 日活下降异常分析
四. oppo数据分析
1. 面试有点莫名其妙,第一面没问啥,面试官问“你有什么想展示的我没问到的呢”,我无语凝噎
2. 第二面问了什么,同事A和B都有一个很重要,但是要花两天才能做完的活找你,要你两天内做出来,你怎么办????????
3. oppo要去线下门店采访路人,你觉得你一天能采访几个,你怎么开场,怎么吸引人参加你的调研???????
4. 其他基本简历面了,就挺玄学
五. 字节data数分
1. 挂的比较早,不太记得啦,主要还是简历面,问简历中用的xx模型如何优化
2. 为什么豆瓣首页是默认关注,微博是默认推荐?(觉得很奇怪,扯不出来,面完发现面试官说反了!!!???)
3. 如何用abtest检验是默认关注内容好,还是默认推荐内容好,有哪些指标需要检验
4. 给b站设计指标体系
5. 面试官说问个概率论题吧,甲乙两人出硬币,如果是甲正乙反,甲给乙3远,甲反乙正,甲给乙1元,其他情况乙给甲2元,给甲设计策略,保证一定赚钱(这是概率论吗??这不是博弈论了???然后秒挂hh
六. Bigo数分
1. 口述sql,窗口函数啦
2. 讲讲abtest、假设检验
3. qq音乐付费金额下降分析
4. 直播app日活突然下降和逐渐下降分析
5. abtest如何抽样保证分布相似(我不会,我弱弱的说了句哈希?面试官立马就说,对!
6. 讲解辛普森悖论
7. 标准误和标准差区别
8. python的四个基本数据类型对比(dict、set、list、tuple)
9. z检验和t检验区别
10. 经典python题,求方差(口述)(以下是三面的)
11. 回归分析中的多重共线性是什么、为什么岭回归解决这个问题、除了岭回归呢、会导致什么结果
12. x^x求导(用ln变换
13. p-value解释
14. mle和贝叶斯估计解释、区别、怎么求贝叶斯估计、为什么贝叶斯要正比于共轭先验
15. 以手机号做key,第一种是当成数字排序,以中位数划分为两组样本,第二种是按尾号奇偶数划分两组,问哪个更均匀。
16. abtest相关(挺难的,没真的做过abtest,题目都不太理解,也get不到答案555
面下来就一个感觉,面试官都是猿辅导跳槽来的吗??!!比yfd还yfd!!!
七. wxg数分
1. 一面
其他就问问简历,纯做题了
2. 二面
(python,第二问其实是脑经急转弯)
python写冒泡排序、2*2矩阵求逆(追问计算机怎么求逆矩阵?)、给出二叉树前中后序遍历还原二叉树(追问是否三个遍历结果都需要?)、超几何分布概率题(很简单)、问了数据倾斜
3. 三面:python写求三次根(用二分写的,被怼你没学过数值分析吗,哦原来可以用牛顿法),一道sql(就记得好难,只会用不等值连接555),口述svm,如何预测微信支付接下来12个月每个月的活跃用户数,abtest相关,t检验z检验区别,每次回答就被质问还有吗,然后呢,这就是来自大佬的压迫感吧。。。
4.四面:面委面,遇到一个超级大佬的感觉,其实也没问啥,就问了一下abtest(如何设计abtest系统,wen'de),置信区间怎么求,什么时候适合用t检验,对数据分析的看法呀,然后反问面试官问题,面试官独自讲了20min……受教了(抱拳
八. 互联网风控常见问题
1. 识别刷单
2. 识别薅羊毛
3. 如何从淘宝分享链接到微信的(只有分享链接和动作的)信息,找到刷单的用户和商家
4. 识别导流
九. hr面常见问题
1. 优缺点>>非常难说,通常就打哈哈说,讲一个自己的特点吧,既有好的一面又有不好的一面,水过去
2. 职业规划
3. 讲一件团队合作的例子,遇到了什么冲突,怎么解决(主要看性格,有的部门想要强硬的,有的想要好说话的,搞不懂hh)
4. 对于技术岗,hr会问简历上一些比较久远的比赛、项目,主要问在里面是什么角色,遇到了什么困难,如何解决,学到了什么
对于非互联网的一点点浅薄的看法:
作为一个笔试面试金融科技都没能撑过一面的人,毫无发言权,一个是因为没有对口实习,也没有对口的专业,还有一个就是简历太多互联网的东西了。证券银行和互联网区别比较大,个人感觉在简历方面,银行会更注重校内社团活动、校内论文成果,并且有多个互联网实习其实相对有些减分emmm。
要准备一些:如何看待互联网&传统银行金融的区别、为什么选择金融不选择互联网……这类的问题。
关于暑期+秋招的一点点拙见:
1. 暑期转正是最好的结果!如果结果未知难以把握,尽量早点开始准备秋招,边实习边秋招真的不太行(大佬除外),全身心投入准备秋招收获会比较大,心态也很重要。
2. 早点苟到一个offer(不管是什么公司什么岗位什么地点),有一个保底,心态会好很多。
3. 最想去的公司,最好不要最早就投了,个人前几次面的巨烂,可以先找一些意向不那么强烈的试试水(危险发言)
4. 大部分数据分析的要求=基本机器学习算法(各个算法通俗解释、xgb和lgbm对比是顶配了)+python(回溯、动态规划、快速排序是顶配了)+sql(至少会用窗口函数)+产品sense(人人都是产品经理学习)+互联网大/中厂实习经历+概率论/各种假设检验/智力题。这些都能做到基本无敌了5555555555555,我是做不到的(躺平。。。不过大部分公司对数分的要求就是:产品sense+sql能力+统计学能力,某些公司会在这些基础上+机器学习(比如鹅),有的会加很多概率论(比如yfd),但是数分基本都离不开产品sense。
5. 很多面试官会问,你对数据分析师职责的认识、职业发展的规划,此处我也没有一个很好的回答,总之用心想想吧T T
数分学习:
数分学习路径:
接着上面第四点说~
必学part:概率论、数理统计、python基础(有哪些数据结构,pandas/numpy常用函数)、sql(通常是hive sql,查询+简单优化)、产品思维、ABtest
加分part:机器学习、数据结构、生物统计、数据开发/数仓相关(本人也不咋懂
1. 机器学习:
1.1 参考书:统计学习方法(李航)+机器学习西瓜书(周志华)
1.2 基本机器学习算法:线性回归、LR、SVM、PCA、因子分析、决策树、随机森林、boosting(adaboost、xgb、lgbm)、朴素贝叶斯、em算法、解决数据不平衡(欠采样、过采样、异常检测、模型调参)
1.3 数据处理:缺失值处理、异常值处理/平滑、连续数据分箱/离散化、one-hot/label-encoder、规范化/标准化、共线性处理、特征选择
1.4 深度学习:真滴一点都不会,最基本的就是dnn、cnn、rnn、lstm?
2. python:一开始想做挖掘,在lc断断续续刷了不到一百题,发现真的不是这块料,遂放弃哈哈哈,主要掌握回溯、动态回归、简单了解二叉树、队列、栈、BFS、DFS、七大排序算法(快排最重要)(我是没有掌握的555)
3. sql:一般的查询能力(能多表连接、各种窗口函数,实习会比刷题学的快!)+了解数据倾斜&解决办法,可能偶尔遇到问mysql、hive、spark对比。关于sql刷题,leetcode或牛客都可以,牛客的题从建表、插入查询多个方面都有涉及,网易互娱数分工程师笔试有遇到原题,但是题也比较基础,一天就刷完了,进阶的话建议leetcode走起(不过免费的题很少),再进阶就在牛客看各大厂的面经吧。
4. 产品sense:看人人都是产品经理学,还有些相关书籍,网上搜搜就有辽。常见问题:日活异常分析、如何提高销量,这块可以多看看面经,收集一些常见题目。
5. 实习:建议至少一段中/大厂实习三个月以上,至于怎么找实习,可以网上做比赛做项目/把成绩搞好,换第一份,有了第一份第二份就好找很多,当然也可以绕绕弯路,从无任何要求的打杂实习一路换上来。
6. 概率论/假设检验:
6.1 概率论:离散/连续概率分布/密度函数、期望方差、大数定律、中心极限定理、贝叶斯公式
6.2 假设检验:alpha/beta/临界值/p-value/置信区间/置信水平定义、大样本z检验、小样本/方差未知t检验、二项分布趋于正态分布的检验(这里我自己也没搞得特别清楚)、小样本非参数检验/精确检验、列联表卡方检验、单因素ANOVA(推荐看数理统计的专业课书籍,如果要面对统计要求更高的厂,建议学一下生物统计相关书籍,要了解一下非参检验如wilcoxon符号秩/秩和检验,以及小样本的精确检验)
6.3 ABtest:从知乎csdn博客园简书自学的,需要了解样本量是怎么确定的,什么数据用什么检验
6.4 智力题:多看面经吧~
数分职业规划:
接上面第5点~
数分职业规划,在面某公司的时候反问了面试官,听了他的答案豁然开朗~
原话:公司在不同的发展阶段对数据分析师的职责要求也是不一样的,将公司分为0-1、1-10、10-100、100+这四个阶段,在0-1阶段会承接一些底层的东西,需要一些数仓能力,在1-10、10-100阶段可能是商业分析or我们认知的数据分析,在100+阶段比如鹅/阿里,追求的是效率优化等等,可能更多的需求是数据科学家的角色。
上面列了很多我个人觉得重要的,但是我自己也没有都搞懂哈哈哈,身体力行展示什么是懂得很多道理依然过不好这一生。不过以当前水平能拿到喜欢的中厂意向书真的很满足了!!
秋招还在进行时,机会很多!!!没有offer不要灰心,九月份投递为时也不晚!!祝大家都有心仪的offer!!
其他想到了再补充~