拼多多数据分析面经上海场
第一次写面***笔不太好,见谅哈
写面经是希望能跟大家讨论面试题,为下一次面试做准备(毕竟这次应该是凉了)
8.24上海,线下面一般都是走完全部流程,即两场技术+HR面
HR面:
1.为什么转专业(围绕本科专业聊了一会儿,也问了本科和研究生的成绩) #这里特别想请教,怎么回答转专业这个问题比较好
2.描述你的人格,有什么缺点,有什么需要改进的地方
3.父母职业
4.期望薪酬
5.能否接受拼多多的时间(大概是10点上班,8点下班,中间12点到1点休息,下午6点到7点休息,周六放假)
6.能否接受职业调剂
技术面一:(一个甜甜的小姐姐面的)
1.笔试的时候sql题修正(第二轮笔试的记录点击时间和金额的那个题,我的扣分点在于开窗的时机不对,应该先加一个where条件限定点击时间与下单时间的顺序,再开窗)
2.sql题
三个表 T1:good_id,cate_id T2:mall_id, good_id T3:mall_id, credti_score
问,在不同分类中,店铺的信用分前100和求top25%
答:先三个表join再groupby 店铺和分类,rownumber取前100。
top25%本来想用quantile函数,但小姐姐不让,所以算出每个分类下的店铺总数,然后top 25%*总数
3.路上有三种车,红黄蓝,黄车事故率很高,所以要换掉黄色。
问:对这个决策的看法
小姐姐的提示的答案: 从别的角度寻找事故高发的原因,把所有可能因素一起放到多元回归里面,看显著性再决定黄色是否是影响事故高发的原因
第二个方法是直接比较不同情况下的事故概率,例如将不同颜色的车和同一个年龄段的司机的事故概率放在一起比较(其实这个方法我没有听懂)
4.简历和实习的一些问题
技术面二:
1.问中位数、众数、平均数的差别,不允许说定义
答:先讲了一个数据左倾和右倾情况下的差别,面试官不满意。。。。
再举了一个应用场景不同的例子,面试官还是不满意。。。
2.问T检验应用场景
答:样本量小于30,样本方差已知,总体方差未知,
或求两个样本之间的均值是否有差异
面试官不满意。。。。
3.拉普拉斯系数怎么算(我真的没听过这个名词,也不确定面试官问的是不是这个,反正我不会)
4.sql
表:order_id, amount, date, user_id
求8.1到8.10,每天的消费总额排名前500到1000的用户的用户id
5.给一个课题,中国人和日本人的身高差异
题目就是如此简短,给十分钟思考,怎么做这个课题
(按照标准的实证研究的方法说了一遍,
他说我选取样本没有办法代表13亿人口,和1亿多人口的总体差别,
我答:如果我的样本与两个国家的***统计部门提供的样本均值样本方差一致,我认为我的样本可以代表1亿和13亿的总体
他怼:国家统计部门不一定可信啊,他们的结果也可能是错的,你拿错的东西对比较做出来的东西当然也是错的了
我内心:那你这13亿和1亿的人口总数说不定也是错的呢)
6.经典称砝码题,分治法
更新:
面了其他家之后,再回想拼多多三面的面试官
除了科班出身以及拿工作经验怼应届生的优越感,感受不到专业性和对应届生的尊重,除了怼还是怼
最后提问环节,我问:之前那几题的想要的回答是什么,他说,你自己去百度
我继续问:你觉得在数据分析的现阶段,传统的统计分析方法在工作中的具体用途是什么?
或者说我们已经能够获取接近整体的数据的今天,为什么还需要拿大数定理这种30个样本起步就可以用的定理去描述整体的情况。
然后他大概感受到被挑战了权威了吧,气急了就质问我有没有学过概率统计(其实楼主本科概率统计98分),
我说学过,他说那你的概率论老师要骂你了吧
我心想:我老师当时还挺喜欢我的,要骂我的人是你吧
秋招到了现在,已经不想跪着面试了,有的面试官也不过就赶上了当年的好时候,如果放在今年,也指不定上不了岸呢。