pdd拼越计划 数据分析 一面面经~出炉!
拼多多一面 网卡来卡去 面了1个半小时
正经讲之前,我又想说几句闲话....
pdd用的自己的面试系统,如果面试官没上线,是无法进入的。我可能提前5分钟到了那个界面,然后显示面试管未上线,我就一直等着,等到面试时间都过了10分钟,我想着咋还没上呢,于是刷新了一下....然后....发现是自己断网了!(所以页面一直没有更新)于是...我又是一次迟到了10多分钟的面试...(哎,咋总这样)
所以,朋友们,记得多刷新🤣
然后夸一下面试官,脾气很好。后来我的网疯狂断,基本上断断续续听完面试官的话以后,我刚开始讲,没讲几句,一看屏幕(我的摄像头在键盘下😂),我已离线(内心崩溃)...然后有联网、刷新、跟面试官道歉,就这样搞了非常多次(我自己都快崩溃了,超级怕哪次我再断网重新上线的时候,显示面试管已退出面试结束...),面试官提出和我微信语音以后,情况才好了一点。
然后我一共面了一个半小时🤣。
开始正经内容:
1、自我介绍
2、讲项目。然后问机器学习方面的内容。
介绍项目(中间你讲的时候,不会打断,听完再开始一个个问)。
比如对我,问了随机森林,原理是怎样的,怎样划分的。
后来扯到gini指标,又问那回归情况下用什么指标之类的。
降维的方法有哪些。(同事,讲原理)
后面模型预测,用到集成方法。能说下有哪些,原理,并且他们代表的算法有什么
评价指标有哪些,设计原理、公式。
3、讲实习。然后问业务方面内容。
问实习,干了啥(中间打断了,可能我讲的混乱不清没有目的性,面试官让我说明检测的目的)比方,一个时间序列的数据,很多维指标,我要看一个指标是否异常,怎么看。
一个指标数据,用箱型图看异常,怎么看,箱型图有哪些统计参数。异常的那个虚线怎么设计。
你有一个方案,发现他可以降低刷单情况,你想实施这个方案,怎么说服运营人员?
4、写代码
sql题
一个表,有log_id,mall_id,log_time, status(取0或1)
(1)取mall_id,保证该mall_id最后时间的status是0 (2)问最后连续是0的log_id
(sql题后来时间到了,第二题我还是没有想出来。最后可能我有点遗憾吧,面试官还安慰我,没关系的这题本来就比较难...真的是暖男呀!)
p.s.:
感觉暑期的时候没怎么好好面过数据分析。现在的感受,不知道因为我简历里有机器学习、算法的内容,还是现在的数分都是这样,反正问机器学习那些问的挺多的(而且会先问,我挺惊讶的)
本周一面试的,目前还没有二面通知,不知道是挂了还是怎么...
希望给我一个二面吧!本菜鸡还没有体验过二面呢!😫
8.23 -------------------------上次写完发现有疏漏 来更新一下~
5、大数据处理
(其实我没用过,结果作死的写了,然后面试官就问了)。数据倾斜怎么办?
(反正我围绕mapreduce讲了一下)
----------前几天收到二面通知了~
等二面完我再写一个帖子。
最近都没有时间准备面试,各种笔试做的惨惨的.....
#面经##校招##数据分析师#