猿辅导数据分析一面凉透经
海外党伤不起。
凌晨三点多惊醒做了个笔试,然后六点一面。
面试官感觉很着急问问题的样子,但是问得特别全面,我第一次遇到这么全面的。
1. 自我介绍
2. 简历深挖,时间序列如何评估稳定性,ACF和PACF
3. 一个模型最后结果R方值很大,可以说明模型很好吗,为什么?
然后让我叙述模型的评估过程,评估方法,我真的不会,如果有会的,求分享资源,我去学学。
ROC曲线问题:得到了样本概率结果(模型结果)和真实分类情况,描述怎么画出ROC曲线,我说就根据概念酸楚TPR和FPR就行了,条件很全。他说关键就是怎么求TPR FPR,我就晕了,我总感觉条件很完美了。有人知道求告诉一下,感谢。
4. 假设检验,概率分布,原谅我真的当时困的一点精神没有,脑子都不转,让简述了解的概率分布,问了正态分布和泊松分布关系,t分布和正态分布的关系,我统计很差估计答得很烂
5. 一个贝叶斯的题:
某城市发生了一起汽车撞人逃跑事件,该城市只有两种颜色的车,蓝20%绿80%,事发时现场有一个目击者,他指证是蓝车,但是根据专家在现场分析,当时那种条件能看正确的可能性是80%,那么,肇事的车是蓝车的概率是多少?
某城市发生了一起汽车撞人逃跑事件,该城市只有两种颜色的车,蓝20%绿80%,事发时现场有一个目击者,他指证是蓝车,但是根据专家在现场分析,当时那种条件能看正确的可能性是80%,那么,肇事的车是蓝车的概率是多少?
但是他又问我,如果想确切知道这个数据,在实际情况下还需要什么条件,或者还需要知道什么数据
6. SQL: 有一个表 order_id, userid, goods_type, paid_time (还有个字段忘了是啥了但是这个题没用),对于每个goods_type, 每一个user_id只能购买一次,如果对于某个goods_type下,存在userid购买多次,则输出除了第一次购买之后的所有购买订单的order_id. 不算难,我少有会的题,我的做法是先group by userid, goods_type, 求出所有count(order_id)>1的userid, goods_type, min(paid_time),然后在总表查询输出paid_time不在我自查询结果里的就ok
7. 业务题:一个辛普森悖论题:有一天,在语文数学英语三门课上,二年级的出勤率都比三年级高,但是总出勤率三年级比二年级高,请问是为什么。我知道是辛普森悖论,但是当时脑子已经不会思考了,就没说出来为什么,求大佬告知。
总体来说,看反应应该是凉了,欠缺的还很多,这里面的问题除了sql我都不太会,入门不太久,如果有会的求讨论和指导,万分感谢。
#面经##数据分析师##校招#