猿辅导数据分析一面凉透经

海外党伤不起。
凌晨三点多惊醒做了个笔试,然后六点一面。
面试官感觉很着急问问题的样子,但是问得特别全面,我第一次遇到这么全面的。

1. 自我介绍
2. 简历深挖,时间序列如何评估稳定性,ACF和PACF
3. 一个模型最后结果R方值很大,可以说明模型很好吗,为什么?
然后让我叙述模型的评估过程,评估方法,我真的不会,如果有会的,求分享资源,我去学学。
ROC曲线问题:得到了样本概率结果(模型结果)和真实分类情况,描述怎么画出ROC曲线,我说就根据概念酸楚TPR和FPR就行了,条件很全。他说关键就是怎么求TPR FPR,我就晕了,我总感觉条件很完美了。有人知道求告诉一下,感谢。
4. 假设检验,概率分布,原谅我真的当时困的一点精神没有,脑子都不转,让简述了解的概率分布,问了正态分布和泊松分布关系,t分布和正态分布的关系,我统计很差估计答得很烂
5. 一个贝叶斯的题:
某城市发生了一起汽车撞人逃跑事件,该城市只有两种颜色的车,蓝20%绿80%,事发时现场有一个目击者,他指证是蓝车,但是根据专家在现场分析,当时那种条件能看正确的可能性是80%,那么,肇事的车是蓝车的概率是多少?
但是他又问我,如果想确切知道这个数据,在实际情况下还需要什么条件,或者还需要知道什么数据
6. SQL: 有一个表 order_id, userid, goods_type, paid_time (还有个字段忘了是啥了但是这个题没用),对于每个goods_type, 每一个user_id只能购买一次,如果对于某个goods_type下,存在userid购买多次,则输出除了第一次购买之后的所有购买订单的order_id. 不算难,我少有会的题,我的做法是先group by userid, goods_type, 求出所有count(order_id)>1的userid, goods_type, min(paid_time),然后在总表查询输出paid_time不在我自查询结果里的就ok
7. 业务题:一个辛普森悖论题:有一天,在语文数学英语三门课上,二年级的出勤率都比三年级高,但是总出勤率三年级比二年级高,请问是为什么。我知道是辛普森悖论,但是当时脑子已经不会思考了,就没说出来为什么,求大佬告知。

总体来说,看反应应该是凉了,欠缺的还很多,这里面的问题除了sql我都不太会,入门不太久,如果有会的求讨论和指导,万分感谢。
#面经##数据分析师##校招#
全部评论
5 https://zhuanlan.zhihu.com/p/42448375 感觉这个解释是对的
3 回复 分享
发布于 2020-08-16 13:57
3.模型评估的问题周志华西瓜书应该讲了,我也刚看这本记不太清… 7.辛普森悖论产生原因是两组样本的分配比例不同,比如这个例子可能是二年级语文很多但是三年级英语很多,然后英语的出勤率远高于语文 第5题不会答,求大佬告知😁
1 回复 分享
发布于 2020-08-16 13:25
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2020-08-16 11:04
可以多看看以前的面经,这些问题都是老题目了
点赞 回复 分享
发布于 2020-08-16 12:14
我感觉咱两是一个面试官,有几道问题是一模一样的
点赞 回复 分享
发布于 2020-08-17 10:18
7.
点赞 回复 分享
发布于 2020-08-21 09:36

相关推荐

10-11 17:30
湖南大学 C++
我已成为0offer的糕手:羡慕
点赞 评论 收藏
分享
12 82 评论
分享
牛客网
牛客企业服务