猿辅导搜集面经
作者:D_lotus
链接:https://www.nowcoder.com/discuss/391122
来源:牛客网
一面(40min)
1.LR损失函数是什么?怎么来的?为什么这样?
我回答假设Y服从二项分布下用极大似然推导的,他就问为什么要用极大似然
我从极大似然概念和指数分布族(LR,线性回归,Softmax)算法解释了
2.SQL
User_id,subject_id,score
(1)求每个学科下的学生平均分数
(2)求每个学科下最高分数的学生
3.贝叶斯公式和三扇门的问题
4.数据库索引有哪些类型?建过什么索引
5.Linux-如何查看一个文件的总行数
6.正则表达式-如何匹配13位电话号码
7.AB实验:如何处理多个实验并行的情况
答:正交试验
8.解释下正交试验原理
9.ABTest的原理和流程
二面(1h)
自我介绍
1.简历相关 怎么量化用户体验的,说说我的贡献在哪里
2.XgBoost的原理,与GBDT的区别
3.GBDT是否是贪心算法
4.怎么处理过拟合
5.不同班级数学成绩排名前五的学生信息SQL,rank和dense_rank的区别
6.Hive或者Python实现 一个数据处理问题 我选的Python
7.新的商品详情页上线,灰度20%,设计何种指标反映上线后的效果,如何检验效果的显著性
8.如果分成10个群体,检验群体之间的广告点击率的差异,用什么统计方法
答方差分析,然后问方差分析的原理
8.各种检验的条件和应用场景(z,t,卡方,f)
9.说说你了解的随机变量分布(分离散和连续)
10.解释下EM算法
11.假设检验的流程 ABTest用什么检验
12.圆内选择三个点,这三个点组成的三角形是锐角三角形的概率
13.矩估计和极大似然估计的区别和联系是什么
14.二项分布与泊松分布的联系
三面(40min)
1.SQL题:已知user_id,dt,class_id,求1001~1010之间每天都做新题的人数
2.一块圆形蛋糕,蛋糕边缘有一个点,从原点出发切2刀,蛋糕分成2个扇形,求包含点的一块蛋糕的面积的期望
3.非参数检验与参数检验的区别
4.如何比较两个分布之间的差异?答ks检验 然后问前提条件是什么
5.说说知道的随机变量分布
6.泊松分布 举个例子
7.篮球投篮满足泊松分布吗?为什么?
四面-总监面(30min)
1.介绍下实习做了哪些事,介绍下自己接触的业务
2.报表指标是怎么确定的,有哪些维度?
3.计算指标有什么约束吗?我一脸懵逼,说了平时取数的几个SQLwhere条件。。。。
4.有什么问题要问他的?
5.什么时候能来实习