猿辅导数据分析(二面凉)
一面:
1、自我介绍
2、sql:第二问数据在A表,最后效果要如同B,第一问就是找出每个课程的最高分
3、python:给出如下代码,说出输出结果
x = [[1,12,15],[12,1,13],[0,5,8]] a = [] b = [] for xi in x: for xij in xi: if xij in a: temp_xij = b[a.index(xij)] b[a.index(xij)] = temp_xij + 1 else: a += [xij] b += [1] for i in range(len(a)): print(a[i] , end = ':') print(b[i] , end = '\n')4、P值的意义,第一类和第二类错误的定义是什么?
5、商城每天的人流量属于什么分布,泊松分布和二项分布的关系
6、猿辅导在抖音上线一个视频,首页就有优惠券,点击优惠券的用户较多,但使用优惠券的用户较少,怎么分析
二面:
1、自我介绍
2、sql:找出连续7天都登陆的用户
3、抛硬币直到连续两次出现正面的概率,求扔的期望次数
4、泊松分布趋近二项分布的n和p大概是多少,这个值怎么来的
5、lstm的原理(简历里面有)
6、lstm和rdd的区别
7、词向量化有哪几种方法,word2vec的原理,word2vec和tf-idf的区别是什么