携程:大数据分析师 一面
8.31下午17:30一面
面试官人特别好,我答不上来的问题会诱导我回答,然而我还是答得稀巴烂
1、介绍你自己
2、做过这些实习中,选一个你比较得意的项目讲一下(我选了一个广告投放优化的分析经历)
3、你们这个广告投放主要运用了哪些数据分析方法(漏斗分析,ab测试)
4、ab测试?你们怎么做灰度测试?(不做灰度测试,只是改bannder然后选一个最高的ctr作为最佳方案,对不同banner执行相同操作)
5、如何判断你们ab测试所确定的广告投放方案的效果是否显著?(我没答上)
6、假如说我们一个指标下降了30%,怎么分析?(我一通胡言乱语,感觉不是面试官想要的答案)
7、那你举个例子吧,在你的数据分析工作中,是如何解决指标下降很多的问题?(我举例,然后balabala,貌似是面试官想要的答案)
8、说一下使用线性回归模型要满足什么条件(应该是不存在多重共线性,我答的是特征矩阵满秩,特征之间不相关)
9、你有没有系统学过统计学?我问了2个统计学问题你都没答上(我说没有,统计学不是我专业课,我专业的强化学习、深度学习、机器学习涉及到统计学知识,考研考概率论)
10、哦,那你说一个机器学习项目的经历把(我说了一个数据挖掘比赛的经历,那个用到了随机森林回归模型)
11、说一下你理解的随机森林模型(集成模型,以不纯度为指标选择特征、为了泛化误差尽量小可以剪枝、限制树模型最大深度、限制父节点到子节点间的不纯度降幅。)
12、如何判断你回归的效果?(我说用R平方判断)
13、如何定义R平方(我说R平方=1-u/v,u=y实际-y估计 的平方 v=y平均-y估计 的平方 (可能记错了?)R平方越接近1 就说明u越小 v越大 则回归的误差也越小)
14、即兴出了2道SQL,大概的就是分5个模块,每个模块有许多个数字,找出数字之和最大的模块,并求这个模块中最大的数字(面试官引导我用子查询写了一次,又用非子查询写了一次)
15、平常用Python情况如何?(Numpy、Pandas、Sickit-learn的常用模型的调参都可以)
16、如何在Pandas里面实现SQL的join功能?(我说pd.concat (其实应该是pd.merge),on=column how=left就是left join ascending=False就是降序)
17、写一下冒泡排序(我在想首先生成一个随机的数列,然后再排序,然而我卡在随机数列生成这里了,卡了大概5秒,面试官说没事,下一个问题)
18、给你一个series,用2种方法,把里面的元素变成原来的平方+5(我说 series.apply(lambda x:) 还有就是 得到serie的长度,然后循环,把每个元素 x**2+5)
19、说一下map函数?(我说和vlookup差不多,面试官笑了…)
20、反问(我问了下您是做什么方向的业务,答:面试官的部门不一定就是未来你入职的部门)
#面经##校招##携程##数据分析师#