阿里 数据分析三面
45min
就很tough 应该是凉了。。 因为好多问题都不知道怎么回答,欢迎大家提出一些想法
1.谈一个你学到的最多的项目
2.为什么你的数据可以对标签进行预测呢?(这个问题就很。。不知道咋回答)
3.模型的X和y分别是什么
4.X中是否包含时间信息,若不包含,那是否会预测结果有偏差呢
我说对的,应该考虑时序模型
5.那时序模型比如GRU它是怎么考虑这个时间信息的呢
6.数据预处理的过程,如何进行缺失值的处理
7.刚刚提到knn插值填补数据,那如果选取的k近邻个数据也存在缺失值怎么办呢
8.随机森林的是怎么工作的,为什么要进行随机抽样
9.随机森林提取的m个特征维度是如何进行挑选的,要选哪些特征
10.如果要向用户展示precision和recall,你会选择哪个
欢迎大家解答以上问题😢
#面经##阿里巴巴##数据分析师#
就很tough 应该是凉了。。 因为好多问题都不知道怎么回答,欢迎大家提出一些想法
1.谈一个你学到的最多的项目
2.为什么你的数据可以对标签进行预测呢?(这个问题就很。。不知道咋回答)
3.模型的X和y分别是什么
4.X中是否包含时间信息,若不包含,那是否会预测结果有偏差呢
我说对的,应该考虑时序模型
5.那时序模型比如GRU它是怎么考虑这个时间信息的呢
6.数据预处理的过程,如何进行缺失值的处理
7.刚刚提到knn插值填补数据,那如果选取的k近邻个数据也存在缺失值怎么办呢
8.随机森林的是怎么工作的,为什么要进行随机抽样
9.随机森林提取的m个特征维度是如何进行挑选的,要选哪些特征
10.如果要向用户展示precision和recall,你会选择哪个
欢迎大家解答以上问题😢
#面经##阿里巴巴##数据分析师#