京东算法面经(实习)
1、做数据分析选特征的时候有哪些评判指标?
2、用过哪些特征相关度的指标?
3、XGB+LR,XGB充当什么角色?
4、为什么XGB+LR可以提高模型效果?
5、如何在XGB模型选择树的棵树时早停?
6、XGB的损失函数进行了二阶泰勒展开,为什么可以用泰勒展开?为什么用二阶而不是三阶四阶?
7、如何解决样本不均衡问题?
8、class_weight的思想是什么?
9、提高正样本的权重,会不会提高过拟合?如果会的话,如何解决?
10、特征工程预处理的流程?
11、标准化的原理?
12、标准化的适用场景、不适应场景?
13、所有模型都要求对数据进行标准化么?
#实习##京东##算法工程师#