面试的岗位叫 数据科学-抖音/直播/剪映 一面: 2021年10月20日 1.sql,有一张表,两个字段,用户id和手机号,手机号列每一个用户有三个手机号,逗号隔开。怎么把他转换成手机号列只有一个手机号,每一个用户占多行。 2.项目中用到了xgboost,问xgboost的特征重要性计算方法,列采样可以减小过拟合,还有哪些减小过拟合的方法 3.第一类错误和第二类错误 4.AB实验的原理 5.伯努利分布的方差 6.稀疏指标如何检验?不太懂。如果某个指标的总体不符合正态分布,想对这个指标做检验,怎么做。考察非参数检验,非参数检验的原理。 然后开始考察产品思维。。平时用什么ap...