阿里:数据研发岗,估计挂了 一面: logistic regression的优缺点 问了硕士期间机器学习相关的论文和竞赛 决策树中有哪些参数,如何避免决策树的过拟合 XGboost的底层算法是什么(CART树) 对相似度的理解 如何进行特征筛选 如何衡量特征之间的相关性 偏差和方差 神经网络中激活函数的用处 深度学习中的问题(梯度消失和梯度爆炸) K-means的缺点 如果没有先验知识,如何确定K-means的参数 衡量K-means效果好坏的方法 二面: 说一下你参加的竞赛(比赛的介绍,如何确定你的模型,如何实现你的模型) 什么样的数据你会选择使用随机森林 随机森林相比决策树的优点有什...