大华—数据挖掘 提前批
一面
- python的多线程、多进程怎么实现
- 会不会spark?(答不会)
- kmeans和kmeans++的区别
- 如果确定kmeans的k值(手肘法、轮廓系数法)
- 了不了解决策树、xgboost
- 逻辑回归和线性回归的区别
- 逻辑回归为什么用sigmod
- 逻辑回归如何实现多分类(ovo、ovr、softmax)
- sigmod公式
- python包pandas中,dataframe和series区别(基于简历问的)
- 讲一下AUC,roc曲线的横纵坐标
二面
-
介绍一下发表的论文(面试官想问我cnn rnn,但我都没接触过,就问了点gnn的东西)
-
介绍GAT
-
介绍一下逻辑回归
-
如何用逻辑回归实现多分类
-
节点分类时,类别之间难以区分,如何处理(我从节点特征处理方面回答,进行特征筛选等)
-
决策树、RF、XGBoost对比
-
决策树/RF/XGBoost调参过程
-
验证集有label,测试集无label,如何验证集和测试集数据分布是否一致
- python迭代器的底层