bg:本人一年半左右工作经验,目前已OC,给出一些现阶段数据挖掘相关岗位的面试经验题,方便大家学习。常问面试题:(1)如何解决模型过拟合问题(2)描述一下xx项目的大致流程(3)你认为在项目中还有哪些不足与改进的地方(4)讲述一下transformers的原理,为什么要采用多头注意力机制,为什么要采用掩码(5)如何处理偏态分布数据(6)如何对异常值、缺失值数据进行处理(7)xgboost与gbdt的区别(9)如果数据量过少,是采用增加特征的方式还是减少特征的方式(10)最开始接触项目的时候最棘手的问题是什么(11)lightgbm为什么计算速度会比较快(12)深度学习loss在某个点处振荡而不收敛是什么原因(13)保存parquet文件和保存为excel、csv等文件有什么区别(14)什么是f1值,f1-score的计算公式(15)xx模型的输入输出是什么(16)如果让你来进行一个机器学习模型的构建,使之效果为良,大概需要多长时间#面试# #面试常问题系列# #数据挖掘# #算法#