机器学习
1.逻辑回归
逻辑回归模型通常用来解决二分类问题,对解释变量与响应变量有线性的假设。可解释性强。但随着数据量的增加,会产生欠拟合现象
2.随机森林
随机森林是一个集成模型,基于决策树模型构造的。它通过对样本或者变量的n次随机采样,就可以得到n个样本量,对于每一个样本量,可以独立训练决策树模型,对于n个决策树模型的结果,通过集合策略来得到最终的输出。这n个决策树模型之间是相对独立的,并不是完全独立的,训练集之间是有交集的。
随机森林与梯度提升不需要对数据集做过多假设,能够处理比较复杂的问题。