首页 > 试题广场 >

当发现机器学习模型过拟合时,以下操作正确的是:()

[不定项选择题]
当发现机器学习模型过拟合时,以下操作正确的是:()
  • 降低特征维度
  • 增加样本数量
  • 添加正则项
  • 增加特征维度
造成过拟合两个因素:1、数据量少  2、模型复杂度过高
发表于 2019-08-27 16:17:12 回复(0)

A也可以

因为维度不断增加就会增加整个数据空间的稀疏性,这样就更容易找到分类的超平面,所以降低维度可以帮助降低过拟合

发表于 2019-09-06 17:45:55 回复(0)
过拟合引发原因:训练数据太少/模型太复杂/参数过多/噪声过多 解决方法: 1、获得更多的训练数据集 2、降低特征维度 3、正则化,在训练的时候限制权值变大 4、dropout 5、早停 hold out 6、数据清洗
发表于 2021-10-25 17:18:04 回复(0)
数据量少的时候减少特征可以
模型复杂度过高的时候减少特征可以

原来真的是减少特征可以治过拟合!
发表于 2020-10-23 20:10:29 回复(0)

降低过拟合风险的方法有:

1.增加训练数据。增加训练数据可以使得模型学习到更多的潜在特征,从而减少噪声的影响。
2.降低模型复杂度。当训练数据较少,过于复杂的模型是产生过拟合的主要因素。适当降低模型复杂度可以避免拟合过多的采样噪声。
3.添加正则项。给模型的参数加上的一定的正则约束。
4.集成学习。集成学习是将多个模型集成在一起,从而避免单一模型带来的过拟合风险。比如bagging算法。

降低欠拟合风险的方法有:
1.添加新的特征。当特征不足或者现有特征和样本标签相关性不强时,模型容易出现欠拟合。通过挖掘“上下文特征、ID类特征、组合特征等新的特征,往往能够取得更好的效果。
2.增加模型复杂度。简单的模型的学习能力较差,通过增加模型复杂度可以使模型拥有更强的拟合能力。例如,在线性模型中增加高次项,在神经网络中添加网络层数或者增加神经元的个数。
3.减小正则化系数。正则项是用来防止过拟合的。但是当模型出现欠拟合时,则需要针对性地减小正则化系数。

本题中的A选项:减少特征数量。由于增加特征数量可以防止欠拟合。反过来,减少特征数量就可以降低过拟合风险。B选项增加样本数量,C选项添加正则项均是降低过拟合风险的方法。D选项增加特征维度,其实是增加特征数量,是用来防止欠拟合的方法。
发表于 2023-08-28 09:43:53 回复(0)
我个人觉得第二个选项不应该作为答案,假设我把原训练样本复制一份重新添加到训练集,模型仍旧会表现出过拟合。
发表于 2023-04-01 21:10:08 回复(0)