2020-02-23 13:01 已编辑门头沟学院算法工程师

关注

什么是过拟合、欠拟合以及对应措施

原

大白话给你说清楚什么是过拟合、欠拟合以及对应措施

																														</div>
			<div class="operating">
													</div>
		</div>
	</div>
</div>
<article class="baidu_pl">
	<div id="article_content" class="article_content clearfix csdn-tracking-statistics" data-pid="blog" data-mod="popu_307" data-dsm="post">
							<div class="article-copyright">
				版权声明：本文为博主原创文章，未经博主允许不得转载。					https://blog.csdn.net/qq_18254385/article/details/78428887				</div>
							            <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-d7e2a68c7c.css">
					<div class="htmledit_views" id="content_views">

开始我是很难弄懂什么是过拟合，什么是欠拟合以及造成两者的各自原因以及相应的解决办法，学习了一段时间机器学习和深度学习后，分享下自己的观点，方便初学者能很好很形象地理解上面的问题，同时如果有误的地方希望大家在评论区留下你们的砖头，我会进行纠正。

无论在机器学习还是深度学习建模当中都可能会遇到两种最常见结果，一种叫过拟合（over-fitting ）另外一种叫欠拟合（under-fitting）。

首先谈谈什么是过拟合呢？什么又是欠拟合呢？网上很直接的图片理解如下：

所谓过拟合（over-fitting）其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在验证数据集以及测试数据集中表现不佳。打个比喻就是当我需要建立好一个模型之后，比如是识别一只狗狗的模型，我需要对这个模型进行训练。恰好，我训练样本中的所有训练图片都是二哈，那么经过多次迭代训练之后，模型训练好了，并且在训练集中表现得很好。基本上二哈身上的所有特点都涵括进去，那么问题来了！假如我的测试样本是一只金毛呢？将一只金毛的测试样本放进这个识别狗狗的模型中，很有可能模型最后输出的结果就是金毛不是一条狗（因为这个模型基本上是按照二哈的特征去打造的）。所以这样就造成了模型过拟合，虽然在训练集上表现得很好，但是在测试集中表现得恰好相反，在性能的角度上讲就是协方差过大（variance is large），同样在测试集上的损失函数（cost function）会表现得很大。

所谓欠拟合呢（under-fitting）？相对过拟合欠拟合还是比较容易理解。还是拿刚才的模型来说，可能二哈被提取的特征比较少，导致训练出来的模型不能很好地匹配，表现得很差，甚至二哈都无法识别。

那么问题来了，我们需要怎么去解决过拟合和欠拟合的问题呢？？

过拟合：

首先我们从上面我们可以知道，造成过拟合的原因有可以归结为：参数过多。那么我们需要做的事情就是减少参数，这里有两种办法：

1、回想下我们的模型，假如我们采用梯度下降算法将模型中的损失函数不断减少，那么最终我们会在一定范围内求出最优解，最后损失函数不断趋近0。那么我们可以在所定义的损失函数后面加入一项永不为0的部分，那么最后经过不断优化损失函数还是会存在。其实这就是所谓的“正则化”。

下面这张图片就是加入了正则化（regulation）之后的损失函数。这里m是样本数目，landa（后面我用“t”表示，实在是打不出）表示的是正则化系数。

注意：当t（landa）过大时，则会导致后面部分权重比加大，那么最终损失函数过大，从而导致欠拟合

当t（landa）过小时，甚至为0，导致过拟合。

2、对于神经网络，参数膨胀原因可能是因为随着网路深度的增加，同时参数也不断增加，并且增加速度、规模都很大。那么可以采取减少神经网络规模（深度）的方法。也可以用一种叫dropout的方法。dropout的思想是当一组参数经过某一层神经元的时候，去掉这一层上的一部分神经元，让参数只经过一部分神经元进行计算。注意这里的去掉并不是真正意义上的去除，只是让参数不经过一部分神经元计算而已。

另外增大训练样本规模同样也可以防止过拟合。

欠拟合：

其实个人觉得欠拟合基本上都会发生在训练刚开始的时候，经过不断训练之后欠拟合应该不怎么考虑了。。但是如果真的还是存在的话，可以通过增加网络复杂度或者在模型中增加多点特征点，这些都是很好解决欠拟合的方法。

全部评论

推荐最新楼层

11-25 00:16

四川大学供应链专员

秋招的我，真是快要崩溃了

之前我还算能沉得住气，面试虽然挂了，但总觉得机会会来。可到了现在，我的焦虑开始疯狂蔓延，身边的人一个个拿到高薪offer，心里难免受到影响。每次面试后，我都在反复琢磨面试官的每一句话，觉得自己哪里都不够好。求助大家，如何调整心态？秋招不行，春招还能有希望吗？

牛客创作赏金赛

点赞评论收藏

11-26 11:35

已编辑

华南农业大学后端

快手后端开发秋招一面面经

时间：50min这次面试更加侧重底层原理，问的都是计网和os。八股计网键入网址到网页显示，期间发生了什么？tcp三次握手的过程？为什么是三次握手？不是两次？OS你对操作系统的理解？你对锁的理解？平时是怎么使用锁？比如关键字还是工具？什么是用户态和内核态？为什么要有用户态和内核态？只有一个内核态不行么？内存管理主要做了什么？算法反转链表2

查看9道真题和解析软件开发笔面经牛客创作赏金赛

点赞评论收藏

10-10 21:40

门头沟学院前端工程师

你们出生产事故了？

哪个程序员要背绩效了？

Java抽象带篮子：难蚌，点进图片上面就是我的大头😆

点赞评论收藏

10-11 16:32

早稲田大学人工智能

今日首绷-代写

不是哥们儿

与火：这不接？留子的钱不挣白不挣

点赞评论收藏

11-28 18:05

杭州电子科技大学 Java

经常一起加班也会产生“吊桥效应”

我发现那些和我一起经常加班、通宵赶deadline的小组同事，相比于到点就下班的同事关系来说，我们的团队感会更强，甚至某些人之间还会有些暧昧，而且在离职之后我们之间的关系也会保存的更久一些，就像那种共患难过的战友般的情谊。 但是…这种“共患难”没必要，我宁愿孤独… …

点赞评论收藏

全站热榜

正在热议

# 实习想申请秋招offer，能不能argue薪资 #

# 25届机械人为了秋招做了哪些准备？ #