2020-02-23 13:01 已编辑门头沟学院算法工程师

关注

什么是过拟合、欠拟合以及对应措施

原

大白话给你说清楚什么是过拟合、欠拟合以及对应措施

																														</div>
			<div class="operating">
													</div>
		</div>
	</div>
</div>
<article class="baidu_pl">
	<div id="article_content" class="article_content clearfix csdn-tracking-statistics" data-pid="blog" data-mod="popu_307" data-dsm="post">
							<div class="article-copyright">
				版权声明：本文为博主原创文章，未经博主允许不得转载。					https://blog.csdn.net/qq_18254385/article/details/78428887				</div>
							            <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-d7e2a68c7c.css">
					<div class="htmledit_views" id="content_views">

开始我是很难弄懂什么是过拟合，什么是欠拟合以及造成两者的各自原因以及相应的解决办法，学习了一段时间机器学习和深度学习后，分享下自己的观点，方便初学者能很好很形象地理解上面的问题，同时如果有误的地方希望大家在评论区留下你们的砖头，我会进行纠正。

无论在机器学习还是深度学习建模当中都可能会遇到两种最常见结果，一种叫过拟合（over-fitting ）另外一种叫欠拟合（under-fitting）。

首先谈谈什么是过拟合呢？什么又是欠拟合呢？网上很直接的图片理解如下：

所谓过拟合（over-fitting）其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在验证数据集以及测试数据集中表现不佳。打个比喻就是当我需要建立好一个模型之后，比如是识别一只狗狗的模型，我需要对这个模型进行训练。恰好，我训练样本中的所有训练图片都是二哈，那么经过多次迭代训练之后，模型训练好了，并且在训练集中表现得很好。基本上二哈身上的所有特点都涵括进去，那么问题来了！假如我的测试样本是一只金毛呢？将一只金毛的测试样本放进这个识别狗狗的模型中，很有可能模型最后输出的结果就是金毛不是一条狗（因为这个模型基本上是按照二哈的特征去打造的）。所以这样就造成了模型过拟合，虽然在训练集上表现得很好，但是在测试集中表现得恰好相反，在性能的角度上讲就是协方差过大（variance is large），同样在测试集上的损失函数（cost function）会表现得很大。

所谓欠拟合呢（under-fitting）？相对过拟合欠拟合还是比较容易理解。还是拿刚才的模型来说，可能二哈被提取的特征比较少，导致训练出来的模型不能很好地匹配，表现得很差，甚至二哈都无法识别。

那么问题来了，我们需要怎么去解决过拟合和欠拟合的问题呢？？

过拟合：

首先我们从上面我们可以知道，造成过拟合的原因有可以归结为：参数过多。那么我们需要做的事情就是减少参数，这里有两种办法：

1、回想下我们的模型，假如我们采用梯度下降算法将模型中的损失函数不断减少，那么最终我们会在一定范围内求出最优解，最后损失函数不断趋近0。那么我们可以在所定义的损失函数后面加入一项永不为0的部分，那么最后经过不断优化损失函数还是会存在。其实这就是所谓的“正则化”。

下面这张图片就是加入了正则化（regulation）之后的损失函数。这里m是样本数目，landa（后面我用“t”表示，实在是打不出）表示的是正则化系数。

注意：当t（landa）过大时，则会导致后面部分权重比加大，那么最终损失函数过大，从而导致欠拟合

当t（landa）过小时，甚至为0，导致过拟合。

2、对于神经网络，参数膨胀原因可能是因为随着网路深度的增加，同时参数也不断增加，并且增加速度、规模都很大。那么可以采取减少神经网络规模（深度）的方法。也可以用一种叫dropout的方法。dropout的思想是当一组参数经过某一层神经元的时候，去掉这一层上的一部分神经元，让参数只经过一部分神经元进行计算。注意这里的去掉并不是真正意义上的去除，只是让参数不经过一部分神经元计算而已。

另外增大训练样本规模同样也可以防止过拟合。

欠拟合：

其实个人觉得欠拟合基本上都会发生在训练刚开始的时候，经过不断训练之后欠拟合应该不怎么考虑了。。但是如果真的还是存在的话，可以通过增加网络复杂度或者在模型中增加多点特征点，这些都是很好解决欠拟合的方法。

全部评论

推荐最新楼层

11-24 16:30

已编辑

网易_数据开发工程师

SQL解析JSON讲解

写这期之前，语兴及其他同学在开发使用时遇到很多不同JSON相关例子，期望通过这一期讲解能快速提升大家JSON解析效率在解析JSON之前建议大家把JSON放到JSON解析相关站点或工具1.正常JSON解析样例数据这里以一个社区动态数据为例子 { "tag": "语兴好物好鞋分享", "spuList": "Asics JOG 100 2 轻便透气入门级专业跑步鞋 黑武士 男女同款 ", "circle": "", "contentTyp...

数据人的面试交流地牛客创作赏金赛

点赞评论收藏

11-27 16:56

湖南铁道职业技术学院后端

后端offer选择急急急

小红书后端开发总包n+8w+期权

点赞评论收藏

10-25 16:26

门头沟学院电力电子工程师

双非硕0offer

已经开始25年高考的第一轮复习了

牛客717484937号：双飞硕没实习挺要命的

点赞评论收藏

10-27 11:26

字节跳动_测试开发工程师(准入职员工)

真的假的……

朋友说的

三年之期已到我的offer快到碗里来：9硕都比不上9本

点赞评论收藏

11-22 00:12

华南理工大学 Java

秋招至今，我依然是0个offer

早期还有情绪波动，现在已经变成了对被挂的麻木，感觉秋招让很疲惫。谁要是发个offer，我立马就能签三方！要是再不行，春招就得继续拼了，春招不成，我就只能考虑卖淀粉肠了。。。

宝贝吃冰啦：华工✌的0offer是0满意offer吧

牛客创作赏金赛

点赞评论收藏

全站热榜

正在热议

# 工作中，你有没有遇到非常爱骂人的领导？ #

4617次浏览 47人参与

# 如果再来一次，你还会选择这个工作吗？ #

108147次浏览 1087人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

# 实习想申请秋招offer，能不能argue薪资 #

# 如果有时光机，你最想去到哪个年纪？ #

27458次浏览 570人参与