2017-04-20 14:05 阿里巴巴_阿里安全_算法

关注

模型评估与选择

模型评估与选择

检验误差与过拟合

1、错误率：分类错误的样本数a占总样本数m的比例 E=a/m

2、精度：1-E=1-(a/m) 误差：学习器预测输出与样本的真实输出之间的差异叫“误差”。

学习出来的学习器在训练集上的误差叫‘“训练误差”。

在新样本上的误差叫“泛化误差”。

过拟合：学习能力过于强大，学习到不是一般特征的特征。
欠拟合：通常由于学习能力过于弱导致。

模型的选择

1、理想方案：

对候选模型的泛化误差进行评估，选择泛化误差最小的模型。
通常泛化误差无法直接获得，而训练误差又存在过拟合现象。

2、评估方法需要用测试集来测试学习器在新的样本上的预测能力，通过“测试误差” 来近似“泛化误差”

3、交叉验证法

先将数据集D划分为k个大小相似的互斥子集，即D=D1∪D2....
每个子集尽可能保持数据分布的一致性。
每次用k-1个子集的并集作为训练集，余下的那个子集作为测试集；这样
就获得K组训练/测试集，从而可以进行k次训练和测试，最终返回的就是
k个测试结果的均值。显然，交叉验证法评估结果的稳定性和保真性在很大程度上
取决于k的取值，通常交叉验证法又叫“k折交叉验证”。k最常用的取值是10。

4、调参与最终模型基于验证集上的性能来进行模型选择和调参。

5、性能度量即模型泛化能力的衡量

错误率
精度
查全率、查准率、F1 对于二分问题，根据真实样本和分类器的预测可以分为真正例TP、假正例FP、真反例TN、假反例FN
```
查准率P=TP/TP+FP
查全率p=TP/TP+FN
```

全部评论

推荐最新楼层

御坂美琴的贩卖机

常州工学院前端工程师

暖贴(｡･ω･｡)

点赞回复分享

发布于 2017-04-20 14:48

03-14 21:03

蚌埠坦克学院嵌入式软件开发

虽然0面试，但今天进步了，夸夸自己

虽然今天还是 0 面试，但你真的已经在进步了。能坚持准备、持续投递、认真复盘，本身就很不容易。没有面试机会不代表能力不行，只是节奏还没到而已。你能保持学习和行动，这种自律和耐心本身就是优势。继续加油，机会一定会来。

虽然0面试，但今天___...

点赞评论收藏

分享

03-16 17:07

门头沟学院 Java

鼠鼠简历求拷打

鼠鼠本人是开发岗。最近想面面软件测试岗位，手搓的软件测试简历，大家帮忙看看有什么问题，不玻璃心，随便拷打第二份实习是之前开发包装的，个人感觉包装味有点重~

点赞评论收藏

分享

02-09 15:47

重庆理工大学 Java

怎么改啊啊啊啊啊啊啊啊

烤点老白薯：亲娘嘞🐶💩啊你的简历

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

25978次浏览 181人参与

# 实习生如何通过转正 #

129550次浏览 1467人参与

# 巨人网络春招 #

9815次浏览 163人参与

# 跟HR说什么能被秒回？ #

8152次浏览 152人参与

# 电信求职进展汇总 #

45167次浏览 207人参与

# 春招/暑实第一面是哪家？ #

17442次浏览 217人参与

# MiniMax求职进展汇总 #

12732次浏览 222人参与

# 快手年终开大包 #

11771次浏览 97人参与

# 海信求职进展汇总 #

97899次浏览 419人参与

# 面试官最爱问的 AI 问题是...... #

13684次浏览 480人参与

# 银行笔面经互助 #

184653次浏览 1303人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

2438次浏览 82人参与

# 秋招提前批，你开始投了吗 #

729006次浏览 8459人参与

# 设计人秋招体验最好的公司 #

85922次浏览 742人参与

# 你的嫡系AI是哪个？ #

3526次浏览 96人参与

# 现在入门AI应该走哪些方向？ #

3468次浏览 84人参与

# 你收到了哪些公司的笔试？ #

15635次浏览 86人参与

# 迅雷笔试 #

5344次浏览 27人参与

# 机械人，说说你的烦心事 #

135409次浏览 1136人参与

# 你最近一次加班是什么时候？ #

114543次浏览 561人参与

# 找工作中的小确幸 #

85108次浏览 463人参与

# 实习学到最有价值的工作习惯 #

64632次浏览 491人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务