2023-06-17 11:35 知乎_产品

关注

Day52：模型评估和选择

alt

在前面的章节中，我们介绍了机器学习的各个方面，包括数据预处理、特征工程以及各种机器学习算法。在本节中，我们将重点讨论如何评估和选择模型，以及在实际问题中如何进行模型选择。

1. 模型评估方法

在机器学习中，评估模型的性能是非常重要的，它能够帮助我们了解模型的预测能力和泛化能力。下面介绍几种常见的模型评估方法：

训练集和测试集划分：将数据集划分为训练集和测试集，使用训练集训练模型，然后使用测试集评估模型的性能。这种方法简单直接，但可能存在过拟合问题。
```
from sklearn.model_selection import train_test_split

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
交叉验证：将数据集划分为多个子集，每次使用其中一个子集作为测试集，其他子集作为训练集，然后多次重复训练和评估过程，最终得到综合性能评估结果。常见的交叉验证方法包括k折交叉验证和留一交叉验证。
```
from sklearn.model_selection import cross_val_score

# 进行k折交叉验证
scores = cross_val_score(model, X, y, cv=5)
```
自助法：对于数据集较小的情况，可以使用自助法进行模型评估。自助法是通过有放回地从原始数据集中抽样生成一个与原始数据集大小相同的新数据集，并将未被抽中的样本作为测试集进行评估。
```
from sklearn.utils import resample

# 生成自助样本
X_train_boot, y_train_boot = resample(X, y, random_state=42)
```
指标评估：根据具体的任务和问题，选择合适的评估指标来衡量模型性能。常见的分类任务评估指标包括准确率、精确率、召回率、F1值、混淆矩阵等，回归任务评估指标包括均方误差、平均绝对误差等。
- 准确率（Accuracy）：准确率是指模型预测正确的样本数量占总样本数量的比例。
  
  准确率 = (TP + TN) / (TP + TN + FP + FN)
- 精确率（Precision）：精确率是指在模型预测为正例的样本中，实际为正例的比例。
  
  精确率 = TP / (TP + FP)
- 召回率（Recall）：召回率是指在实际为正例的样本中，模型预测为正例的比例。
  
  召回率 = TP / (TP + FN)
- F1值：F1值是精确率和召回率的调和平均值，用于综合考虑精确率和召回率。
  
  F1值 = 2 * (精确率 * 召回率) / (精确率 + 召回率)
- 混淆矩阵：对于多分类问题，对角线上的元素表示正确预测的样本数，非对角线上的元素表示错误预测的样本数。
其中，TP表示真正例（模型将正类正确地预测为正类），TN表示真反例（模型将负类正确地预测为负类），FP表示假正例（模型将负类错误地预测为正类），FN表示假反例（模型将正类错误地预测为负类）。

2. 模型选择

在实际问题中，选择合适的模型是非常重要的，它直接影响到模型的性能和泛化能力。以下是一些选择模型的常见准则

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

大模型-AI小册文章被收录于专栏

1. AI爱好者，爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生，给实验室搬砖的uu，强烈建议你花时间学完这个，后续搬砖比较猛 4. 任何对编程感兴趣的，且愿意掌握一门技能的人

全部评论

推荐最新楼层

昨天 16:01

已编辑

广州中医药大学安卓

双非逆袭微软｜简历优化，思路详解

最近帮学弟妹看简历，发现大家在写简历的思路和方法上都存在盲区，所以我拿出一个简历优化案例，做分析解读，希望能帮到大家。原简历很棒的点有:1.明确的求职岗位意愿2.整洁干净的形象照3.使用STAR法则去描述项目经历而这份简历优化的思路可以从结构、描述两个角度入手:结构优化思路实习经历和项目经历其实在重复描述项目,把在"岐伯曰助手"的工作分散至两部分中描述。这容易在后续面试中增加沟通成本。描述优化思路1.原简历的内容超过了一页A4纸。同学想要面试的是互联网公公司,那么下面的信息不会对简历有正面提升,而是应该删除:1.政治面貌2.只记录框架API使用的个人博客文章3.专业技能(专...

投递微软等公司9个岗位 > 简历被挂麻了，求建议简历中的项目经历要怎么写

点赞评论收藏

分享

02-12 16:45

内蒙古财经大学网页产品经理

唯品会-商品运营管培生-（一面）面经

1、请做一个简单的自我介绍。2、谈谈你对唯品会用户群体的了解。3、为什么想申请这个岗位？4、平时任务较多的时候，你会如何分配精力？5、你能多久到岗，预计工作时长是多久？6、如何进行选品？7、怎样对产品设计页面PDP进行优化？8、若遇到一位对价格非常敏感的顾客咨询商品，你会如何应对？

查看8道真题和解析

点赞评论收藏

分享

02-08 14:57

安徽新华学院 Java

2025被裁，重新找，还没有面试 ，求改简历

点赞评论收藏

分享

02-08 20:56

已编辑

南京工业大学 Java

年过完了，java选手继续尝试一下春招，简历求各位佬猛猛拷打，欢迎锐评

#Java选手#  #简历被挂麻了，求建议#

在等offer的比尔很洒脱：我也是在实习，项目先不说，感觉有点点小熟悉，但是我有点疑问，这第一个实习，公司真的让实习生去部署搭建和引入mq之类的吗，是不是有点过于信任了,我实习过的两个公司都是人家正式早搭好了，根本摸不到部署搭建的

简历被挂麻了，求建议

点赞评论收藏

分享

02-12 17:55

北京联合大学活动运营

啃老的人注定一事无成？

哪吒竟然90亿了....看到饺子导演的经历，短期啃老+GAP人生不会完蛋，没必要在年纪轻轻的时候把自己逼得太紧，放轻松，等待属于自己的机遇当然啃老不等于什么都不做，还是可以去发展发展自己的人生爱好的，人要活很久，20岁的年纪请让自己活的开心点

小何和：我们很多人没办法啃的，一方面是父母没什么钱，一方面父母也很难容忍你不赚钱，我父母肯定不会容忍我每天捣鼓自己的事，不出去赚钱。哎……

点赞评论收藏

分享

评论

2

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我在牛爱网找对象 #

147243次浏览 1150人参与

# 哪些公司校招卡第一学历 #

45049次浏览 171人参与

# 职场上哪些事情令人讨厌 #

11599次浏览 55人参与

# 你知道哪些职场黑话？ #

20713次浏览 176人参与

# 你的领导最像哪种动物，为什么? #

8751次浏览 90人参与

# 工作中哪个瞬间让你想离职 #

21079次浏览 154人参与

# 入职第一天，你准备什么时候下班 #

29637次浏览 206人参与

# 运营面经 #

84244次浏览 1044人参与

# 你遇到过哪些神仙同事 #

40376次浏览 386人参与

# 春招启动，你开始投递了吗？ #

29003次浏览 334人参与

# 你觉得机械有必要实习吗 #

33126次浏览 316人参与

# 职场吐槽大会 #

133368次浏览 1111人参与

# 设计人如何选offer #

61717次浏览 573人参与

# 哪些企业的面试体验感最差？ #

18369次浏览 193人参与

# 美的求职进展汇总 #

223973次浏览 1663人参与

# 腾讯音乐求职进展汇总 #

46267次浏览 269人参与

# 招聘要求与实际实习内容不符怎么办 #

35518次浏览 441人参与

# vivo求职进展汇总 #

164459次浏览 1014人参与

# 如何KTV领导 #

27559次浏览 210人参与

# 比亚迪春招开了，你投递了吗？ #

35917次浏览 139人参与

牛客网
牛客企业服务