小水滴真的是太可爱了吧

2020-09-22 20:26 门头沟学院产品经理

关注

【机器学习笔记day18】3.6. 分类器性能评估

文章目录

3.6. 分类器性能评估
分类器性能评估
- sklearn.metrics.classification_report

3.6. 分类器性能评估

分类器性能评估

在许多实际问题中，衡量分类器任务的成功程度是通过固定的性能指标来获取。一般最常见使用的是准确率，即预测结果正确的百分比。然而有时候，我们关注的是负样本是否被正确诊断出来。例如，关于肿瘤的的判定，需要更加关心多少恶性肿瘤被正确的诊断出来。也就是说，在二类分类任务下，预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合，构成混淆矩阵。

在二类问题中，如果将一个正例判为正例，那么就可以认为产生了一个真正例（True Positive，TP）；如果对一个反例正确的判为反例，则认为产生了一个真反例（True Negative，TN）。相应地，两外两种情况则分别称为伪反例（False Negative，FN，也称）和伪正例（False Positive，TP），四种情况如下图：

在分类中，当某个类别的重要性高于其他类别时，我们就可以利用上述定义出多个逼错误率更好的新指标。第一个指标就是正确率（Precision），它等于TP/(TP+FP)，给出的是预测为正例的样本中占真实结果总数的比例。第二个指标是召回率（Recall）。它等于TP/(TP+FN)，给出的是预测为正例的真实正例占所有真实正例的比例。

那么除了正确率和精确率这两个指标之外，为了综合考量召回率和精确率，我们计算这两个指标的调和平均数，得到F1指标（F1 measure）:

{F1}={\frac{2}{\frac{1}{Precision}{+}\frac{1}{Recall}}}F1=Precision1+Recal**l12

之所以使用调和平均数，是因为它除了具备平均功能外，还会对那些召回率和精确率更加接近的模型给予更高的分数；而这也是我们所希望的，因为那些召回率和精确率差距过大的学习模型，往往没有足够的使用价值。

sklearn.metrics.classification_report

sklearn中metrics中提供了计算四个指标的模块，也就是classification_report。

classification_report(y_true, y_pred, labels=None, target_names=None, digits=2)
  """ 计算分类指标 :param y_true:真实目标值 :param y_pred:分类器返回的估计值 :param target_names:可选的，计算与目标类别匹配的结果 :param digits:格式化输出浮点值的位数 :return :字符串，三个指标值 """

我们通过一个例子来分析一下指标的结果：

from sklearn.metrics import classification_report
y_true = [0, 1, 2, 2, 2]
y_pred = [0, 0, 2, 2, 1]
target_names = ['class 0', 'class 1', 'class 2']
print(classification_report(y_true, y_pred, target_names=target_names))


             precision    recall  f1-score   support

    class 0       0.50      1.00      0.67         1
    class 1       0.00      0.00      0.00         1
    class 2       1.00      0.67      0.80         3

avg / total       0.70      0.60      0.61         5

全部评论

推荐最新楼层

12-02 17:22

已编辑

西安交通大学 Java

offer比较，华为，滴滴

华为昇腾 ai软件开发薪资20k x (14-16)，职级13A，5%公积金，c/cpp

BLOOMING7：闭眼滴滴，华子给的又少又累

点赞评论收藏

分享

今天 11:06

已编辑

腾讯音乐娱乐_人力资源部_HR

25届的兄弟们！抓紧了！腾讯音乐开补录了！

腾讯音乐就这么水灵灵的开补录了，咱动作也是有点快了！ 腾讯音乐过往没有开过春招，基本年前就补录个7788了，所以这次是最后的上岸机会了！兄弟们给我猛猛冲！⚠️补录不笔试，也没有网申截止时间，招满即止，所以抓紧投抓紧投！然后有几个关键的信息点，跟兄弟们同步一下：1. 网申地址join.tencentmusic.com/campus，应聘类型选择「应届生」，可以填上音子的至尊黑金内推码VL650Z，据说填上会上岸！2. 再强调一次，腾讯音乐是一家独立上市公司，校招独立进行，和腾讯不冲突不冲突！3. 本次校招面向的是2025届毕业生（毕业于2024年9月1日-2025年8月31日），中国大陆（内地）...

投递腾讯音乐娱乐集团等公司10个岗位 >

点赞评论收藏

分享

10-27 11:26

字节跳动_测试开发工程师(准入职员工)

真的假的……

三年之期已到我的offer快到碗里来：9硕都比不上9本

点赞评论收藏

分享

11-15 18:39

已编辑

西安交通大学 Java

悬着的心终于死了。东子

全村最靓的仔仔：卧槽，佬啥bg呢，本也是西交么

点赞评论收藏

分享

11-27 10:51

东南大学单片机

听学长的没错

拿到了2个offer，分别是携程的后端和阿里云的管培生，本来比较犹豫，跟就业办的老师聊了之后豁然开朗，他说阿里云管培生是非常难得的校招生培养项目，算是技术复合型人才的黄埔军校是非常适合技术复合型人才的职业发展第一站，不仅可以带薪培训1年，系统学习云计算产品与技术知识，还能接触到阿里云顶级的行业资源，接触业务和商业知识，挺适合我这种对技术商业化更感兴趣的人，而且有同专业的学长也在这个项目里，说不定还能有个饭搭子跟着前辈学，经验成长肯定快！就不纠结了，直接接了这个阿里云管培生offer，希望未来发展顺利！早日成为大佬哈哈

赏个offer求你了：就业办老师还有这水平？

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 25届秋招总结 #

465618次浏览 4773人参与

# 晒一晒我的offer #

10033120次浏览 106380人参与

# 地方国企笔面经互助 #

8766次浏览 19人参与

# 如何排解工作中的焦虑 #

73745次浏览 1047人参与

# 我的求职思考 #

4244964次浏览 57464人参与

# 同bg的你秋招战况如何？ #

91037次浏览 693人参与

# 找工作时遇到的神仙HR #

568827次浏览 3888人参与

# 实习，投递多份简历没人回复怎么办 #

2465881次浏览 34936人参与

# 虾皮求职进展汇总 #

131561次浏览 956人参与

# 你投了多少份简历了？ #

68577次浏览 818人参与

# 你上一次加班是什么时候？ #

23277次浏览 186人参与

# 面试被问第一学历差时该怎么回答 #

80350次浏览 516人参与

# 提前批简历挂麻了怎么办 #

150984次浏览 1988人参与

# 现在还是0offer，延毕还是备考 #

828331次浏览 6930人参与

# 比亚迪工作体验 #

45610次浏览 215人参与

# 大疆求职进展汇总 #

421295次浏览 2970人参与

# 来聊聊你目前的求职进展 #

522084次浏览 6228人参与

# 什么专业适合考公 #

15285次浏览 119人参与

# 总结:哪家公司面试体验感最好 #

20600次浏览 94人参与

# 如果公司给你放一天假，你会怎么度过？ #

5124次浏览 65人参与

牛客网
牛客企业服务