2023-08-05 15:30 已编辑香港大学推荐算法

关注

机器学习面经-评估方法与评价指标

一、简介

在机器学习中，评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。

二、面经

1、请问模型常用的评估方法有哪些？

2、请问常用的评价指标有哪些？

3、你知道准确率（Accuracy）、精确率（Precision）、召回率（Recall）是怎么算的吗？

4、讲讲F1-score是怎么算的？

5、针对上面提到的一些指标，当训练集中类别不均衡，哪个最不准确？

6、ROC、AUC、PR曲线是什么关系？

7、AUC为什么比其他指标好？

8、AUC高是否一定说明auc高的模型排序能力更强？AUC对均匀正负样本采样不敏感？

9、AUC 值本身的理论上限是1吗？

10、AUC 与线上业务指标的宏观关系？

11、ROC曲线和PR曲线的区别？各自的适用场景？

三、面经参考回答

1、请问模型常用的评估方法有哪些？

参考回答：常用的评估方法包括以下几种：

训练集和测试集划分：将数据集划分为训练集和测试集，通常按照一定比例（如70%训练集，30%测试集）划分数据。训练集用于训练模型，测试集用于评估模型的性能和泛化能力。
交叉验证：K折交叉验证：将数据集划分为K个子集，依次选取其中一个子集作为验证集，剩余K-1个子集作为训练集，进行K次训练和测试，最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集，得到更稳定的性能评估结果。留一交叉验证：特殊情况下，K折交叉验证中K等于数据集大小，即每次只留一个样本作为验证集。
自助法（Bootstrap）：自助法是一种有放回的采样方法，从原始数据集中随机采样得到一个新的训练集，然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集，因此可以得到多个模型性能评估结果，通过取平均值来得到最终评估结果。
留出集法（Hold-out）：将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练，验证集用于调参和模型选择，测试集用于评估模型在未知数据上的泛化能力。
时间序列交叉验证：对于时间序列数据，为了避免训练集包含未来的信息，常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。

2、请问常用的评价指标有哪些？

参考回答：当评估机器学习模型的性能时，常用的评价指标根据任务类型可以分为以下几类：

分类任务评价指标：

准确率（Accuracy）：分类正确的样本数占总样本数的比例。
精确度（Precision）：真阳性样本数占所有被模型预测为正样本的样本数的比例。
召回率（Recall）：真阳性样本数占所有真实正样本的样本数的比例。
F1分数（F1 Score）：精确度和召回率的调和平均，用于综合考虑模型的准确性和召回性能。
ROC曲线和AUC：ROC曲线绘制了灵敏度（召回率）和特异度之间的关系，AUC用于度量ROC曲线的性能，越接近1表示模型性能越好。

回归任务评价指标：

均方误差（Mean Squared Error，MSE）：预测值与真实值之间的平方差的均值。
平均绝对误差（Mean Absolute Error，MAE）：预测值与真实值之间的绝对值差的均值。
R2分数（R-squared）：模型预测值的方差占总方差的比例，越接近1表示模型拟合效果越好。

聚类任务评价指标：

轮廓系数（Silhouette Coefficient）：衡量聚类的紧密性和分离性，越接近1表示聚类效果越好。
互信息（Mutual Information）：衡量聚类结果与真实标签之间的信息量，越大表示聚类效果越好。

排序任务评价指标：

平均精确率（Mean Average Precision，MAP）：对多个查询的平均精确率的平均值。

多标签分类任务评价指标：

Hamming Loss：平均每个样本上错误的标签比例。
Jaccard Similarity Score：真实标签和预测标签的交集与并集之间的比例。

不同的评价指标适用于不同的任务和场景，根据具体的问题选择合适的评价指标是非常重要的。在实际应用中，通常需要综合考虑多个评价指标，并根据业务需求来选择最适合的评价指标。

3、你知道准确率（Accuracy）、精确率（Precision）、召回率（Recall）是怎么算的吗？

参考回答：先说一下含义：TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说，就是：

真阳性（TP）：标签为正类，预测为正类；

假阳性（FP）：标签为负类，预测为正类；

真阴性（TN）：标签为负类，预测为负类；

假阴性（FN）：标签为正类，预测为负类；

准确率(Accuracy)：T

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

小白机器学习面试指南文章被收录于专栏

林小白的机器学习指南，从本人面试的机器学习算法岗位出发，对机器学习“八股文”做详细的介绍、推导；

全部评论

推荐最新楼层

拖拉机的拖拉

University of Saskatchewan 算法工程师

m

点赞回复分享

发布于 2023-07-28 02:25 北京

牛客770972276号

长庆石油高级技工学校运营

mark

点赞回复分享

发布于 2023-07-28 12:41 江苏

牛客961683202号

重庆五一技师学院运营

mark

点赞回复分享

发布于 2023-07-28 22:10 安徽

想吃烤肉的芝士渴望wlb

北京大学算法工程师

mark

点赞回复分享

发布于 2023-07-28 22:58 安徽

11-27 00:23

福建农林大学销售工程师

面试的水分真的很重

昨晚我在网上查面经，发现大家都很诚实，很多人都是靠关系进的。我心想，难道这些少爷小姐就不需要牛马来干活吗？面试时我等了那么久，真有时候觉得这份工作不找也罢。

想顺利毕业的秋招人向光而行：七分运气三分实力了

牛客创作赏金赛

点赞评论收藏

分享

11-27 18:56

嘉士伯_运营管理_HR

为什么建议看看外企

不知不觉已经十一月份了，国庆回来秋招就算真的进入中后期了，基本就是考选调，考体制内了，私企最后能投的一波就是十月上旬了，现在投着，前面大佬释放hc 大家还有一点机会1.不喜欢你工作太卷！（俺是卷心菜，虽卷但菜）外企非常严格地遵循无996，955工作制的同时实现WLB（work life balance），即即工作生活平衡，到点就可以走人~如果怕堵车或者有其他事情（比如不太舒服、有急事）都可以提前回去，部分外企每周还有一天或两天居家办公，嘿嘿~2.不喜欢你太给自己设限请大声说:我们都有无限可能不同于国企对应届生身份卡的比较严格，外企尤其往届生友好，毕业两年内还保有应届生身份的姐妹都可以去投！...

百威成长空间 51人发布

点赞评论收藏

分享

11-13 15:20

门头沟学院前端工程师

麻麻我出息了

我也是能硬气到拒bytedance了😇

死在JAVA的王小美：哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈，我也是，让我免了一轮，但是硬气拒绝了

点赞评论收藏

分享

10-17 10:05

已编辑

北华大学全栈开发

牛客872465272号：掉头发了哥

点赞评论收藏

分享

11-28 23:28

门头沟学院 C++

秋招和学历的关系

大家觉得秋招和学历的关系大吗？是起决定性因素，还是重要因素，还是说加分因素鼠鼠觉得起决定性因素，但是看到牛客上的大佬们的经历又觉得自己太菜了，特别感觉牛客的二本太超标了，是我信息茧房了么

爱闹的笑笑：学历是基本要素，过了这个门槛那就是天高任鸟飞了。学历不够，需要通过其他方面的巨大优势来弥补这个短板

生活随笔记录简历被挂麻了，求建议牛客创作赏金赛

点赞评论收藏

分享

评论

5

16

招聘动态

阿里云管培生

2025届校园招聘

快手Star

2025届招聘

快手

销售类投递专区

富士通（西安）

2025校园招聘

全站热榜

正在热议

# 拼多多求职进展汇总 #

236015次浏览 2038人参与

# ai智能作图 #

26271次浏览 309人参与

# 阿里云管培生offer #

61398次浏览 1755人参与

# 25届秋招总结 #

405658次浏览 4068人参与

# 25届机械人为了秋招做了哪些准备？ #

25952次浏览 363人参与

# 地方国企笔面经互助 #

6796次浏览 16人参与

# 北方华创开奖 #

66688次浏览 550人参与

# 机械求职避坑tips #

23198次浏览 248人参与

# 实习，投递多份简历没人回复怎么办 #

2438753次浏览 34731人参与

# 软件开发投递记录 #

1480478次浏览 23940人参与

# 虾皮求职进展汇总 #

88209次浏览 709人参与

# 我的实习求职记录 #

6128791次浏览 84002人参与

# 我在牛爱网找对象 #

74692次浏览 554人参与

# 机械人怎么评价今年的华为 #

157642次浏览 1350人参与

# 你觉得通信/硬件有必要实习吗？ #

54696次浏览 695人参与

# 歌尔求职进展汇总 #

42860次浏览 294人参与

# 如果可以，你希望哪个公司来捞你 #

33160次浏览 193人参与

# 如果再来一次，你还会选择这个工作吗？ #

114061次浏览 1131人参与

# 如何写一份好简历 #

618536次浏览 8722人参与

# 在职场上，你最讨厌什么样的同事 #

5940次浏览 90人参与

# 硬件兄弟们甩出你的华为奖状 #

78379次浏览 628人参与

# 你觉得第一学历对求职有影响吗？ #

17672次浏览 155人参与

牛客网
牛客企业服务