2023-08-05 15:30 已编辑香港大学推荐算法

关注

机器学习面经-评估方法与评价指标

一、简介

在机器学习中，评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。

二、面经

1、请问模型常用的评估方法有哪些？

2、请问常用的评价指标有哪些？

3、你知道准确率（Accuracy）、精确率（Precision）、召回率（Recall）是怎么算的吗？

4、讲讲F1-score是怎么算的？

5、针对上面提到的一些指标，当训练集中类别不均衡，哪个最不准确？

6、ROC、AUC、PR曲线是什么关系？

7、AUC为什么比其他指标好？

8、AUC高是否一定说明auc高的模型排序能力更强？AUC对均匀正负样本采样不敏感？

9、AUC 值本身的理论上限是1吗？

10、AUC 与线上业务指标的宏观关系？

11、ROC曲线和PR曲线的区别？各自的适用场景？

三、面经参考回答

1、请问模型常用的评估方法有哪些？

参考回答：常用的评估方法包括以下几种：

训练集和测试集划分：将数据集划分为训练集和测试集，通常按照一定比例（如70%训练集，30%测试集）划分数据。训练集用于训练模型，测试集用于评估模型的性能和泛化能力。
交叉验证：K折交叉验证：将数据集划分为K个子集，依次选取其中一个子集作为验证集，剩余K-1个子集作为训练集，进行K次训练和测试，最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集，得到更稳定的性能评估结果。留一交叉验证：特殊情况下，K折交叉验证中K等于数据集大小，即每次只留一个样本作为验证集。
自助法（Bootstrap）：自助法是一种有放回的采样方法，从原始数据集中随机采样得到一个新的训练集，然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集，因此可以得到多个模型性能评估结果，通过取平均值来得到最终评估结果。
留出集法（Hold-out）：将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练，验证集用于调参和模型选择，测试集用于评估模型在未知数据上的泛化能力。
时间序列交叉验证：对于时间序列数据，为了避免训练集包含未来的信息，常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。

2、请问常用的评价指标有哪些？

参考回答：当评估机器学习模型的性能时，常用的评价指标根据任务类型可以分为以下几类：

分类任务评价指标：

准确率（Accuracy）：分类正确的样本数占总样本数的比例。
精确度（Precision）：真阳性样本数占所有被模型预测为正样本的样本数的比例。
召回率（Recall）：真阳性样本数占所有真实正样本的样本数的比例。
F1分数（F1 Score）：精确度和召回率的调和平均，用于综合考虑模型的准确性和召回性能。
ROC曲线和AUC：ROC曲线绘制了灵敏度（召回率）和特异度之间的关系，AUC用于度量ROC曲线的性能，越接近1表示模型性能越好。

回归任务评价指标：

均方误差（Mean Squared Error，MSE）：预测值与真实值之间的平方差的均值。
平均绝对误差（Mean Absolute Error，MAE）：预测值与真实值之间的绝对值差的均值。
R2分数（R-squared）：模型预测值的方差占总方差的比例，越接近1表示模型拟合效果越好。

聚类任务评价指标：

轮廓系数（Silhouette Coefficient）：衡量聚类的紧密性和分离性，越接近1表示聚类效果越好。
互信息（Mutual Information）：衡量聚类结果与真实标签之间的信息量，越大表示聚类效果越好。

排序任务评价指标：

平均精确率（Mean Average Precision，MAP）：对多个查询的平均精确率的平均值。

多标签分类任务评价指标：

Hamming Loss：平均每个样本上错误的标签比例。
Jaccard Similarity Score：真实标签和预测标签的交集与并集之间的比例。

不同的评价指标适用于不同的任务和场景，根据具体的问题选择合适的评价指标是非常重要的。在实际应用中，通常需要综合考虑多个评价指标，并根据业务需求来选择最适合的评价指标。

3、你知道准确率（Accuracy）、精确率（Precision）、召回率（Recall）是怎么算的吗？

参考回答：先说一下含义：TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说，就是：

真阳性（TP）：标签为正类，预测为正类；

假阳性（FP）：标签为负类，预测为正类；

真阴性（TN）：标签为负类，预测为负类；

假阴性（FN）：标签为正类，预测为负类；

准确率(Accuracy)：T

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

小白机器学习面试指南文章被收录于专栏

林小白的机器学习指南，从本人面试的机器学习算法岗位出发，对机器学习“八股文”做详细的介绍、推导；

全部评论

推荐最新楼层

想吃烤肉的芝士渴望wlb

北京大学算法工程师

mark

点赞回复分享

发布于 2023-07-28 22:58 安徽

牛客961683202号

重庆五一技师学院运营

mark

点赞回复分享

发布于 2023-07-28 22:10 安徽

牛客770972276号

长庆石油高级技工学校运营

mark

点赞回复分享

发布于 2023-07-28 12:41 江苏

拖拉机的拖拉

University of Saskatchewan 算法工程师

m

点赞回复分享

发布于 2023-07-28 02:25 北京

07-10 14:44

门头沟学院客户端其它

秋招面试用Ai作弊，被识破了.....

我有个朋友，在面试的时候，用Ai搜问题，照着念的时候，被面试官识破了。那个面试官说，为什么每次问一个问题的时候，他总是半天没反应，然后突然像读文章一样很流利的一顿输出，并且回答的形式像个机器人，完全没有自己对于这个问题的理解。不出意外，面完也是秒挂。当然了，肯定有同学靠着Ai面试侥幸通过了面试，甚至有的人直接进入大厂，让身边的人感到不平衡，感觉自己白刷了几年的算法题，然后自己也想尝试用Ai作弊。我感觉吧，Ai面试就像考试打小抄一样，本身就是一个风险和收益具存的事情，赌输了就GG了，赌赢了，直接血赚。但是，我不建议面试全程使用Ai，牢靠的技术基础才是实打实自己的本事，你可以偶尔用它提醒，但是不能...

菜鸡芊寻：

刚看到以为是无中生友一看是你那没事了不是无中生友

你找工作的时候用AI吗？

点赞评论收藏

分享

07-11 18:52

Momenta26实习

目前虽然26届的实习还在招的只有Mstar了，要求比较高，佬们可以投投给大家详细聊一聊公司上班细节，大家可以评估下自己来了能否适应。智驾整体强度都比较大，因为基本都算初创公司，还没做到能躺着收钱的地步，凡事看两面，压力大但是能学到东西，不至于说每天干重复的东西么没有提示，工作时间10am-19pm，项目交付的时候加班就多，基本上9点左右，公司包三餐 工作再忙都要好好吃饭 公司统一使用美餐app 可以根据自己喜好来订餐到工位餐区也可以去楼下美好荟去合作商家堂食比如：老乡鸡 costa 美餐20元餐标超出部分自己补差价👇 王阿吉的快餐真的很好吃强推 ）别担心会吃腻 行政小姐姐会定期更换合作商家。...

点赞评论收藏

分享

06-04 19:53

门头沟学院 Java

刷了牛客那么多晒工位我也晒一晒

晒晒我的工位，如图，已经离职，某互联网大厂的工位，主要还是看工区，我这个工位难评

我在害怕什么：一眼百度过道

投递牛客等公司

点赞评论收藏

分享

07-01 13:37

门头沟学院 Java

是简历问题吗？我真的投累了

steelhead：不是你的问题，这是社会的问题。

点赞评论收藏

分享

07-07 23:05

中南大学 Java

明天挥师北上开始北漂！16年功名尘与土，2500里路云和月。键盘敲落星如雨，人潮涌处灯未歇。霓虹漫卷京华夜，寸心未冷青春血！不当京✌🏻，誓不回转！

小浪_coder：进京了

牛客创作赏金赛

点赞评论收藏

分享

评论

5

17

招聘动态

滴滴

2026届秋季校招提前批

米哈游2026校园招聘

技术提前批

小红书

REDstar提前批招聘

Touch CIB

数字兴业科技挑战赛

现代汽车前瞻技术研发挑战赛

26届投递链接合集

快手

快Star-X特别技术人才计划启动

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

57119次浏览 421人参与

# 运营面经 #

115891次浏览 1251人参与

# 你认为小厂实习有用吗？ #

21746次浏览 256人参与

# 三一重工求职进展汇总 #

13561次浏览 62人参与

# 应届生，你找到工作了吗 #

21958次浏览 155人参与

# 你的领导最像哪种动物，为什么? #

14628次浏览 107人参与

# 说说你知道的学历厂 #

41177次浏览 253人参与

# 材料人，你们签了哪个公司 #

7588次浏览 18人参与

# 哪一瞬间觉得自己长大了 #

10687次浏览 236人参与

# 如果重来一次你还会读研吗 #

175971次浏览 1780人参与

# 计算机有哪些岗位值得去？ #

17568次浏览 163人参与

# 面试尴尬现场 #

33817次浏览 225人参与

# 你找工作的时候用AI吗？ #

19570次浏览 239人参与

# 烟草笔面经互助 #

17913次浏览 184人参与

# 下班后的时间你怎么安排 #

10735次浏览 147人参与

# 硬件人秋招的第一个offer #

80266次浏览 1154人参与

# 电网笔面经互助 #

37024次浏览 359人参与

# 秋招最大的收获是什么？ #

36178次浏览 309人参与

# 社会教会你的第一课 #

38033次浏览 476人参与

# lastday知无不言 #

58516次浏览 475人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务