首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
拖拉机的拖拉
University of Saskatchewan 算法工程师
关注
已关注
取消关注
m
@林小白zii:
机器学习面经-评估方法与评价指标
一、简介 在机器学习中,评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。 二、面经 1、请问模型常用的评估方法有哪些? 2、请问常用的评价指标有哪些? 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 4、讲讲F1-score是怎么算的? 5、针对上面提到的一些指标,当训练集中类别不均衡,哪个最不准确? 6、ROC、AUC、PR曲线是什么关系? 7、AUC为什么比其他指标好? 8、AUC高是否一定说明auc高的模型排序能力更强?AUC对均匀正负样本采样不敏感? 9、AUC 值本身的理论上限是1吗? 10、AUC 与线上业务指标的宏观关系? 11、ROC曲线和PR曲线的区别?各自的适用场景? 三、面经参考回答 1、请问模型常用的评估方法有哪些? 参考回答:常用的评估方法包括以下几种: 训练集和测试集划分:将数据集划分为训练集和测试集,通常按照一定比例(如70%训练集,30%测试集)划分数据。训练集用于训练模型,测试集用于评估模型的性能和泛化能力。 交叉验证:K折交叉验证:将数据集划分为K个子集,依次选取其中一个子集作为验证集,剩余K-1个子集作为训练集,进行K次训练和测试,最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集,得到更稳定的性能评估结果。留一交叉验证:特殊情况下,K折交叉验证中K等于数据集大小,即每次只留一个样本作为验证集。 自助法(Bootstrap):自助法是一种有放回的采样方法,从原始数据集中随机采样得到一个新的训练集,然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集,因此可以得到多个模型性能评估结果,通过取平均值来得到最终评估结果。 留出集法(Hold-out):将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练,验证集用于调参和模型选择,测试集用于评估模型在未知数据上的泛化能力。 时间序列交叉验证:对于时间序列数据,为了避免训练集包含未来的信息,常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。 2、请问常用的评价指标有哪些? 参考回答:当评估机器学习模型的性能时,常用的评价指标根据任务类型可以分为以下几类: 分类任务评价指标: 准确率(Accuracy):分类正确的样本数占总样本数的比例。 精确度(Precision):真阳性样本数占所有被模型预测为正样本的样本数的比例。 召回率(Recall):真阳性样本数占所有真实正样本的样本数的比例。 F1分数(F1 Score):精确度和召回率的调和平均,用于综合考虑模型的准确性和召回性能。 ROC曲线和AUC:ROC曲线绘制了灵敏度(召回率)和特异度之间的关系,AUC用于度量ROC曲线的性能,越接近1表示模型性能越好。 回归任务评价指标: 均方误差(Mean Squared Error,MSE):预测值与真实值之间的平方差的均值。 平均绝对误差(Mean Absolute Error,MAE):预测值与真实值之间的绝对值差的均值。 R2分数(R-squared):模型预测值的方差占总方差的比例,越接近1表示模型拟合效果越好。 聚类任务评价指标: 轮廓系数(Silhouette Coefficient):衡量聚类的紧密性和分离性,越接近1表示聚类效果越好。 互信息(Mutual Information):衡量聚类结果与真实标签之间的信息量,越大表示聚类效果越好。 排序任务评价指标: 平均精确率(Mean Average Precision,MAP):对多个查询的平均精确率的平均值。 多标签分类任务评价指标: Hamming Loss:平均每个样本上错误的标签比例。 Jaccard Similarity Score:真实标签和预测标签的交集与并集之间的比例。 不同的评价指标适用于不同的任务和场景,根据具体的问题选择合适的评价指标是非常重要的。在实际应用中,通常需要综合考虑多个评价指标,并根据业务需求来选择最适合的评价指标。 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 参考回答:先说一下含义:TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说,就是: 真阳性(TP):标签为正类,预测为正类; 假阳性(FP):标签为负类,预测为正类; 真阴性(TN):标签为负类,预测为负类; 假阴性(FN):标签为正类,预测为负类; 准确率(Accuracy):T
点赞 5
评论 4
全部评论
推荐
最新
楼层
还没有回复哦~
相关推荐
11-28 15:40
山东大学 测试开发
同事的向上管理技巧
1. 所有东西只在ddl时交付,绝不提前交 学习程度:30% 2. 当老板提出不一定对的意见时,先肯定,然后找出一个小点浅浅批评一下,最后最好能绕到是自己没讲清楚上 学习程度:0% 3. 当老板要求头脑风暴时,提出一个非常宏观且正确但是100%无法执行的计划 学习程度:0%,并认为自己永远不可能学会 4. paraphrase老板的话 学习程度:10% 5. 当同事提出自己不是很认同的意见时,回复“好想法,我回头想想” 学习程度:100%,但是在本部门是无法运用了,可以在下份工作里实践 6. 不重要的东西100%表示赞同,给予老板100%的肯定 学习程度:100%,但内心拒绝应用 7. 当同事...
点赞
评论
收藏
分享
11-05 07:29
贵州大学 Java
这种算是拒绝了吗
这是拒绝了还是泡池子啊😭😥
紧勾追:
不推进就是挂吧
点赞
评论
收藏
分享
11-28 14:49
门头沟学院 Java
秋招圆满结束!!
这一路真的是太不容易了,都说参加完秋招做什么都会成功的,我很认同,因为我们要秋招,就要经历以下几个坎,也会收获对应的能力:忍耐力:耐心的等结果,谁也不知道啥时候有下一步进展,除了等就只有等。宽容力:这一路上啥人都可能遇到,不是每个面试官和hr都尊重人,如果不宽容,那就得气死了。技术力:技术是第一生产力,笔试面试哪个不需要八股、算法、项目,随时随地都得会吟唱。判断力:笔试面试撞车经常出现,我们需要精准的判断走位,是参加哪一场还是如何2小时内参加完2场,还是如何如何。清醒力:拿到offer都不算完,需要清楚的知道自己要什么,然后哪个适配。经历了秋招,我现在强的可怕,这不已经拿到了3个offer了,...
迷人的大卫在秋招:
集齐五大洪荒之力,召唤神龙
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
1
...
到了新公司,不要用力过猛
2.4W
2
...
校招两方/三方违约模板
2.0W
3
...
【发帖有奖💰】爆料秋招开奖进展❗
1.5W
4
...
万字长文讲透金融科技方向的就业机会
1.1W
5
...
从露宿街头到百万级种子轮融资②——我的实习期都经历了什么
8864
6
...
秋招圆满结束!!
6970
7
...
同事在会议室扇了自己好几个大嘴巴子
6630
8
...
华为开奖,详细时间线
4540
9
...
2026届秋招攻略-前期准备
4337
10
...
我也是好起来了,都能收到offer了
3916
正在热议
#
拼多多求职进展汇总
#
235252次浏览
2037人参与
#
实习,投递多份简历没人回复怎么办
#
2437751次浏览
34716人参与
#
阿里云管培生offer
#
60672次浏览
1755人参与
#
25届秋招总结
#
402865次浏览
4036人参与
#
ai智能作图
#
24073次浏览
282人参与
#
地方国企笔面经互助
#
6727次浏览
16人参与
#
北方华创开奖
#
66453次浏览
550人参与
#
机械求职避坑tips
#
22885次浏览
244人参与
#
25届机械人为了秋招做了哪些准备?
#
25690次浏览
359人参与
#
软件开发投递记录
#
1479957次浏览
23936人参与
#
我的实习求职记录
#
6126877次浏览
83989人参与
#
歌尔求职进展汇总
#
42835次浏览
294人参与
#
机械人怎么评价今年的华为
#
157480次浏览
1349人参与
#
如果再来一次,你还会选择这个工作吗?
#
113036次浏览
1125人参与
#
硬件兄弟们 甩出你的华为奖状
#
78258次浏览
626人参与
#
我在牛爱网找对象
#
74430次浏览
552人参与
#
经纬恒润求职进展汇总
#
99524次浏览
960人参与
#
联想求职进展汇总
#
202961次浏览
1816人参与
#
如果可以,你希望哪个公司来捞你
#
32318次浏览
191人参与
#
阿里求职进展汇总
#
72498次浏览
793人参与
#
牛客租房专区
#
5657次浏览
141人参与
#
许愿池
#
217675次浏览
2545人参与
牛客网
牛客企业服务