《机器学习高频面试题详解》1.10：随机森林_牛客网

巴啦啦能量

四川大学算法工程师发布于四川

关注

有用的知识，马住~

@码农鬼仔：《机器学习高频面试题详解》1.10：随机森林

    点击上方卡片链接就可以进入专栏，专栏右上角有订阅选项，欢迎大家订阅～  前言  大家好，我是鬼仔，今天带来《机器学习高频面试题详解》专栏的第1.10节：随机森林。这是鬼仔第一次开设专栏，每篇文章鬼仔都会用心认真编写，希望能将每个知识点讲透、讲深，帮助同学们系统性地学习和掌握机器学习中的基础知识，希望大家能多多支持鬼仔的专栏～  目前这篇是试读，后续的文章需要订阅才能查看哦，专栏预计更新30+篇文章（只增不减），具体内容可以看专栏介绍，大家的支持是鬼仔更新的动力！                            本文大纲             一、原理     1. 集成学习             2. 随机森林             二、面试真题     1. 简要介绍下集成学习？             2. 集成学习中bagging和boosting的区别？             3. 随机森林的随机性体现在哪里？             4. 随机森林为什么不能用全样本取训练m棵决策树？             5. 随机森林的优缺点？           一、原理  1. 集成学习  在实际应用中，单个模型可能无法满足要求，因此需要将多个基础模型组合起来，以提高模型的准确性和稳定性，这就是集成学习。集成学习不仅可以提高模型性能，还可以有效地减少过拟合的风险。同时，集成算法也存在一些缺点，由于集成算法需要将多个基础模型的结果组合起来，因此计算成本会比单个模型更高，导致运行时间变长。  集成算法可以分为两类：基于bagging（投票）的集成算法和基于boosting（加权）的集成算法。基于投票的集成算法是将多个基础模型的结果进行投票，以确定最终的结果；基于加权的集成算法是将多个基础模型的结果进行加权，以确定最终的结果。  集成学习的示意图如下：    1）Bagging算法  Bagging算法流程图如下：    在Bagging算法中，基学习器的训练集是通过随机采样得到的，随机采样常使用自助采样法（Bootstrap sampling），即有放回的采样：对于m个样本的训练数据集合，每次随机采集一个样本放入采样集，接着把该样本放回，下次采样时该样本仍有可能被采集到，这样采集m次，最终可以得到m个样本的采样集。以上操作重复N次，可以得到N个不同的采样集。对于这N个采样集，我们可以分别独立训练出N个弱学习器，最后通过集成策略（投票法/平均法）得到一个强学习器。  可以看到，Bagging算法中，基模型之间不存在强依赖关系，一系列基模型可以并行生成。因为采样与投票/平均过程的复杂度很小，所以Bagging算法的复杂度与直接使用基模型的复杂度同阶，算法高效。  2）Boosting算法  Boosting算法流程图如下：    Boosting算法的基本思想是，将多个弱学习器组合成一个强学习器，从而提高学习性能。它的基本原理是，每个弱学习器都会从上一个弱学习器的错误中学习，从而提高学习性能。具体可以分为两种操作：重赋权法和重采样法。  重赋权法要求基学习器能对特定的数据分布进行学习，即在训练过程的每一轮中，根据样本分布为每个训练样本重新赋予一个权重。具体步骤如下：首先从训练集用初始权重训练出一个弱的基学习器1，根据基学习器的学习误差率来更新训练样本的权重，使得之前弱学习器1学习误差率高的训练样本的权重变高，使得这些误差率高的样本在后面的

点赞 22

评论 3

全部评论

推荐最新楼层

门头沟学院数字IC前端设计

楼主去哪里了

点赞回复分享

发布于 2023-04-10 01:00 山东

昨天 16:33

重庆工商大学审计

在新手保护期尽快完成职场社会化

秋招季陆陆续续开始了，在摆子当时选定offer踏入职场时，最正确的决定是争分夺秒完成职场社会化。在人才选拔多于培养，遵循优胜劣汰竞争法则的残酷职场，往往一步快、步步快，而在新人中显得成熟又decent是最容易加入核心圈的小切口。 ❶ 模仿。 - 避免露怯的保守方案是对标，模仿行为举止decent的3年级同事，观察行为和反馈。 - 大胆寻求具体建议，给模仿行为一个台阶下。 - 控制模仿范围和方式，避免被吐槽学人精。 ❷ 尝试。 - 把学生时代想去但嫌贵的都试一遍，贵价餐厅/运动/演出/旅行，尝试是最好的祛魅。 - 尝试新内容和新方法，找到长期工作中的禀赋。 - 告诫自己这只是尝试，被拒绝也是pl...

点赞评论收藏

分享

12-14 21:59

已编辑

门头沟学院测试工程师

华为OD软测面经（吐槽）

已经入职OD工作一段时间了，写这篇文章，与其说是面经分享，不如说是对自己心路经历的整理，以及过程里一些不吐不快的槽点。会包含个人情感倾向，留待自己以后再重新回顾，看看是否能一笑置之。（以上是宇宙免责说明）一、投递简历我是朋友内推，德科hr也不是我这边找的。这个德科hr，也是个神人，留待我下边各阶段提到了再说（不如说我想写这篇面经的大半原因就是这个神人德科hr）。建议：投递简历的时候，要找对自己期望城市的对应岗位投递页面进行投递，避免跨城市hr来进行流程，同时尽量入职前联系到华为部门的hr或同事了解情况，不要轻信德科hr，掉到跟我一样的坑。二、机试及综测毕业数年后，并没有接触过代码及测试工作。所...

查看5道真题和解析

点赞评论收藏

分享

11-17 01:16

河海大学 Java

26java日常实习简历，求教各位大神指正😖😖😖

点赞评论收藏

分享

11-01 19:18

蚌埠坦克学院智能驾驶系统工程师

这面试时间是认真的吗😰

Natrium_：这时间我以为飞机票

点赞评论收藏

分享

今天 18:09

Boston University

为什么面试官这么爱问性能优化？

作为一个六年前端，没有大厂经历，也没有什么出彩的项目，所以今年以来，前端现在这种行情下并没有收到多少面试，但是为数不多的面试中，百分之九十都问到了性能优化的问题，而且问题都出奇的一致：平时的工作中你有做过什么性能优化？对于这个问题其实我的内心os是（各位轻喷~）：你们怎么都这么爱问性能优化的问题？我的简历中也没有写到这个啊。你们的业务都这么复杂吗？怎么动不动就要性能优化？你们的代码写的这么拉吗？不优化都不能使用吗？性能优化是一个高级前端的必要技能吗？首先客观现实是笔者平时工作中的业务并不复杂，需要性能优化的地方确实不多，一些存在性能瓶颈的大多是使用了其他团队开发的东西，比如播放直播视频的SDK...

牛客解忧铺牛客在线求职答疑中心

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 你都收到了哪些公司的感谢信？ #

3745140次浏览 32442人参与

# 0offer是寒冬太冷还是我太菜 #

968694次浏览 8333人参与

# 被同事甩锅了怎么办 #

9903次浏览 70人参与

# 测测你的职业性格 #

7268次浏览 106人参与

# 秋招白月光 #

2823次浏览 85人参与

# 我的工作日记 #

27809次浏览 422人参与

# 数据人的面试交流地 #

466130次浏览 8072人参与

# 阿里求职进展汇总 #

78924次浏览 825人参与

# 机械人还在等华为开奖吗？ #

160767次浏览 807人参与

# 非技术er求职现状 #

27827次浏览 230人参与

# 一句话证明你在找工作 #

89481次浏览 749人参与

# 秋招最大的收获是什么？ #

1643次浏览 71人参与

# 你最满意的offer薪资是哪家公司？ #

2507次浏览 75人参与

# 我的实习求职记录 #

6329375次浏览 85399人参与

# 京东求职进展汇总 #

543648次浏览 4865人参与

# 你觉得实习只能是打杂吗？ #

89012次浏览 636人参与

# 我的简历长这样 #

2006460次浏览 27659人参与

# 非技术求职现状 #

236463次浏览 1592人参与

# 你的实习什么时候入职 #

78861次浏览 840人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

171009次浏览 1969人参与

牛客网
牛客企业服务