2023-11-19 15:47 已编辑腾讯_微信_算法

关注

《机器学习高频面试题详解》4.5：模型融合：迭代法（一）

点击上方卡片链接就可以进入专栏，专栏右上角有订阅选项，欢迎大家订阅～

前言

大家好，我是鬼仔，今天带来《机器学习高频面试题详解》专栏的第四章中模型融合第三部分的内容：迭代法，基于迭代的经典方法有三种：boosting、stacking和blending，今天先讲第一种boosting算法。这是鬼仔第一次开设专栏，每篇文章鬼仔都会用心认真编写，希望能将每个知识点讲透、讲深，帮助同学们系统性地学习和掌握机器学习中的基础知识，希望大家能多多支持鬼仔的专栏～

目前这篇是试读，后续的文章需要订阅才能查看哦，专栏预计更新30+篇文章（只增不减），具体内容可以看专栏介绍，大家的支持是鬼仔更新的动力！

本文大纲
一、原理	1. 核心思想
	2. 基本流程
二、面试真题	1. Boosting方法的优缺点？
	2. 常见的Boosting方法？
	3. Boosting算法需要关注哪些超参数？请简要说明它们的作用及如何影响模型性能？
	4. 在实际应用中如何克服Boosting算法的一些局限性？
	5. 请详细介绍 AdaBoost 算法的工作原理，并解释其如何实现模型融合以提升分类器性能？

一、原理

1. 核心思想

Boosting的核心思想是通过串行训练一系列基模型，每个模型都试图纠正前一个模型的预测误差。这样，后续的模型会更加关注在前一个模型中预测错误的样本，从而在整个训练过程中逐步提高整体模型的预测性能。也就是说，Boosting方法主要通过降低模型的偏差来提高预测性能。

2. 基本流程

1）初始化：首先为训练数据集中的每个样本分配相同的权重： $w_i = 1/N$ ，其中N是训练数据集的大小。

2）基模型训练：对于每个基模型（如决策树、支持向量机等），按照以下步骤进行训练：

使用带权重的训练数据集训练模型；
计算模型在训练数据集上的预测误差；
计算模型的权重（通常使用预测误差来计算模型权重，例如，权重可以是预测误差的函数）；
根据模型的预测误差调整训练数据集中每个样本的权重，使得预测错误的样本在后续模型中具有更大的权重。

3）模型融合：在训练完所有基模型后，需要将它们的预测结果进行融合。Boosting方法通常使用加权平均或加权投票的方式进行融合，其中模型的权重由预测误差计算得出。

二、面试真题

1. Boosting方法的优缺点？

1）优点：

高预测性能：Boosting方法可以显著提高预测性能，尤其是当基模型的性能较差时；
降低偏差：Boosting方法主要通过降低模型的偏差来提高预测性能，因此对于偏差较大的基模型（如浅层决策树）非常有效；
自适应：Boosting方法可以自适应地调整训练数据集的权重，使得后续模型更关注预测错误的样本。

2）缺点：

计算复杂度：Boosting方法需要串行训练基模型，因此计算复杂度较高，尤其是在大数据集上。
容易过拟合：Boosting方法在降低模型偏差的同时可能增加模型的方差，因此在某些情况下可能导致过拟合。
对噪声敏感：Boosting 方法通过

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

机器学习高频面试题详解文章被收录于专栏

专栏作者曾在校招期间拿到包括字节、微信和华为等多家大厂的SSP offer，该专栏主要是为了帮助同学们系统性地学习和掌握机器学习中的基础知识。专栏详细地整理了各大厂的算法岗面经，力争深入浅出地讲解重要知识点，适合人群为准备校招或者实习，且目标岗位为算法岗、数据挖掘岗或者数据分析岗的同学。

全部评论

推荐最新楼层

牛客677003511号

佬，不更新了吗？？

点赞回复分享

发布于 2024-06-13 18:05 北京

03-31 19:39

广州灵犀互娱信息技术有限公司_游戏项目管理工程师(准入职员工)

灵犀互娱内推

实习时候的真实感受~从面试就有被震撼到的公司环境，在cbd打工环境风景都超好的，下班的落日经常超级好看！！ 工资超级美丽，福利待遇也很好，而且每天没有考勤打卡这种事情的幸福谁懂啊！！！偶尔睡过头或者天气不好迟到一会一点影响都没有每天过着早十晚六的生活（其实也不是那么准时）而且从来没加过班！！ 感觉是运气很好来到了一个很好的部门，部门十几个人大家都非常和善部门氛围很好很好，leader很有趣很有意思几乎每周组里都有下午茶奶茶，组里帅哥美女又多大家也都非常非常好 以及有一个巨好的带教师兄虽然我也不是实习多丰富的人但我的带教师兄真的是我见过听过的mentor里最最最好的了！会额外教我们很多东西，也会...

阿里巴巴灵犀互娱公司氛围 123人发布

点赞评论收藏

分享

04-01 13:12

门头沟学院

鹅孝子转码五个月荣获腾讯后端开发暑期实习Offer

二本九硕天坑转码，为我的转码之路做个阶段总结勤勤恳恳的五个月，数不清多少个夜晚凌晨，多少个早起日出————在转码路上质疑真的很多:985硕士去干这个有什么用?但我只管前行，路虽远，行则必至!————最初我知道时间有限，必须把时间都用在刀刃上，所以我去咨询行业里的朋友，规划学习路线和目标，而后按路线学习，学完基础的技术栈，就开始做项目，刷算法，整理八股笔记背八股，再然后开始简历编写，日常实习的面试，受到挫折，再继续沉淀学习，最终在三月终于获得了腾讯后端开发暑期实习的 offer————想来以为这一路有很多很多的话说没想到总结下来也就是短短几行

点赞评论收藏

分享

03-08 21:25

沙洲职业工学院运营

遇到霸王合同老实了

learYuan：🐕看了都摇头

点赞评论收藏

分享

03-10 20:45

已编辑

蚌埠坦克学院 C++

你是我见过最帅的 hr

替牛油门试了，这招也不好用😜 #牛客创作赏金赛#

YamadaAnna：艹，这家就在我隔壁

牛客创作赏金赛

点赞评论收藏

分享

04-03 18:06

美团_后端开发(实习员工)

淘天集团一面

面试官看起来很有干劲，而且愿意开摄像头，感觉是个挺好的人，面试起来不是很有压力。1.自我介绍；2.项目介绍；3.任务调度该如何实现，只考虑worker集群里面一台机器的情况；4.公平锁和非公平锁的特点是什么？ 怎么实现的？5.MySQL联合索引6.SpringBoot注解的功能7.Spring注解的功能8.WorkFlow了解算法：顺时针遍历二维数组体验：面试官很好，氛围感很棒； 不过感觉项目介绍得不够深，所以后面的问题就比较浅而且比较标准了。 可惜了。emo去了，共勉。

投递淘天集团等公司10个岗位 >

点赞评论收藏

分享

评论

点赞

2

招聘动态

26届实习软件笔试必刷题单

26届实习生双选会报名开启

满帮集团

2025春季校园招聘

26届实习求职交流群

贝壳找房

2026届实习生招聘

招商银行信用卡

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 滴滴求职进展汇总 #

167124次浏览 1653人参与

# 你觉得材料专业有必要实习嘛 #

10304次浏览 50人参与

# 美团求职进展汇总 #

1908858次浏览 17724人参与

# 找工作有哪些冷知识 #

5173次浏览 85人参与

# 应届生应该先就业还是先择业 #

92050次浏览 564人参与

# 德州仪器求职进展汇总 #

4304次浏览 139人参与

# 实习期间如何提升留用概率？ #

17620次浏览 273人参与

# 应届生简历当中，HR最关注哪些？ #

26511次浏览 215人参与

# 互联网公司爆料 #

109572次浏览 649人参与

# vivo工作体验 #

17992次浏览 116人参与

# 机械人避雷的岗位/公司 #

8985次浏览 51人参与

# 牛友投递互助，不漏校招机会 #

263414次浏览 3633人参与

# Offer比较，你最看重什么？ #

139846次浏览 886人参与

# 扒一扒那些奇葩实习经历 #

20844次浏览 598人参与

# 机械人，说说你的烦心事 #

58538次浏览 794人参与

# 通信/硬件求职避坑tips #

47761次浏览 442人参与

# 双非能在秋招上岸吗？ #

205558次浏览 1064人参与

# 你遇到过哪些神仙同事 #

60128次浏览 590人参与

# 小鹏汽车工作体验 #

6346次浏览 42人参与

# 毕业季，你想好怎么跟生活对线了吗？ #

184956次浏览 3430人参与

牛客网
牛客企业服务