Ade201903072040415

2021-08-30 11:56 已编辑香港大学大数据开发工程师

关注

秋招知识点记录（二）——XGBoost,GBDT与RF

Random Forest和GBDT区别如下：

RF的基分类器可以是分类树也可以是回归树，GBDT只能是回归树。
RF不同基分类器可以并行，GBDT只能串行。
RF最终结果采用的策略是多数投票、一票否决、加权投票等，而GBDT是将所有结果（加权）累加起来。
RF对异常值不敏感，GBDT对异常值敏感
RF对训练集一视同仁，GBDT基于Boosting思想，基于权值，分类器越弱，权值越小
RF主要减少模型方差，所以在噪声较大的数据上容易过拟合，而GBDT主要较少模型偏差。
RF随机选择样本，GBDT使用所有样本。

Xgboost就是GBDT的一种，所以Xgboost和RF的区别和GBDT一样。

GBDT和Xgboost的区别如下：

基分类器的选择：传统GBDT以CART作为基分类器，XGBoost还支持线性分类器，这个时候XGBoost相当于带L1和L2正则化项的逻辑斯蒂回归（分类问题）或者线性回归（回归问题）。
梯度信息：传统GBDT只引入了一阶导数信息，Xgboost引入了一阶导数和二阶导数信息，其对目标函数引入了二阶近似，求得解析解, 用解析解作为Gain来建立决策树, 使得目标函数最优（Gain求到的是解析解）。另外，XGBoost工具支持自定义损失函数，只要函数可一阶和二阶求导。
正则项： Xgboost引入了正则项部分，这是传统GBDT中没有的。加入正则项可以控制模型的复杂度，防止过拟合。
特征采样： Xgboost引入了特征子采样，像随机森林那样，既可以降低过拟合，也可以减少计算。
节点分裂方式：GBDT是用的基尼系数，XGBoost是经过优化推导后的。
并行化：传统GBDT由于树之间的强依赖关系是无法实现并行处理的，但是Xgboost支持并行处理，XGBoost的并行不是在模型上的并行，而是在特征上的并行，将特征列排序后以block的形式存储在内存中，在后面的迭代中重复使用这个结构。这个block也使得并行化成为了可能，其次在进行节点分裂时，计算每个特征的增益，最终选择增益最大的那个特征去做分割，那么各个特征的增益计算就可以开多线程进行。
除此之外，Xgboost实现了分裂点寻找近似算法、缺失值处理、列抽样（降低过拟合，还能减少计算）等包括一些工程上的优化，LightGBM是Xgboost的更高效实现。

Reference:
[1]原文链接：https://blog.csdn.net/quiet_girl/article/details/88756843

全部评论

推荐最新楼层

06-27 14:31

北京科技大学硬件产品经理

一不小心听到实习生妹妹在卫生间吐槽我……

这件事怎么说呢，就挺突然的，我去卫生间，正好听到有人说我的花名，手舞足蹈的。没想到是我的实习生，我稍微有点尴尬，她看到了立马过来跟我道歉了，然后我就原谅了她。毕竟，除了原谅她，我还能咋？ 但是，想在这给初入职场的小伙伴提醒一下哦！1️⃣不要跟同事吐槽另一个的同事职场上不要随便说同事的坏话，因为在你看不到的地方，可能已经有人把你说的话转达给了其他人，同时把自己摘得干干净净。2️⃣就算要吐槽领导，自己也要小心点真的有人会不小心把吐槽领导的话误发给本人，双方都尴尬得要命，其实可以设置不显示聊天框，免得自己发错。 现在公司里带新人都是一对一导师制，每天低头不见抬头见，要是出现这种事情，表面虽然风平浪静...

glaze*0819：谨言慎行！忽然好怕我的mt也刷牛客😭

实习吐槽大会

点赞评论收藏

分享

06-26 14:17

门头沟学院机械结构工程师

在小米实习体验分享！

在小米3个月的实习结束啦，日子过得好快！第一份实习就是完美体验，米你让我以后的日子怎么过呀mentor和组里的哥姐都超级好，年轻又专业，教东西又快又好，从不push都是肯定我们组实习生也从不加班，每天准时到点吃饭和下班，食堂好吃还有猫咖可以撸猫！吃了饭还可以在园区里和同事们散步并且从学校来小米一趟地铁直达，随时有座，在北京来说是很幸福的通勤体验了。最重要的是交到了好多实习生朋友，超级不舍的离开大家

投递小米集团等公司8个岗位

点赞评论收藏

分享

06-03 17:01

门头沟学院 Java

小厂实习还有考察吗？

大家实习都是做这么厉害的项目吗？我要是能做这种应该是不会0offer了吧

热血的ssr摆烂了：这种要比后端简单

点赞评论收藏

分享

06-04 18:03

河南工程学院 Java

27届大二项目只做了苍穹外卖

全是已读不回，真后悔之前那么摆烂那么可以改一下啊兄弟们，求拷打

代码飞升：别用口语，后端就写后端，前端就写前端，最后别光后悔

点赞评论收藏

分享

昨天 00:43

东南大学 C++

小鹏26届校招AI面

还没开始面试就流程终止，这个合理吗。还给我发了AI测评的链接

小鹏汽车AI面7人在聊

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得现在还能进互联网吗？ #

2615次浏览 73人参与

# 如何准备秋招 #

5599次浏览 87人参与

# 现代汽车前瞻技术研发急速编程挑战赛 #

19332次浏览 173人参与

# 实习，不懂就问 #

18051次浏览 248人参与

# 如果中了500万，你会离职吗？ #

86759次浏览 679人参与

# 你觉得实习能学到东西吗 #

8158次浏览 184人参与

# 哪个瞬间让你对大厂祛魅了？ #

379772次浏览 2777人参与

# 面试时被问的最奇葩的问题 #

21633次浏览 125人参与

# 秋招什么时候开投比较合适？ #

3409次浏览 61人参与

# 软开人，秋招你打算投哪些公司呢 #

99655次浏览 935人参与

# 来聊聊你认为的薪资天花板是哪家？ #

30377次浏览 174人参与

# 每个月的工资都是怎么分配的？ #

8128次浏览 143人参与

# 预测一下26届秋招形势 #

13143次浏览 134人参与

# 腾讯工作体验 #

473822次浏览 3490人参与

# 打工人的精神状态 #

52143次浏览 943人参与

# 职场情商大赛 #

131299次浏览 655人参与

# 高考出分的那一天，我__ #

10400次浏览 147人参与

# 非技术2024笔面经 #

384745次浏览 4732人参与

# 一觉醒来，秋招难度下降一万倍…… #

83577次浏览 642人参与

# 京东美团大战，你怎么看？ #

92645次浏览 569人参与

# 安利/避雷我的专业 #

75521次浏览 522人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务