所以xgb收敛速度比gbdt更快(牛顿法收敛速度比梯度下降更快),为什么不用更高阶的泰勒展开,因为会使损失函数为非凸函数,无法令其导为0

相关推荐

头像
昨天 17:53
已编辑
门头沟学院 Java
点赞 评论 收藏
分享
虚闻松声:简历没啥问题,高亮嵌入式的一些主流和关键技术。 多投递,多看校招。关注学校公告(包括附近的学校) 年级公告 牛客消息汇总等等 免费修改简历,求职沟通,欢迎交流。
点赞 评论 收藏
分享
牛客网
牛客企业服务