按说损失函数的二阶导确实比一阶导收敛更快,就像是牛顿迭代法中用海塞矩阵比SGD好一样

相关推荐

暮雨轻歌:看起来hr不能接受我菜查看图片
点赞 评论 收藏
分享
1个小白:可以考虑投一下字节
点赞 评论 收藏
分享
牛客网
牛客企业服务