引入L1正则,也可以理解为对参数分布做了假设,假设w服从拉普拉斯分布,而L2是做了高斯分布;其实工程中由于是浮点数参与计算,L1并不会真正的成0,而是通过截断形式的计算,强行将小的参数w变成0
点赞 1

相关推荐

昨天 20:09
武汉纺织大学 C++
点赞 评论 收藏
分享
野猪不是猪🐗:把你的学校加黑,加粗,斜体,下划线,描边,内阴影,内发光,投影,外发光,再上渐变色,居中,放大到最大字号,再把简历里其它内容删了,就行了
点赞 评论 收藏
分享

牛客热帖

更多
牛客网
牛客企业服务