2023-03-22 19:37 已编辑门头沟学院自然语言处理发布于江苏

关注

算法岗常见面试题（二）：正则化

学习连接：理解L1, L2正则化的正确姿势

归一化的主要目的是降低模型复杂度，减少过拟合。

最基本的正则化方法是在原目标（代价）函数中添加惩罚项，对复杂度高的模型进行“惩罚”。数学表达式为：

$\hat J(w;X,y)=J(w;X,y)+\alpha \Omega(w)$

其中 $J()$ 是目标函数， $\Omega(w)$ 为惩罚项，可以理解为模型“规模”的某种度量；参数 $\alpha$ 控制正则化的强度。

常用的正则化函数

L1范数，L1正则化（LASSO）： $\Omega(w)=||w||_1=\sum_{i=1}^n|w_i|$

L2范数，L2正则化（Ridge/岭回归（华为二面））: $\Omega(w)=||w||_2=\sum_{i=1}^nw_i^2$

如何实现降低复杂度

对于目标函数，第一部分权重尽力拟合训练数据，第二部分令权重尽可能小，当无穷大的时候，权重会接近于0。添加了惩罚项的损失函数，综合考虑的模型的拟合能力和复杂程度，从而找到合适的。

L1正则化比L2正则化更容易得到稀疏解的原因

从解空间的形状来看，L1范数是以原点为中心的菱形，而L2范数是以原点为中心的圆。目标函数的解，是原目标函数和正则化项的切点。对于L1范数而言，随着正则化项的权重逐渐增大，它与原目标函数的交点会不断接近坐标轴，最终落在坐标轴上，这时候就会有权重w为0的情况；而对于L2范数而言，无论正则化项的权重如何改变，它和目标函数的交点也都会落在象限上。因此，L1正则化比L2正则化更容易得到稀疏解的原因。

L1、L2正则化的适用场景

L1使模型中尽可能多的参数值为0，因此适用于：模型剪枝，模型压缩，特征选择。是一种从改变模型结构的角度（减少模型参数的数量）解决过拟合的方式。

L2使模型中的所有参数值尽可能小，使得模型尽量不依赖于某几个特殊的特征，而是使每个特征都能得到尽量均衡的权重，因此适合解决普通的过拟合问题，即从参数分布（使分布尽可能的均匀）的角度解决过拟合问题。

l1和l2正则化的区别是什么，是什么原因导致的

L1正则化对应L1范式（Lasso）； L2正则化对应L2范式（岭回归）
L1正则化得到稀疏矩阵，自动进行特征选择；L2正则化让参数尽可能小，防止过拟合；
L1正则化趋于选择少量特征，其他特征都是0；L2正则化趋于选择更多的特征，这些特征都会接近与0

从贝叶斯角度解释正则化项（陌陌笔试）

聊一聊机器学习的MLE和MAP：最大似然估计和最大后验估计 - 知乎 (zhihu.com)

概述：交叉熵损失函数本质上是最大似然估计MLE，正则化等价于MLE+先验概率。所以，从贝叶斯的角度看，损失函数+正则化就是贝叶斯最大后验估计MAP。

全部评论

推荐最新楼层

香港教育大学算法工程师

可以

1 回复分享

发布于 2023-04-13 00:08 香港

小金鱼噗噗噗

蚂蚁集团_java工程师

太赞了~喜欢

1 回复分享

发布于 2023-03-23 13:15 湖北

苏州大学自然语言处理

请问一下目标函数这样的同心圆是基于什么假设？

点赞回复分享

发布于 2023-06-27 16:30 浙江

不愿透露姓名的神秘牛友

03-06 16:37

已编辑

校招Offer选择：浙江泰隆商业银行、华为

浙江泰隆商业银行 Java工程师 17.0k*14.0, 总包：25+1 硕士

点赞评论收藏

分享

04-02 16:29

已编辑

深圳大学 Python

腾讯技术架构部门测试开发面经

双非硕，非科班简历上就一个Webserver 其他就是实验室做的医学图像项目手撕：LeetCode55.跳跃游戏字符串至少出现k次的子字符(写完就知道完蛋了，第一题看错是跳跃距离最后经面试官提醒才发现，第二道完全没思路)八股：tcp/udp的区别进程和线程的区别如果避免线程冲突多线程的锁机制哈希表和实现数据库(还有些忘了，都是常规八股了)项目：Webserver项目完全没问啊喂问了后面医学图像处理的项目，感觉是前面表现太差，已经进入聊天环节了然后围绕项目问了些简单的问题，最后说可能这一块和业务差距有点大，听到这里我就知道gg了反问：需要提升什么？面试官：多刷算法题也挺有意思的，整天局限在卷积卷积也不好(笑

查看11道真题和解析

点赞评论收藏

分享

03-15 21:28

上海大学前端工程师

百度日常二面

自我介绍实习时间公司选择经历算法：数组扁平化+排序+去重项目无八股快排太久没写了没整出来 #百度##前端##面经#

查看6道真题和解析

点赞评论收藏

分享

03-17 15:30

首钢工学院算法工程师

百度暑期算法实习一二面凉经

bg：本2硕9 一篇小众方向的CV顶会一作 若干论文在投 无实习经历一面：50min自我介绍论文详细介绍一下对扩散模型了解吗？介绍一下蒸馏技术原理。扩散模型蒸馏了解吗？零碎的大模型相关技术原理手撕代码 力扣中等难度 写出来了二面：1h介绍一下你的方向和工作（太小众了面试官没听过）简历拷打（中间面试官跑了五分钟）你这个方向和主流脱节有点大，做道思维题介绍完场景，想了很久，最后想出来大致是基数排序，中间面试官估计看我不怎么会，直接说感觉你准备的不太充分，后面还有机会，你得多follow前沿技术（组里做天坑ai方向又不放日常实习的心里苦），然后就挂了

查看7道真题和解析

点赞评论收藏

分享

03-14 14:08

东南大学 Java

百度日常实习面经

1、询问实习时间，要求越长越好，感觉对我的能实习的时间不太满意2、Spring和SpringBoot框架的区别？3、讲讲你对SpringBoot的理解，你觉得他有哪些核心的能力？ - IoC、AOP4、你刚刚讲到IoC，那么在Spring中如何管理这些Bean的，Bean是怎么初始化的，或者说Bean初始化的内容从哪里来？5、Synchronized和RetrantLock在功能上的区别，核心原理是什么？6、线程池参数，有哪些用法？7、在一个接口里面我要创建一个线程池使用，我有什么办法创建一个公共的线程池嘛，还是说每次调用这个接口都创建一个线程池？算法：手写快速排序#牛客AI配图神器#

查看7道真题和解析

点赞评论收藏

分享

评论

10

98

招聘动态

汇丰科技中国

25届校招+26届实习

滴滴

2026届秋招储备实习生招聘

26届实习生双选会报名开启

26届实习求职交流群

理想汽车

2025春季校园招聘

26届投递链接合集

26届实习软件笔试必刷题单

招商银行数字金融训练营

火热报名中

携程集团

25届校招+26届实习

字节跳动Tik Tok

26届实习招聘

全站热榜

更多

华为实习进展

热聊中

创作者周榜

更多

正在热议

更多

# 实习进度记录 #

73536次浏览 654人参与

# 第一份工作应该选高薪还是热爱？ #

43521次浏览 418人参与

# Keep实习校招 #

26802次浏览 182人参与

# 春招进度记录 #

66100次浏览 494人参与

# 你知道哪些职场黑话？ #

27318次浏览 218人参与

# 招银网络求职进展汇总 #

99294次浏览 629人参与

# 地方国企笔面经互助 #

19891次浏览 31人参与

# 风评不好的公司，你会去吗？ #

32506次浏览 157人参与

# 毕业后不工作的日子里我在做什么 #

157096次浏览 1368人参与

# 我的第一份实习怎么找的 #

69438次浏览 692人参与

# 软开人，说说你的烦心事 #

39010次浏览 258人参与

# 24届营销人拿到了几个offer #

13704次浏览 116人参与

# 机械人值得去的医疗器械企业 #

14127次浏览 38人参与

# 你想吐槽公司的哪些规定 #

13235次浏览 43人参与

# 投格力的你，拿到offer了吗？ #

75237次浏览 552人参与

# 如何用一句话描述你的职业 #

17763次浏览 161人参与

# 去哪儿求职进展汇总 #

122203次浏览 933人参与

# 晒晒你的元宵动态 #

28974次浏览 250人参与

# 诺瓦星云求职进展汇总 #

190436次浏览 1632人参与

# 你的实习什么时候入职 #

164185次浏览 1458人参与

# 我在牛爱网找对象 #

168600次浏览 1249人参与

牛客网
牛客企业服务