2023-04-07 17:25 已编辑门头沟学院自然语言处理

关注

算法岗常见面试题（六）：优化器

学习资料（讲的很细很清楚）：

一个框架看懂优化算法之异同 SGD/AdaGrad/Adam Adam那么棒，为什么还对SGD念念不忘 (3)—— 优化算法的选择与使用策略

(1条消息) 机器学习11种优化器推导过程详解(SGD,BGD,MBGD,Momentum,NAG,Adagrad,Adadelta,RMSprop,Adam,Nadma,Adamx)_日拱一两卒的博客-CSDN博客_机器学习优化器

总结

优化器的作用：更新和计算影响模型训练和模型输出的网络参数，使其逼近或达到最优值，从而最小化（或最大化）损失函数。

发展路径：SGD -> SGDM -> NAG -> AdaGrad -> AdaDelta / RMSProp -> Adam -> Nadam -> AdamW

发展阶段：

没有动量：梯度下降<计算所有样本的梯度平均> / SGD<随机选择一个样本计算梯度> / 小批量随机梯度下降<每次处理一批样本>
一阶动量（惯性）：SGDM<梯度更新方向由历史梯度更新方向和当前梯度更新方向共同决定> / NAG<假设参数先按上一轮梯度更新方向变化，再计算当前梯度更新方向>
二阶动量（自适应学习率）：AdaGrad<迄今为止所有梯度的平方和> / AdaDelta / RMSProp<只关注过去一段时间内的梯度更新频率>
一阶动量+二阶动量：Adam<SGDM+AdaDelta> / Nadam<NAG+AdaDelta> / AdamW<Adam+L2正则化>

各种优化器如何选择

刚入门选NAG或Adam
如果模型非常稀疏，优先考虑自适应学习率的算法
随机梯度下降算法的收敛速度和数据集大小的关系不大。因此，可以先用一个具有代表性的小数据集进行实验，测试一下最好的优化算法，然后通过参数搜索的方式寻找最优的训练参数。

等等。

BERT使用的优化器是什么？Adam相较于传统的SGD的优点是什么？（超参数一面）

BERT使用的是Adam优化器。Adam结合SGDM和AdaDelta两种优化算法的优点。对梯度的一阶动量（惯性）和二阶动量（更新频率）进行综合考虑，计算出更新步长。一阶动量的优势在于他能够学习到历史梯度下降的惯性，避免受到单个样本分布的干扰，减少震荡，加快收敛；二阶动量的优势在于是自适应学习率，为参数的不同维分配不同的学习率，在模型稀疏的情况下效果很好。

PS：Notion的笔记复制过来格式会变，这次就用截图吧，希望能看清楚。。。

全部评论

推荐最新楼层

用户273915282916

门头沟学院机器学习

你是我的神！

1 回复分享

发布于 2023-05-12 20:51 上海

ENSEA 图像识别

大佬能分享一下你的notion页面吗

1 回复分享

发布于 2023-09-10 22:08 山东

昨天 16:55

北京理工大学 Java

同事给我一种平静的疯感....

同事的情绪状态好稳定，上周我找他有事情，他说等一会，他现在在被领导骂，过了一会，他回来了，我问他领导骂完了吗，他说没有，他跟领导说他要去上厕所了，就乘机溜走了，真的好牛，不悲不喜不怨不恨，被骂也是工作的一部分，上班哪有不疯的

点赞评论收藏

分享

昨天 11:25

门头沟学院算法工程师

字节怎么才能看到面评

如题，字节跳动怎么才能看到自己的面评，找hr说看不到

SoulStar：自己应该看不到，这个是字节比较保密的信息，之前有mentor加我，说他能看到，但是不能给我说，给我说了他可能就要被辞退了

点赞评论收藏

分享

10-26 16:13

北京理工大学 FPGA工程师

25秋招，太逆天了

点赞评论收藏

分享

今天 00:49

湖南大学 iOS开发

本科非应届生真的要疯了

秋招真是让我感到无奈，本科的我根本没有机会。面试了无数企业，结果到现在连个消息都没有，路费都花了上千，真是心累。秋招竞争太疯狂，尤其是我这种非应届生，感觉直接就要放弃了。

牛客创作赏金赛

点赞评论收藏

分享

11 33 评论

招聘动态

杉川机器人

2025校园招聘

字节跳动

2025校园招聘

字节跳动Data

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 25届秋招总结 #

237603次浏览 1942人参与

# 学历or实习经历，哪个更重要 #

40225次浏览 292人参与

# 北方华创开奖 #

22168次浏览 251人参与

# 地方国企笔面经互助 #

2405次浏览 6人参与

# 你最想要的公司福利是？ #

38464次浏览 91人参与

# 选完offer后，你后悔学本专业吗 #

8852次浏览 61人参与

# 应届生被毁约被毁意向了怎么办 #

26059次浏览 236人参与

# 机械应届生薪资要多少才合适？ #

12224次浏览 59人参与

# 查收我的offer竞争力报告 #

15540次浏览 211人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2650次浏览 32人参与

# 没有实习经历，还有机会进大厂吗 #

804182次浏览 13798人参与

# 你觉得第一学历对求职有影响吗？ #

14757次浏览 121人参与

# 我的工作日记 #

20918次浏览 270人参与

# 不给转正的实习，你还去吗 #

1515227次浏览 16960人参与

# 寒假躺平还是提前实习 #

57797次浏览 424人参与

# 秋招OC许愿 #

225586次浏览 1861人参与

# 秋招被确诊为…… #

52521次浏览 293人参与

# 如何一边实习一边秋招 #

983695次浏览 12570人参与

# 总结:哪家公司面试体验感最差 #

25037次浏览 121人参与

# 公司情报交流地 #

31436次浏览 224人参与

# 面试题刺客退退退 #

136250次浏览 2083人参与

牛客网
牛客企业服务