快速了解Batch Normalization

　　机器学习领域有个很重要的假设：IID独立同分布假设，就是假设训练数据和测试数据是满足相同分布的，这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。那BatchNorm的作用是什么呢？BatchNorm就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的。

BN的基本思想：因为深层神经网络在做非线性变换前的激活输入值（就是那个x=WU+B，U是输入）随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动，之所以训练收敛慢，一般是整体分布逐渐往非线性函数的取值区间的上下限两端靠近（对于Sigmoid函数来说，意味着激活输入值WU+B是大的负值或正值），所以这导致后向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的本质原因，而BN就是通过一定的规范化手段，把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0方差为1的标准正太分布而不是正态分布，其实就是把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化，意思是这样让梯度变大，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。

1.Batch Normalization导读 - 张俊林的博客 - CSDN博客https://blog.csdn.net/malefactor/article/details/51476961

2.BN 层原理解析 - m0_37699976的博客 - CSDN博客https://blog.csdn.net/m0_37699976/article/details/81584101

全部评论

推荐最新楼层

11-15 23:52

旷视_运营_HR

旷视11月缺人岗位

11月这两个岗位比较缺人，大家还没投的继续试试！大模型产品经理（北京）职位描述：1.负责大模型ToB业务的规划设计，包括ToB产品的设计迭代以及关键项目的落地；2.根据落地场景把控大模型优化方向，设计大模型产品效果评估指标体系，参与产品的评估、验收相关工作；3.与基座模型、研发、设计、销售团队紧密合作，高效协同各方资源，保证项目高质量交付；4.关注行业及竞品最新动态，输出市场调研与分析，为产品优化提供有效建议。职位要求：1. 计算机相关专业本科及以上学历；2.有责任心和owner意识，有优秀的沟通和协调能力；3.具备优秀的自学能力和独立思考能力，善于思考和表达自己的想法，具备良好的团队合作精神...

投递旷视等公司10个岗位 >

点赞评论收藏

11-18 02:02

已编辑

门头沟学院 Java

25 学院本

学院本，有一段小厂的实习，秋招颗粒无收开始投递实习，请各位大佬看看简历有没有问题，顺带拷打一下感谢各位大佬

ZoeXx：别搞java了

点赞评论收藏

11-09 14:54

已编辑

华南农业大学产品经理

请赐教😭😭

25届应届生，目前0 offer，焦虑坏了😭😭

大拿老师：这个简历，连手机号码和照片都没打码，那为什么关键要素求职职位就不写呢？从上往下看，都没看出自己到底是产品经理的简历，还是电子硬件的简历？这是一个大问题，当然，更大的问题是实习经历的描述是不对的不要只是去写实习流程，陈平，怎么去开会？怎么去讨论？面试问的是你的产品功能点，是怎么设计的？也就是要写项目的亮点，有什么功能？这个功能有什么难处？怎么去解决的？实习流程大家都一样，没什么优势，也没有提问点，没有提问，你就不得分另外，你要明确你投的是什么职位，如果投的是产品职位，你的项目经历写的全都是跟产品无关的，那你的简历就没用你的面试官必然是一个资深的产品经理，他不会去问那些计算机类的编程项目所以这种四不像的简历，在校招是大忌

点赞评论收藏