蒋豆芽

2021-08-10 11:58 已编辑五邑大学 C++

关注

payphone_lx-阿里妈妈-面经——解答

从今天起，豆芽有空也尽己所能，帮助一下大家。

面经来源：https://www.nowcoder.com/discuss/702074?source_id=discuss_experience_nctrack&channel=-1

1. 牛顿法和拟牛顿法介绍一下

牛顿法可由二阶泰勒展开求导可近似得到牛顿法迭代公式： $x_{n+1}=x_n-\frac{f(x_n)}{f^{'}(x_n)}$

但是在实际应用过程中，我们会发现海塞矩阵的逆矩阵往往计算比较复杂，于是又有了拟牛顿法来简化这一过程。

在拟牛顿法中，考虑优化出一个n阶矩阵D来代替海塞矩阵的逆矩阵。可以发现海塞矩阵逆矩阵的近似矩阵D(x)的选择条件比较灵活，可以有多种具体的实现方法。比较常用的算法是DFP算法替代海塞矩阵逆矩阵的迭代公式

2. 有哪些优化方法使用了二阶动量？

Adagrad法、Adadelta法、RMSProp法、Adam法

3. 描述一下过拟合现象

过拟合：训练集效果很好，测试集效果较差

欠拟合：训练集效果差，测试集效果也差。

4. 抑制过拟合的方法有哪些？

扩充数据集、l1、l2，dropout、BN、验证集、模型集成

5. 介绍一下BatchNorm。

BN（Batch Normolization）是Google提出的用于解决深度网络梯度消失和梯度爆炸的问题，可以起到一定的正则化作用。我们来说一下它的原理：

批规范化，即在模型每次随机梯度下降训练时，通过mini-batch来对每一层卷积的输出做规范化操作，使得结果（各个维度）的均值为0，方差为1。

BN操作共分为四步。输入为 $x_i$ ，第一步计算均值：

$\mu_{\beta} = \frac{1}{m} \sum_{i=1}^m x_i \\ \tag{.}$

第二步计算数据方差：

$\sigma_{\beta}^2 = \frac{1}{m} \sum_{i=1}^m (x_i-\mu_{\beta})^2 \\ \tag{.}$

第三步进行规范化：

$x_i^* = \frac{x_i-\mu_{\beta}}{\sqrt{\sigma_{\beta}^2 +\epsilon}} \\ \tag{.}$

第四步尺度变换和偏移：

$y_i = \gamma \cdot x_i^* + \beta = BN_{\gamma,\beta}(x_i) \\ \tag{.}$

$m$ 表示mini-batch中的数据个数，可以看出，BN实际就是对网络的每一层都进行白化操作。白化操作是线性的，最后的“尺度变换和偏移”操作是为了让BN能够在线性和非线性之间做一个权衡，而这个偏移的参数 $\gamma$ 和 $\beta$ 是神经网络在训练时学出来的

经过BN操作，网络每一层的输出小值被“拉大”，大值被“缩小”，所以就有效避免了梯度消失和梯度爆炸。总而言之，BN是一个可学习、有参数（γ、β）的网络层。

6. BN在测试阶段使用的mean、var是如何获得的？

训练时，均值和方差针对一个Batch。

测试时，均值和方差针对整个数据集而言。因此，在训练过程中除了正常的前向传播和反向求导之外，我们还要记录每一个Batch的均值和方差，以便训练完成之后按照下式计算整体的均值和方差：

上面简单理解就是：测试模型中，对于均值来说直接计算所有batch $\mu_{\beta}$ 值的平均值；然后对于标准偏差采用每个batch $\sigma_{\beta}$ 的无偏估计（无偏估计是用样本统计量来估计总体参数时的一种无偏推断）。

最后测试阶段，BN的使用公式就是：

以上所有题的答案其实都来源于我的博客面经，欢迎大家围观：https://blog.nowcoder.net/jiangwenbo

#阿里巴巴22届秋招面试##面经##阿里巴巴##算法工程师#

全部评论

推荐最新楼层

下一个我201904261108464

阿里巴巴_测试开发工程师

需要妈妈内推的可以联系我，任何岗位都可以内推

2 回复分享

发布于 2021-08-10 14:28

我家的狗不咬人

山东大学运营

1 回复分享

发布于 2021-08-10 17:22

beautiful走了

安徽大学 Java

赞！

1 回复分享

发布于 2021-08-10 12:15

Egotistic

哈尔滨工程大学 Java

干货满满，蟹蟹楼主~

1 回复分享

发布于 2021-08-10 12:14

Kekemama

门头沟学院营销

求问楼主阿里妈妈今年秋招什么时候发意向书，等了超过一周了🙏🙏🙏🙏🙏🙏

点赞回复分享

发布于 2021-09-08 06:56

时不我待a

门头沟学院项目经理

博主您好，能讲一下L1.L2正则化的区别和适用场景吗？

点赞回复分享

发布于 2021-08-16 20:42

04-15 22:19

已编辑

门头沟学院 Java

美团JAVA暑期一面凉经

自我介绍项目难点，实验室项目说数据量大，后面被面试官评价说太小了（反问环节表达的这个意思，面试官人很好）如何校验幂等性JAVA八股1.多态用于解决什么问题2.重载和重写的概念以及应用场景，要求举例子（重载我举了Integer.valueof的例子，重写当时大脑宕机了真没想出来）3.JVM内存结构了解吗（说了一半被打断了）4.垃圾回收机制（我说新生代创建对象空间不足时执行MinorGC，老年代、元空间内存不足时执行FullGC）5.有没有排查过FullGC相关的问题（没有）6.synchronized应用场景（线程不安全，需要同步）7.实现机制（JVM）8.锁升级了解吗（记不太清了说的是轻量级锁...

美团一面1979人在聊

查看19道真题和解析美团求职进展汇总

点赞评论收藏

04-14 14:56

汤臣倍健_人力_HR

汤臣倍健面经—市场管培生

其实最难的不是offer，而是进入了公司，发现累的要死，很多同学进入了工作后，朋友圈就没有更新过了，所以大家在签约的时候一定要打听清楚！ 目前的重点还是先尽量投，尽量拿到！offer就和抢演唱会票一样，抢完第一波之后等回流了，大佬拿着再多意向书，最后也只能签一个，，越厉害的，拿的offer越多，且都是非线性增长的，只要上面的人释放完意向，紧接着链式反应，大家都会有有offer的第一轮 3个人一组 面试官问问题挨个回答1.自我介绍2.简历深挖，对市场策略的内容问的非常细，问了很多候选人是如何理解xx市场的问题3.如果让你在闲鱼卖汤臣的产品，怎么写文案4.最近印象比较深的消费品5.对汤臣倍健的品...

汤臣倍健开奖29人在聊

点赞评论收藏

03-11 18:24

已编辑

山东大学 Java

后悔时间报少了

现在已经不回我了😭ps：求大家建议。本人是出国选手，想水个实习整简历上，类似的中小厂写留学申请上能有用吗？中大厂感觉来不及学了，lc刷才30题....

数开小菜鸡__求offer版：这么单纯干啥，问就是全国可飞，实习6个月

点赞评论收藏

04-12 17:02

科大讯飞_算法工程师

暑期实习已经开了这么多了？

建了一个组，好多26大佬互相学习分享笔面经验。OPPO ，网易，腾讯，字节，阿里开了26暑期实习，想拉大家组个队，一起交流笔面，共享信息。已经好多人进来了。【qiuzhao6】 聪明的人自己会找到。找不到了的私信或评论组队。目测有百度，字节，阿里云，腾讯，OPPO ，网易互娱，淘天，美团等好多等#牛客AI配图神器#

点赞评论收藏

招聘动态

汇丰科技中国

25届校招+26届实习

滴滴

2026届秋招储备实习生招聘

26届实习生双选会报名开启

26届实习求职交流群

理想汽车

2025春季校园招聘

26届投递链接合集

26届实习软件笔试必刷题单

招商银行数字金融训练营

火热报名中

携程集团

25届校招+26届实习

字节跳动Tik Tok

26届实习招聘

全站热榜

华为实习进展

热聊中

创作者周榜

正在热议