机器学习算法工程师校招笔试题-大疆-2019
大疆机器学习算法工程师2019校招笔试题
1.1 其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题?
A. 增加训练集量
B. 减少神经网络隐藏层节点数
C. SVM算法中使用高斯核/RBF核代替线性核
D. 删除稀疏的特征
答案选择:C
分析:
过拟合的根本原因是特征维度过多,模型假设过于复杂,参数过多,训练数据过少,噪声过多,导致拟合的函数完美的预测训练集,但对新数据的测试集预测结果差。过度的拟合了训练数据,而没有考虑到泛化能力。
减少过拟合总结:过拟合主要是有两个原因造成的:数据太少+模型太复杂
(1)获取更多数据 :从数据源头获取更多数据;数据增强(Data Augmentation)
(2)使用合适的模型:减少网络的层数、神经元个数等均可以限制网络的拟合能力;
(3)dropout ;
(4)正则化,在训练的时候限制权值变大;
(5)限制训练时间(提前停止);通过评估测试;
(6)增加噪声 Noise: 输入时+权重上(高斯初始化) ;
(7)Batch Normalization。
(8)结合多种模型: Bagging用不同的模型拟合不同部分的训练集;Boosting只使用简单的神经网络;
参考链接:
1.2 对于输入维度为[N, H, W, C]的Tensor, Batch Normalization在哪个(些)维度上做归一化?
A. N, W B. N C. N, C D. N, H
答案选择:B
分析:
参考链接:
1.3 以下关于牛顿法描述错误的是()
A. 牛顿法使用一个二次曲面去拟合当前所处位置的局部曲面
B. 牛顿法使用函数f(x)的泰勒级数的前面几项来寻找方程f(x)=0的根
C. 牛顿法是一种迭代算法,求解过程中需要计算目标函数的Hessian矩阵的逆矩阵
D. 牛顿法是一种常见的解决带约束最优化问题的方法
答案选择:D
分析:
(1)引自Wiki:“从几何上说,牛顿法就是用一个二次曲面去拟合你当前所处位置的局部曲面,而梯度下降法是用一个平面去拟合当前的局部曲面,通常情况下,二次曲面的拟合会比平面更好,所以牛顿法选择的下降路径会更符合真实的最优下降路径”。
(2)牛顿法解决的是无约束最优化问题。
参考链接:
(1)常见的几种最优化方法(梯度下降法、牛顿法、拟牛顿法、共轭梯度法等)
二、多选题(5道,20分)
2.1 下列哪些优化算法具有自适应性?
A. RMSProp B. Momentum C. AdaGrad D. SGD
答案选择:AC
2.2 关于偏差和方差,下列说法正确的是()
A. 泛化误差=方差+偏差+噪声
B. 当训练样本数量趋于无穷大时,在该数据集上训练的模型变化趋势是偏差变小
C. bagging降低偏差,boosting降低方差
D. bagging降低方差,boosting降低偏差
答案选择:AD
分析:
(1)经验误差(训练误差)与泛化误差
(2-1)当模型欠拟合的时候,我们发现增大训练集,偏差无法降低,无法解决欠拟合问题;(2-2)当模型过拟合的时候,我们发现增大训练集,方差减小,可以解决过拟合问题;
(3)Bagging通过样本随机划分训练多个模型,然后融合,从而提高模型的泛化能力,也就是降低方差;
(4)Boosting则是通过增加错误样本的权重来提高模型的拟合能力,也就是减低偏差。
参考链接:
(1)经验误差与泛化误差、偏差与方差、欠拟合与过拟合、交叉验证
三、问答题(3道,30分)
3.1 BatchNormalization的原理和作用?给出BN的公式。
参考链接:
参考链接:
(1)机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
3.3 优化算法SGD,Momentum,AdaGrad,RMSProp,Adam的特点是什么?
参考链接:
2) 优化方法总结:SGD,Momentum,AdaGrad,RMSProp,Adam
4) 深度学习最全优化方法总结比较(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam)
5) 从 SGD 到 Adam —— 深度学习优化算法概览(一)
四、编程题(2道,30分)
4.1 输入常数N和M,构造含有N个字符A和M个字符B的字符串(保证能够构造成功),并且字串中不能有连续3个字符相同,输出任意满足要求的字符串形式即可。
解题思路:
(1)找出N和M中的最小值。假设为M,也就是字符B的数量num(B)最少;
(2)根据(1)及题意可以推断:num(A)≤3*num(B),要不然无法构造成功;
4.2 输入一个数字,对数字各个位数进行重组(0不能在首位),使得重组之后的数可以被2整除,若能满足该要求则输出true,否则输出false。
解题思路:
(1)将数字各个位的取值存为列表元素,
(2)若列表长度为1且包含0,则输出false;
五、其他
1、大疆2019校招提前批机器学习算法工程师在线笔试题目回忆版
#大疆##算法工程师##笔试题目##笔经#