Coursera机器学习-Week 5-测验:Neural Networks: Learning

1

描述

解析

根据题目给定的公式大胆的猜 Δ(k)ij:=Δ(k)ij+δ(k+1)i(a(k))j Δ i j ( k ) := Δ i j ( k ) + δ i ( k + 1 ) ∗ ( a ( k ) ) j ,所以题目选择 D D

2

描述

解析

因为 T h e t a 1 包含 15 15 个元素、 Theta2 T h e t a 2 包含 24 24 个元素,所以按照 thetaVec=[Theta1(:);Theta2(:)] t h e t a V e c = [ T h e t a 1 ( : ) ; T h e t a 2 ( : ) ] 组合时,会得到一个包含 39 39 个元素的 thetaVec t h e t a V e c 向量,想要重新获取 Theta2 T h e t a 2 需要将后 24 24 个拆分出来构造成 46 4 ∗ 6 Theta2 T h e t a 2 ,所以选 A A ,注意下标是从 1 开始。

3

描述

解析

θ=1 θ = 1 ϵ=0.01 ϵ = 0.01 代入 J(θ+ϵ)J(θϵ)2ϵ J ( θ + ϵ ) − J ( θ − ϵ ) 2 ϵ 得, ans=12.0012 a n s = 12.0012 ,选 D D

4

描述

解析

A ,使用梯度检测的确可以帮助减少反向传播算法计算时的 Bug B u g ,正确;
B B ,神经网络过拟合时,可以尝试将 λ 变大,毕竟神经网络的损失函数和正则修正操作都是从梯度下降算法中引申过来的,所以原理可借鉴,正确;
C C ,两者公式原理相似,都可以用梯度检测,错误;
D ,当 λ λ 过大时会出现欠拟合,参照梯度下降算法,错误。

5

描述

解析

A A 不能全部设置为 0 或者 1 1 ,这样会因为参数相同而没有什么效果,错误;
B 参照 A A ,不能全部设置为相同的值,推荐的是全部随机成接近于 0 的浮点数,错误;
C C 只能趋向于局部最小值,初始值不同,结果也可能会不同,正确;
D 参照梯度下降算法,随着迭代的增加, J J <script type="math/tex" id="MathJax-Element-1525">J</script> 应该逐渐变小,正确。

全部评论

相关推荐

10-09 00:50
已编辑
长江大学 算法工程师
不期而遇的夏天:1.同学你面试评价不错,概率很大,请耐心等待;2.你的排名比较靠前,不要担心,耐心等待;3.问题不大,正在审批,不要着急签其他公司,等等我们!4.预计9月中下旬,安心过节;5.下周会有结果,请耐心等待下;6.可能国庆节前后,一有结果我马上通知你;7.预计10月中旬,再坚持一下;8.正在走流程,就这两天了;9.同学,结果我也不知道,你如果查到了也告诉我一声;10.同学你出线不明朗,建议签其他公司保底!11.同学你找了哪些公司,我也在找工作。
点赞 评论 收藏
分享
ArisRobert:统一解释一下,第4点的意思是,公司按需通知员工,没被通知到的员工是没法去上班的,所以只要没被通知到,就自动离职。就是一种比较抽象的裁员。
点赞 评论 收藏
分享
评论
点赞
收藏
分享
牛客网
牛客企业服务