感谢楼主的分享。不过第10条我有些疑问。“统计该批样本的误差,求平均以后得到平均误差,以此来作为更新参数的依据 ”。因为反向的时候,需要用到每一层的输出值,对于一个batch里面的样本来说,这些输出都是不一样的,所以这样应该没法算的。所以,我觉得是对每个样本都反向一遍,然后对梯度做平均,得到的值用来更新。
点赞 1

相关推荐

徐新高:号已经废了 建议重开一个账号投简历
点赞 评论 收藏
分享
牛客网
牛客企业服务