就算你超参数不变,每次随机初始化,训练的结果都不一样。梯度下降法相当于下山,随机初始化权重相当于随机选择起点,不同的超参数是不同的下山方法,有的超参数能帮你快速到达山谷最低点,有的则很慢。调参就是找到最快到达最低点的参数。随机初始化权重就是随机选择起点,尝试不同的路径去试探。所以我觉得不用固定初始化权重。
点赞 评论

相关推荐

牛客网
牛客企业服务