其中一点是:你使用mse对分类任务时,梯度更新的时候是会涉及到sigmoid的计算,而你用交叉熵的话求梯度更新只涉及到真实值,预测值和x,计算就会实现简单方便
点赞 2

相关推荐

牛客网
牛客企业服务