虹软笔试 前向z_i -> softmax层(输出 P ) -> 损失层 sum(1/2(s_i - t_i)^2) s_i 是 softmax输出 t_i 是 label loss 对 P 的偏导是什么 ?