弗洛伊德彪

2019-08-05 13:35 已编辑燕山大学 Java

关注

Softmax函数

相关概念：

max函数定义就是在选取最大的值．这个最大值函数只能选择最大值

如果我想要一个能够大概率选择最大值，还能够小概率选择小值的函数．这就要用到softmax函数

softmax函数的定义：或称为归一化指数函数，是逻辑函数的推广．能够将一个含有任意实数的k维向量z压缩到另一个k维实向量\(\sigma (z)\)中，使得每个元素都在(0,1)之间，并且和为１．\[\sigma (z)_{j}=\frac{e^{z_{j}}}{\sum_{k=1}^{K} e^{z_{k}}}, j=1,2,...K\]
实际应用：

在神经网络中利用softmax函数来进行反向传播：神经网络的正向传播计算的分数S1，和按照正确标注计算的分数S2之间的差距，计算Loss，才能应用反向传播 \[L_{i}=-log(\frac{e^{f_{y_{i}}}}{\sum_{j} e^{j}})\]

在优化loss过程中，我们要通过梯度下降，每次优化一个step大小的梯度，这个时候我们就要求Loss对每个权重矩阵的偏导，然后应用链式法则。那么这个过程的第一步，就是求Loss对score的偏导．score \(y_{i}\)，先定义\(P(y_{i})\):\[P(y_{i})=\frac{e^{f_{y_{i}}}}{\sum_{j} e^{j}}\] loss 对score的偏导：
\[\frac{\partial L_{i}}{\partial f_{yi}}=- ln (\frac{e^{f_{y_{i}}}}{\sum _{j} e^{j}})^{'}\]
\[=-1 *\frac{\sum_{j} e^{j}}{e^{f_{y_{i}}}}* (\frac{e^{f_{y_{i}}}}{\sum_{j}e^{j}})^{'}\]
\[=-1 *\frac{\sum_{j} e^{j}}{e^{f_{y_{i}}}}*(1-\frac{\sum_{j \neq f_{yi}} e^{j}}{\sum_{j}e^{j}})^{'}\]
\[=-1 *\frac{\sum_{j} e^{j}}{e^{f_{y_{i}}}}*-1*\sum_{j \neq f_{yi}} e^{j}*-1*\frac{1}{(\sum_{j} e^{j})^{2}}*(\sum_{j}e^{j})^{'}\]
\[=-1 *\frac{\sum_{j} e^{j}}{e^{f_{y_{i}}}}*-1*\sum_{j \neq f_{yi}} e^{j}*-1*\frac{1}{(\sum_{j} e^{j})^{2}}*e^{f_{y_{i}}}\]
\[=-(1-P_{f_{y_{i}}})=P_{f_{y_{i}}}-1\]

可以看得出求导结果的形式非常清晰明了．求解损失函数的梯度，只需要计算概率向量在真正结果的那一个维度减一即可．
举例分析：

假设我们得到的某个训练样本的向量分数为\([2,3,5]\),那么所对应的概率是\([\frac{e^2}{e^{2}+e^{3}+e^{5}},\frac{e^3}{e^{2}+e^{3}+e^{5}},\frac{e^5}{e^{2}+e^{3}+e^{5}}]\)=\([0.042,0.114,0.844]\).如果正确的分类是第三个的话，计算的偏导为\[[0.042,0.114,0.844-1]=[0.042,0.114,-0.156]\]根据这个结果进行反向传播的计算．
参考文献：

0.softmax的解释，编程中的注意点

1.wiki-softmax function

2.softmax的理解与应用. @author:杨思达zzz

全部评论

推荐最新楼层

11-19 16:31

哈尔滨理工大学算法工程师

练习16，G题，新函数定义

题目如下：乎优塔病好了，他又开始研究定义一个新函数，该函数的声明形式为： long long fun(int n); ，其作用为：分解出n的每一位，并计算每一位的阶乘，然后将计算后的结果相加后返回，请编程实现（要求必须使用函数实现，否则不计入成绩）。输入描述:一个整数n(1≤n≤1000000)。输出描述:一个整数，计算后的结果。此题目如果要以函数声明形式，那么这个题需要分为两个函数，一个是计算阶乘的函数，另外一个是计算加和的函数，此题数据可能会太大，所以我们要使用longlong类型来定义函数，计算阶乘的函数代码如下： long long fun1(int n) { long lon...

点赞评论收藏

分享

11-23 11:10

北京航空航天大学前端工程师

网易实习四个月体验

上班时间是10点到18点半，中午有两个小时的午休，算下来每天工作也就六个半小时。我所在的组任务量刚刚好，四个月里从来没有加过班。不过听说有些组的同事就没那么幸运，吃饭的时候有哥们说他连续三周都在加班。同事们都特别友好，几乎每周都有免费的下午茶，大家一起聊天，气氛超好。还有，网易严选的员工购物打三折，花了90多块买了300多的东西，很划算

网易公司福利 152人发布

点赞评论收藏

分享

11-17 12:23

已编辑

四川音乐学院营销

秋招已心碎，求改简历🥹知道学历是污点，但是已无力回天…当年山东高考超一本线四十分因为热爱跟爸妈吵架去了音乐学院…好在大学没闲着，一直认真学习，各种大厂实习实践参加活动，结果今年就业还是被打击惨了，到底问题出在哪里，为什么连初筛都过不了😭 #你的简历改到第几版了#  #你的秋招简历被谁挂了？#

生科2102牛猫：不是很懂，但感觉简历已经很优秀了，另外，你是我见过最美的牛客女孩

你的简历改到第几版了你的秋招简历被谁挂了？

点赞评论收藏

分享

10-23 12:06

安庆职业技术学院后期制作

我这个能找到工作吗😭

已老实求offer😫：有点像徐坤(没有冒犯的意思哈)

点赞评论收藏

分享

11-20 15:36

北京外国语大学产品经理

大家一定要珍惜秋招的机会啊

最近我发现秋招的机会越来越少，更新的岗位也变得稀少。每次都要花很久才能找到合适的职位，心里有些焦虑。大家一定要珍惜每一个机会，不仅要认真投递简历，面试的准备也不能马虎！加油，大家一起努力！

牛客创作赏金赛

点赞评论收藏

分享

点赞收藏评论

全站热榜

正在热议

# 25届秋招总结 #

286372次浏览 2516人参与

# 学历or实习经历，哪个更重要 #

48851次浏览 378人参与

# 阿里云管培生offer #

4089次浏览 85人参与

# 地方国企笔面经互助 #

3449次浏览 7人参与

# 美团求职进展汇总 #

1323037次浏览 12415人参与

# 选完offer后，你后悔学本专业吗 #

18265次浏览 130人参与

# 北方华创开奖 #

25176次浏览 274人参与

# 如何一边实习一边秋招 #

990037次浏览 12628人参与

# 得物求职进展汇总 #

65494次浏览 676人参与

# 腾讯求职进展汇总 #

194745次浏览 1632人参与

# 银行笔面经互助 #

82067次浏览 872人参与

# 提前批简历挂麻了怎么办 #

145963次浏览 1942人参与

# 0offer是寒冬太冷还是我太菜 #

895293次浏览 7985人参与

# 海康威视求职进展汇总 #

397829次浏览 3403人参与

# 机械人，你在招聘流程中的企业有哪些？ #

17755次浏览 186人参与

213155次浏览 2529人参与

# 国央企薪资爆料 #

5015次浏览 35人参与

# 网申一定要掌握的小技巧 #

5242次浏览 52人参与

# 你们公司几号发工资 #

10656次浏览 99人参与

# 没有实习经历，还有机会进大厂吗 #

810482次浏览 13914人参与

# 你最想要的公司福利是？ #

44580次浏览 178人参与

# 听到哪句话就代表面试稳了or挂了？ #

93700次浏览 785人参与

牛客网
牛客企业服务