关注
说一个很novel的观点……
bn一般用在图像上,当我们对图片抽取特征后,会得到不同通道的特征,这些通道特征对batch内样本具有同样的含义。例如一个人有年龄,身高等特征。而nlp中,如果要进行bn,则是对不同句子的第i个token进行处理,举个例子"我爱你"和"牛客网",其中的我和牛并没有相同的含义,所以解释不通。还有一个点就是你所说的每个句子长度不同,对于短句子我们需要pad,那么如果进行bn就需要将pad.和长句子中的token进行处理,这样也是不合理的。
查看原帖
2 评论
相关推荐

点赞 评论 收藏
分享

点赞 评论 收藏
分享
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 实习要如何选择和准备? #
16623次浏览 304人参与
# 打工人的工作餐日常 #
28052次浏览 249人参与
# 美团求职进展汇总 #
1652660次浏览 14899人参与
# 我在牛爱网找对象 #
160007次浏览 1216人参与
# 字节求职进展汇总 #
714858次浏览 7232人参与
# 职业发展规划如何回答 #
29392次浏览 162人参与
# 面试等了一周没回复,还有戏吗 #
100113次浏览 918人参与
# 比亚迪秋招开啦,你打算投递吗? #
66863次浏览 561人参与
# 运营人的第一份offer应该如何选 #
127414次浏览 1053人参与
# 没有实习经历还能找到好工作吗? #
6604次浏览 38人参与
# 稳定和高薪机械人更看重哪个? #
426936次浏览 5313人参与
# 正在实习的你,几点下班 #
105102次浏览 755人参与
# 你的工资什么时候发? #
20626次浏览 162人参与
# 牛友们的论文几号送审 #
20308次浏览 546人参与
# 满分简历要如何准备? #
21766次浏览 340人参与
# 投格力的你,拿到offer了吗? #
64111次浏览 504人参与
# 你上一天班会花多少钱 #
39573次浏览 225人参与
# 应届生应该先就业还是先择业 #
85722次浏览 515人参与
# 科大讯飞工作体验 #
15923次浏览 49人参与
# TCL求职进展汇总 #
102993次浏览 594人参与