2019-07-28 13:09 已编辑门头沟学院算法工程师

关注

Deep Learning for Extreme Multi-label Text Classification阅读笔记

文章目录

概述
模型

Dynamic max pooling
损失函数
Hidden Bottleneck layer

实验

参数设置
实验结果

概述

Extreme multi-label就是说总的标签量非常多, 成千上万甚至数百万.
Extreme multi-label text classification主要难点在于数据稀疏, 并且计算量较大(标签太多).
本文作者对textcnn进行改进, 使其在extreme multi-label text classification问题上获得更好的效果.

模型

模型是基于text-cnn改进的.
创新点:

dynamic max pooling.
改进了损失函数
在pooling和输出层之间加了一个bottleneck layer, 减小模型规模, 加快训练.

Dynamic max pooling

text-cnn是对每个feature map做max pooling, 所以每个feature在pooling之后只得到一个特征.
作者认为, 这样做pooling, 如果句子很长, 会损失很多信息, 并且没有利用任何位置信息.

对此, 作者提出使用Dynamic max pooling, 对于每个feature map, pooling生成p个特征. 具体做法如下,

对于一个包含m个词的句子, 把这个句子分成p块, 每一块分别做max-pooling然后进行拼接.

损失函数

损失函数使用binary cross-entropy, 而不是 softmax cross-entropy

Hidden Bottleneck layer

其实就是在pooling层和ouput层之间加了个全连接

实验

参数设置

卷积核大小:{2, 4, 8}
每种卷积核数量(也就是输出通道数): 对于小数据集是128, 大数据集32
dropout: 0.5
bottleneck layer: 512

实验结果

全部评论

推荐最新楼层

11-18 00:44

郑州大学光伏逆变器工程师

小米的offer终于来了！

耶！我顺利通过了第一场面试，真是太开心了！虽然小米可能是我目前能接触到的顶尖选择，但我会继续尝试其他机会。与小米的员工交流后，发现他们既温柔又细心，或许我也有点运气加成吧！

Haenu0317：转人工

牛客创作赏金赛

点赞评论收藏

分享

11-18 16:13

已编辑

西安邮电大学

卓望科技测试工程师面经

一面自我介绍软件开发流程，软件生命周期测试你是怎么学习的？（学习路线？）测试学习包含什么内容静态测试方法 白盒测试的路径测试覆盖率了解的测试工具、测试管理的工具，起到了什么作用，会问具体是干什么的问项目，使用了什么技术栈，核心思想 ，怎么定位元素还问了Linux的常用命令，有没有自己部署过测试环境 问实习，为什么没有利用实习的平台去做UI自动化测试？（因为我的项目是个人项目，问了这个问题）性能测试是什么？性能测试工具，性能测试的指标，Jmeter测试流程是怎样的？问编程语言，Python，Java，C++选一个你常用的语言提问，Python装饰器，内置数据类型，元组的特点问期望工作地点...

查看16道真题和解析

点赞评论收藏

分享

10-15 16:27

门头沟学院 C++

感觉被侮辱了

LeoMoon：建议问一下是不是你给他付钱😅😅

点赞评论收藏

分享

11-19 12:12

北京理工大学管理培训生

秋招被确诊为安陵容

费劲所有力气考来北京大学时却一直是小透明偷偷嫉妒家境很好和去大厂实习的同学第一次参加面试胆战心惊想和e人同学一起玩可是人家有自己的社交圈子在嫉妒与失落中过完我的大学生活担心考不上研所以投身秋招想去的公司都给我发了拒信看到上双非的高中同学拿了梦厂offer我内心又开始破防想到了高考后的幸福与现在的落差形成鲜明对比“这样好的阳光，以后再也见不到了”

阿里淘天随缘内推：断句断的好

双非能在秋招上岸吗？秋招被确诊为……

点赞评论收藏

分享

1 收藏评论

全站热榜

正在热议

# 25届秋招总结 #

300551次浏览 2660人参与

# 如果不工作真的会快乐吗 #

59185次浏览 516人参与

# 阿里云管培生offer #

17254次浏览 294人参与

# 地方国企笔面经互助 #

3788次浏览 10人参与

# 美团求职进展汇总 #

1327208次浏览 12448人参与

# 选完offer后，你后悔学本专业吗 #

19919次浏览 144人参与

# 北方华创开奖 #

26524次浏览 285人参与

# 正在实习的你，几点下班 #

51839次浏览 389人参与

# 国央企薪资爆料 #

8295次浏览 67人参与

# 如何一边实习一边秋招 #

992085次浏览 12638人参与

# 提前批简历挂麻了怎么办 #

146412次浏览 1948人参与

# 学历or实习经历，哪个更重要 #

50995次浏览 402人参与

# 海康威视求职进展汇总 #

398779次浏览 3406人参与

# 米哈游求职进展汇总 #

175894次浏览 1458人参与

# 求职遇到的搞笑事件 #

70778次浏览 577人参与

# 投递实习岗位前的准备 #

1179167次浏览 18394人参与

# 面试体验感最好的是哪家？ #

85075次浏览 845人参与

# 实习生应该准时下班吗 #

167400次浏览 1159人参与

# 得物求职进展汇总 #

66224次浏览 682人参与

# 网申一定要掌握的小技巧 #

5326次浏览 53人参与

# 招聘要求与实际实习内容不符怎么办 #

10267次浏览 273人参与

# 0offer是寒冬太冷还是我太菜 #

898224次浏览 8012人参与

牛客网
牛客企业服务