2019-07-28 13:09 已编辑门头沟学院算法工程师

关注

Character-level Convolutional Networks for Text Classification阅读笔记

概述

一篇比较经典的文本分类论文, 利用char-CNN结构提取特征, 而没有使用目前非常流行的词向量.

作者通过实验证明, 在数据量足够的情况下, 深层CNN网络不需要词语信息, 仅依赖字符信息就可以获得不错效果.

只利用字符信息可以有效解决拼写错误和表情符号等问题.

模型

Key Modules

主要模块是一维卷积模块.

定义离散输入函数 $g (x) \in [1, l] \to R$ , 离散核函数 $f (x) \in [1, k] \to R$ ,
则步长为d的卷积操作
:
之后, 进行一维的max-pooling

字符表

模型接受一系列编码字符作为输入，通过为输入语言规定大小为m的字符表来完成编码，然后使用1-m编码（或“one-hot”编码）量化每个字符。然后，将字符序列变换为具有固定长度 $l_{0}$ 的这种m大小的向量的序列。

字符表一共包含以下70个字符, 其中26个英文小写字母, 10个数字还有其他一些常见标点符号.

可以发现, 作者使用的字符表并没有区分大小写, 这个是作者通过实验后做出的选择, 作者发现区分大小写后, 实验结果往往会变差.

模型设计

作者提出了大小两个卷积网络. 它们都有9层(6层卷积层, 3层全连接层).

输入的每个字符被表示为70维的one-hot向量. 每个输入的长度对于大模型设置为1014(也就是固定包含1014个字符, 截长补短), 小模型是256. 在三层全连接之间, 均使用dropout防止过拟合

参数利用高斯分布初始化, 其中大模型参数服从(0, 0.02)的高斯分布, 小模型服从(0, 0.05)的高斯分布.

数据增强

为了提高模型效果, 作者还采用了数据增强策略.

NLP的数据增强和CV及语音还是不太一样的. CV现在数据增强方法很多, 而且比较成熟, 比如对图像进行裁剪, 旋转等. 但是NLP数据增强相比较就复杂很多, 因为词与词之间往往存在依赖关系, 改变词序, 语义很容易就发生改变. 所以最好的数据增强方法便是人工转述改写, 但是这样工作量太庞大了.

作者使用英文近义词词典进行数据增强, 找一些同义词或短语, 随机选择数据中部分词进行替代.

实验

参数设置

optimizer: SGD with momentum 0.9
lr: 初始化0.01, 之后每三个batch减半
batch size: 128
dropout: 0.5

比较模型

作者分别于传统方法和深度模型进行比较

传统方法

手动提取特征, 构建线性分类器.

Bag-of-words & TF-IDF
Bag-of-ngrams & TF-IDF
Bag-of-means & TF-IDF

深度模型

Word-based Convnet
LSTM

数据集

实验结果

全部评论

推荐最新楼层

07-15 11:51

门头沟学院 Java

百度提前批一面凉经

面的很差，面试官也很冷漠的感觉1.介绍实习，介绍投入比较多的项目2.go的进程，线程，协程，为什么go的协程很轻量化3.python的GIL什么作用4.强变量类型和GIL什么作用5.中断是什么，如何执行，什么时候执行6.CNN，RNN7.反向传播8.可微，可导9.TCP为什么四次挥手，三次行不行10.FLASK用的什么IO模型11.mysql的索引是什么数据结构？为什么不用红黑树或者B树12.mysql有哪些日志，有什么作用算法题：k个一组翻转链表，要求只翻转id为奇数的组

面试问题记录

点赞评论收藏

分享

07-16 11:43

已编辑

华东师范大学运营

节子实习可以七点准时走，会被约谈吗？

landing两周了 目前每天的业务不算多 每天到下班的时间手上的活都做完了 但是组里的其他实习生和正职都在忙 +1就坐我后面 已经鼓起勇气准时走了两周了 但有的时候到家了还是有其他部门同学跟我联系业务 所以到底该不该走啊走多了会被约谈么

码农索隆：想转正，就注意领导的态度。不想转正，到点就润。

实习生的蛐蛐区

点赞评论收藏

分享

06-11 07:28

门头沟学院产品经理

也许我真的能力很差吧

0-20人的小公司，整个公司就4个在做技术的，老板喜欢骂人，我做的东西其实算是比较简单的（可能？），因为之前没接触过，做的很吃力，物联网这一块，Django+node，还有嵌入式，做得很慢，也许我能力真的不足，但是看到到手工资还是很难过（到手4k），租的房子比较远，每天通勤1.5h，在深圳，生活压力还比较大

牛可乐：不是你能力差，是公司烂

点赞评论收藏

分享

06-26 15:33

青岛工学院 Java

有效发疯，

我只能说真离谱，这个社会太扯淡了

积极的秋田犬要冲国企：他现在邀请我明天面试

点赞评论收藏

分享

07-18 14:48

门头沟学院 Java

小红书这个岗有懂的吗？

这么高端，年薪得多少起啊 核心是想找什么样的人呀？

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 风评不好的公司，你会去吗？ #

37411次浏览 229人参与

# 假如你的老板掉河里，你的工作能为他做什么 #

31204次浏览 380人参与

# 第一份工作应该选高薪还是热爱？ #

72041次浏览 697人参与

# 职场新人体验 #

3827次浏览 55人参与

# 你觉得第一学历对求职有影响吗？ #

95629次浏览 675人参与

# 外包能不能当跳板？ #

37937次浏览 228人参与

# 你觉得早上几点上班合适？ #

73667次浏览 308人参与

# 学历贬值真的很严重吗？ #

26428次浏览 179人参与

# 推荐一首陪你工作的歌吧 #

15261次浏览 99人参与

# 秋招签约后的心态变化 #

84052次浏览 820人参与

# 双非能在秋招上岸吗？ #

223331次浏览 1180人参与

# 听劝，这个公司值得去吗 #

487692次浏览 1709人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

93430次浏览 691人参与

# 打工人的工作餐日常 #

54946次浏览 436人参与

# 反问环节如何提问 #

93783次浏览 1938人参与

# 大学最后一个寒假，我想…… #

47417次浏览 576人参与

# 面试被问第一学历差时该怎么回答 #

137971次浏览 853人参与

# 一人推荐一个值得去的通信/硬件公司 #

187158次浏览 1861人参与

# 月薪多少能在一线城市生存 #

37032次浏览 353人参与

# 机械制造秋招总结 #

54637次浏览 513人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务