2019-11-17 05:20 已编辑腾讯_数据平台部_算法工程师

关注

RoBERTa 已看paper

RoBERTa: A Robustly Optimized BERT Pretraining Approach

Summary

主要就是用fairseq复现了一下，然后large batch training,另外用了新的数据集CC NEWS

Research Objective作者的研究目标

Our goal was to replicate, simplify, and better tune the training of BERT, as a reference point for better understanding the relative performance of all of these methods.

Problem Statement问题陈述，需要解决的问题是什么？

We find that BERT was significantly undertrained and propose an im- proved recipe for training BERT models,

Method(s)作者解决问题的方法/算法是什么？是否基于前人的方法？

(1) training the model longer, with bigger batches, over more data;
(2) removing the next sentence prediction objective;
(3) training on longer sequences;
(4) dynamically changing the masking pattern applied to the training data.
(5) We also collect a large new dataset (CC-NEWS) of comparable size to other privately used datasets, to better control for training set size effects.
(6) byte-level subword encoding

Evaluation作者如何评估自己的方法，实验的setup是什么样的，有没有问题或者可以借鉴的地方。

Conclusion作者给了哪些结论，哪些是strong conclusions, 哪些又是weak的conclusions?

NSP不太好

Notes(optional) 不符合此框架，但需要额外记录的笔记。

Reference

Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2019. BERT: Pre-training of deep bidirectional transformers for language under- standing. In North American Association for Com- putational Linguistics (NAACL).

全部评论

推荐最新楼层

06-27 18:00

门头沟学院 Java

大厂真的好吗

为啥大家都要卷大厂? 最近实习感觉互联网工作强度高，容易裁员，都是青春饭，现在这种形势下也是一眼望得到头跳槽也只能挑一个同样内卷的大厂

Kuasstal：普通家庭的选择本来就不多。只有极少数人才能有随心所欲的人生

点赞评论收藏

分享

07-01 09:52

西北工业大学 Java

昨天二面的，已经卡链接一天了求求腾子给个offer吧,可怜可怜孩子吧

点赞评论收藏

分享

05-08 23:17

滴滴_Java开发(实习员工)

自由水：笑死了，敢这么面试不敢让别人说

点赞评论收藏

分享

06-07 17:17

嘉兴学院教师

愿意从底做起

心爱的idea：你孩

点赞评论收藏

分享

06-27 14:56

河南工程学院 Java

释放一个wxg hc

转正offer终于来了🥹  赶紧跟wxg hr说拜拜（释放一个wxg的hc

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何准备秋招 #

8637次浏览 152人参与

# 软开人，秋招你打算投哪些公司呢 #

100393次浏览 941人参与

# 现代汽车前瞻技术研发急速编程挑战赛 #

21252次浏览 181人参与

# 你觉得实习能学到东西吗 #

12434次浏览 304人参与

# 秋招什么时候开投比较合适？ #

5116次浏览 111人参与

# 实习，不懂就问 #

24400次浏览 376人参与

# 每个月的工资都是怎么分配的？ #

12069次浏览 273人参与

# 你觉得现在还能进互联网吗？ #

3908次浏览 91人参与

# 技术岗笔试题求解 #

75275次浏览 974人参与

# 预测一下26届秋招形势 #

20001次浏览 209人参与

# 你最近一次加班是什么时候？ #

67587次浏览 346人参与

# 高考出分的那一天，我__ #

13842次浏览 230人参与

# 打工人的精神状态 #

53244次浏览 967人参与

# 米哈游工作体验 #

17502次浏览 116人参与

# 机械实习一天多少钱合适？ #

28703次浏览 176人参与

# 你觉得实习只能是打杂吗？ #

191970次浏览 1211人参与

# 聊聊你的职场新体验 #

161116次浏览 1389人参与

# 来聊聊你认为的薪资天花板是哪家？ #

30665次浏览 174人参与

# 安利/避雷我的专业 #

75820次浏览 522人参与

# 牛客十周岁生日快乐 #

144817次浏览 1609人参与

# 你们公司几号发工资 #

18671次浏览 116人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务