我的offer快点来

2019-06-09 13:06 美团_算法工程师

关注

如何把BERT用到文本生成中

在知乎上提了问题没有人理，来牛客看看有没有大佬可以帮助我。最近在尝试把BERT模型放入seq2seq中，但是效果不好，不怎么收敛。我是直接把GRU encoder换成了BERT，然后decoder依旧是GRU，优化方式是ADAM，但是loss下降不下去，不管怎么调整学习率都没什么用。想问问大家这是为啥，是BERT跟RNN不兼容吗。感觉换一个强大的预训练过的encoder不应该更好吗？我的数据量并不大，就8万左右。如果不能这样使用BERT，那有啥办法可以把BERT用到seq2seq任务中吗。谢谢各位大佬！！！

#机器学习##深度学习##人工智能#

全部评论

推荐最新楼层

北京大学算法工程师

有一种思路，利用bert的next sentence，把后句mask成自回归，用前句生成后句

1 回复分享

发布于 2019-11-06 11:52

我刚刚入门nlp，等大佬来解答

点赞回复分享

发布于 2019-06-09 13:25

Shopee算法内推

Shopee_data science_算法工程师

用bert做word embedding

点赞回复分享

发布于 2019-06-09 13:31

门头沟学院 Java

用bert做的多标签文本分类

点赞回复分享

发布于 2019-06-09 13:32

北京警察学院算法工程师

编码器用gru，你的误差没办法传播到编码层的多头注意力层里，要不然就是你的嵌入层有问题

点赞回复分享

发布于 2019-06-09 14:11

字节跳动_算法工程师

bert不适合文本生成

点赞回复分享

发布于 2019-06-09 16:11

不卷，躺平

腾讯_算法工程师

不是说bert做文本生成是雷区么。。

点赞回复分享

发布于 2019-06-09 20:43

练习时长两年半的算法实习生

快手_搜索推荐_算法

我也在做差不多的东西 BERT提取的特征是矩阵形式， 768 * 自己设的句子长度（包括CLS和SEP），如果用transformer解码就用整个矩阵做decoder的输入（K和V），如果用GRU解码就用CLS对应的向量做GRU的hidden state 有好的想法可以交流一下

点赞回复分享

发布于 2019-06-09 23:27

门头沟学院算法工程师

Bert 是通过DAE方式来预训练的，其学习到的是词的上下文表征信息，而学习不到这种词与词之间的组合信息。这些都需要看你 Decoder 的部分，可以看看GPT 和 MASS 是怎么做的。最新的 XLNet 可以解决你这个烦恼，问题是，***又要学，，学不动了啊。

点赞回复分享

发布于 2019-06-22 22:11

哈尔滨工业大学（深圳）算法工程师

BERT模型直接拿来当作编码部分？

点赞回复分享

发布于 2019-10-21 22:08

昨天 15:10

西北大学 Java

在谷歌的工作体验

首先，英文文档真的是一大堆，刚开始我也有点紧张，毕竟发邮件和看文档全是英文。不过，大家在内部交流时还是会夹杂中文，慢慢适应后就好了。年假有一个月，外加每周两天可以在家办公，假期多。团队里的人也很牛，组里有清北毕业的，还有从北美创业回来的同事，大家背景各异，氛围特别包容。食堂的饭菜好吃，咖啡也好喝。加班这块儿，基本上没什么压力，工作时间内能把事情搞定，下班后也不会被打扰。至于内卷，倒是没什么感觉，大家关系简单和谐，领导和同事之间也没有那种死板的上下级关系。

谷歌公司福利 178人发布

点赞评论收藏

分享

11-18 22:59

暨南大学 HRBP

现在的同学找工作的想法真的很多

今天面试了一个00后的小女生，她对找工作的想法让我深有感触。她提到，除了基本工资，她希望公司能抗风险，稳定可靠。更重要的是，她渴望在这个平台上成长，而不是仅仅打卡上班，浪费时间。她说得对，大家其实都是在为未来的简历而努力。无论年龄，能清楚自己想要什么，选择手中拥有的机会，践行长期主义，才是最珍贵的。积极的态度和行动，才是我们求职路上最宝贵的财富。

牛客创作赏金赛

点赞评论收藏

分享

11-08 00:11

复旦大学深度学习

华为这样是一定会发offer吗？

1145定律 这样代表一定会发offer吗？

剑指延毕：确定会进池子

点赞评论收藏

分享

10-22 10:02

门头沟学院游戏策划

还得是字节

即使是字节的hr晚上十一点半也要坚守岗位😡

一颗宏心：华为HR晚上过了十二点后还给我法消息。

点赞评论收藏

分享

11-15 17:39

小米_技术部_高级技术专家

25必看遥遥领先offer率的小米秋招内推大量开奖，全程推进

大家想来小米的欢迎走我内推，*******，我来推进大家进度小米公司校招内推码: JJCJ8C1 投递链接: https://xiaomi.jobs.f.mioffice.cn/referral/campus/position/share/?token=NTsxNzMxNjU4NTk2MzkyOzcyOTMzNTMwMjgxNzg0NDQzOTY7NzQzNzQwNjQwNjgxNjg5MDk4OQ或者微信扫下方内推码投递：社招：小米公司社招内推码: JJCJ8C1 投递链接: https://xiaomi.jobs.f.mioffice.cn/referral/position/share...

投递小米集团等公司10个岗位 >

点赞评论收藏

分享

点赞 10 评论

招聘动态

杉川机器人

2025校园招聘

字节跳动

2025校园招聘

字节跳动Data

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 晒一晒我的offer #

9711243次浏览 104841人参与

# 应届生被毁约被毁意向了怎么办 #

24558次浏览 232人参与

# 北方华创开奖 #

21324次浏览 244人参与

# 地方国企笔面经互助 #

2077次浏览 6人参与

# 查收我的offer竞争力报告 #

13831次浏览 192人参与

# 机械应届生薪资要多少才合适？ #

11892次浏览 57人参与

# 我的工作日记 #

20486次浏览 268人参与

# 寒假躺平还是提前实习 #

57116次浏览 419人参与

# 总结:哪家公司面试体验感最差 #

23813次浏览 116人参与

# 实习，投递多份简历没人回复怎么办 #

2383447次浏览 34203人参与

# 公司情报交流地 #

31117次浏览 219人参与

# 秋招OC许愿 #

224484次浏览 1855人参与

# 00后45度躺现状 #

35274次浏览 303人参与

# 不给转正的实习，你还去吗 #

1512921次浏览 16938人参与

# 没有实习经历，还有机会进大厂吗 #

803188次浏览 13774人参与

# 机械人，签完三方你在忙什么？ #

23228次浏览 119人参与

# 来聊聊机械薪资天花板是哪家 #

63525次浏览 431人参与

# 选完offer后，你后悔学本专业吗 #

7198次浏览 45人参与

# 0offer是寒冬太冷还是我太菜 #

880092次浏览 7868人参与

# 大家都开始春招面试了吗 #

409763次浏览 5222人参与

# 机械人怎么评价今年的比亚迪 #

41043次浏览 141人参与

牛客网
牛客企业服务