想请教那三个embedding的权重是如何知道的呢,加权结果应该是作为后面任务的输出的吧?另外预训练阶段输入的是每一个词的one-hot类似的编码是吗,谢谢,有这两点不明白,一起讨论hhh
点赞 4

相关推荐

牛客网
牛客企业服务