注意力机制,是否可以把注意力机制的系数去掉 - bert 中的确去掉了 这个能详细说下么 这个系数指的 encoder hidden state的系数么
点赞 1

相关推荐

01-14 15:08
东南大学 Java
点赞 评论 收藏
分享
01-17 08:34
门头沟学院 Java
想找对象的单身狗在努力存钱:这工资不低了,再高点人家要招博士硕士的
点赞 评论 收藏
分享
牛客网
牛客企业服务