transformer 前馈神经网络的结构, 为什么会先提升维度后缩小维度 这个要怎么回答好呢?
点赞 1

相关推荐

牛客网
牛客企业服务