transformer对句子或者序列建模,每一个token位置的语义并不像tabular数据或者图像那样特征是固定的吧,用bn就默认是那样对齐处理了

相关推荐

牛客网
牛客企业服务