Text style transfer
GAN中有不可微分的地方
Gumbel softmax
Continuous input for discriminator:
如果直接one hot和continuous比较太容易区分,所以可以比较embedding和weighted sum,这样不太容易区分,可以混淆discriminator。
Reinforcement learning
Environment会变,导致强化学习训练困难。
Tip:
Reward for every generation step
- Monto Carlo Search
- Discriminator for partially decoded sequences
- Step-wise evaluation
文本风格转换思路可以用做unsupervised translation model
算法小屋 文章被收录于专栏
不定期分享各类算法以及面经。同时也正在学习相关分布式技术。欢迎一起交流。