Deep Bayes: Discrete Latent Variables

Introduction:

这篇笔记会记录一些离散隐变量模型,转载请注明。
Reference:Deep Bayes

Motivation

  1. Easier to interpret discrete categories than continuous spectrum
    example: discrete variational autoencoder
  2. Allow the model to make a discrete choice
    example: hard attention
    An attention module generates binary mask of where to look at
    The network classifies masked images
    We want attention module to attend only important areas of the image.

Reinforce Estimator

图片说明
However, this typically has large variance
Requires sophisticated Variance Reduction methods
Just taking bigger M gives only a modest improvement.
图片说明
图片说明
Idea: Relax the objective over discrete random samples z into an objective oven continuous random samples during training and use the reparametrization trick:
图片说明

Gumbel-Max trick

图片说明
图片说明
Some ideas about Gumbel Distribution:
https://qinqianshan.com/math/probability_distribution/gumbel-distribution/
图片说明
图片说明
图片说明
图片说明

Variance Reduction

Control Variates
Consider some with tractable expectation . Then图片说明
图片说明
图片说明
图片说明
Simple Baselines:
Constant baseline
图片说明
Variance Minimization:
图片说明
Gumbel-Relaxed Baselines:
图片说明
图片说明

算法小屋 文章被收录于专栏

不定期分享各类算法以及面经。同时也正在学习相关分布式技术。欢迎一起交流。

全部评论

相关推荐

10-02 19:29
已编辑
浙江科技大学 运营
点赞 评论 收藏
分享
rndguy:个人思路,抛砖引玉。 要我的话我先问清楚需求:要什么精度,什么速度,什么环境。 如果精度要求很低,平台也有点柔性的话,只需要输出pwm,然后开个中断记录各多少个脉冲,如果脉冲时间不对齐了就反馈控制电流加减就行。要求同步要求稍微高点的话可以在脉冲间做个线性插值,同步精度会高些。 但总体来说,如果直流有刷只有脉冲没有好的编码器的话很难做精准定位什么的(除非用一些电机磁路结构相关的奇技淫巧如高频注入什么的),所以要求更高就需要大量参数辨识和校准,那就慢多了。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务