想回老家的潜伏者躺平又起来了

2019-07-27 00:02 已编辑浙江大学算法工程师

关注

EM算法及其推广

EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计，或极大后验概率估计。
EM算法的每次迭代由两步组成：E步，求期望；M步，求极大。所以这一算法称为期望极大算法，简称EM算法。

EM算法的引入

EM算法

EM算法与初值的选择有关，选择不同的初值可能得到不同的参数估计值。
一般地，用Y表示观测随机变量的数据，Z表示隐随机变量的数据。Y和Z连在一起称为完全数据，观测数据Y又称为不完全数据。
EM算法

输入：观测变量数据Y，隐变量数据Z，联合分布
$<nobr> Q (θ, θ (i)) = E z [log P (Y, Z | θ) | Y, θ (i)] = \sum Z log P (Y, Z | θ) P (Z | Y, θ (i)) (9.9) </nobr>$
这里，

式(9.9)的函数

EM算法（二）

极大似然估计

我们可将对数据建模的方法分为两大类，概率模型和非概率模型
概率模型：
1. 贝叶斯分类器
2. 逻辑回归
3. 最小二乘法回归和岭回归（使用ML和MAP解释）
4. 贝叶斯线性回归
非概率模型：
1. 感知机
2. 支持向量机
3. 决策树
4. K-means
在上述每一种方法中，我们都有一个想要优化的目标函数（贪婪或非贪婪，局部或全局）

一种概率的目标函数是极大化（对数）似然函数。对于一些模型，可以找到参数

坐标上升

K-means使用的就是一种坐标上升方法。

第三种情况

我们想要获得

第二个函数中，
接下来使用EM算法通过Function 2求解

EM算法的目标函数

首先需要定义一个较通用的目标函数使得能够：
1. 易于优化给定

EM算法的推导

注意

对于第一项，希望关于完全数据的似然函数的期望是可以计算的（存在解析形式）
对于第二项，希望关于辅助变量（隐变量）的条件后验存在解析形式。

总结
E步相当于利用隐变量的条件后验更新隐变量分布，然后计算完全数据关于隐变量的的期望。
M步相当于求上述期望关于模型变量的极大。

EM算法（三）

琴声不等式和KL散度

对于凹函数（如log x）有

KL散度用于衡量两个分布之间的差异，不具有对称性，不是一种距离度量。

推导

设观测变量X受到隐变量T和参数

E步，求期望细节

M步，求极大细节

EM算法的导出

EM算法是通过不断求解下界的极大化逼近对数似然函数极大化的算法。
EM算法不能保证找到全局最优值。

EM算法在非监督学习中的应用

待补充

EM算法的收敛性

EM算法提供一种近似计算含有隐变量概率模型的极大似然估计方法。
问题
1. EM算法得到的估计序列是否收敛
2. 若收敛，收敛的全局最大还是局部极大值？

定理9.1
设

单调有界定理

定理9.2

EM算法在高斯混合模型中的应用

请参阅高斯混合模型GMM

EM算法的推广

待补充

总结

参考资料

《统计学习方法》第9章
《Machine Learning》ColumbiaX: CSMM.102x Lecture 15
《Bayesian Methods for Machine Learning》

全部评论

推荐最新楼层

11-22 18:25

内蒙古财经大学策略运营

mentor带实习生最烦的是什么？

实习生常见问题及应对建议作为一个过来人，我想和大家分享一下实习生在职场中常见的一些问题，以及如何避免这些问题，让你的实习经历更加顺利。1. 好问但不自学很多实习生喜欢问问题，这本身是好事，但有些人不看资料、不做功课就直接来问。比如，明明资料里有答案，却懒得看，直接跑来问：“太复杂了，你跟我说说吧。” 还有些基础概念，百度一下就能找到，却还是要问别人。更糟糕的是，问了也记不住，下次还问同样的问题。我的建议是，先自己查资料，实在不懂再问。这样不仅能减轻别人的负担，还能让你学到更多。毕竟，大家都有自己的工作，不可能全天候手把手教你。2. 觉得自己被欺负有些实习生觉得被安排整理数据、调研竞品、打印文件...

投递百度等公司10个岗位 >

点赞评论收藏

分享

11-20 08:11

华为_算法工程师

为什么起点相同，工作几年后结果却大不相同？

为什么起点相同，结果却大不相同？本文原创首发于同名公号：来知晓。一样起点，一个公司，10年后，为啥有的人是总裁，有的人被总裁？写作缘由读者朋友你好，欢迎来到来知晓。最近听了我司一位技术大佬的职场成长体验分享讲座，大有所感，故本期聊聊一个长期发展的问题：都是同一学校毕业的，都在一个公司内奋斗，为啥10年后有的成了总裁，有的被总裁？大佬观点这个问题很有启发性，让我们先听听这位大佬观点（下文代称X，在公司10年，已22级）。X说，进华为前，都是985、211，起点大差不差，缘何经过10年、20年发展，不同人差异就那么大，甚至成为总裁。X一直在思考背后的原因。这次分享中，X给出了自己的思考：核心在于，...

投递华为等公司10个岗位 > 华为求职进展汇总华为开奖那些事

点赞评论收藏

分享

10-06 12:46

门头沟学院 Java

我了个hr集体复活

跨考小白：定时任务启动

点赞评论收藏

分享

11-01 11:02

门头沟学院后端

终于到我捡漏啦！哈哈哈！11月要开始准备收割啦！

康8：是我疯了，还是大伙疯了

点赞评论收藏

分享

11-25 19:36

华北电力大学（保定） Java

26日常实习，求指点

陆陆续续投了一个月了，一个面试也没有，是简历太差了吗，之前是黑马点评➕学成在线，后来把两个合并了下，又手写了个rpc，简历还需要怎么改改😭😭，救救孩子吧，之前有两个笔试，自己太差没把握住机会

我是一盘牛肉：简历没毛病，但就是没什么岗位了

投了多少份简历才上岸你的简历改到第几版了

点赞评论收藏

分享

点赞收藏评论

全站热榜

正在热议

# 25届秋招总结 #

331926次浏览 3136人参与

# 上班苦还是上学苦呢？ #

73646次浏览 656人参与

# 百度开奖 #

186139次浏览 1167人参与

# 地方国企笔面经互助 #

4582次浏览 12人参与

# 如果有时光机，你最想去到哪个年纪？ #

22082次浏览 416人参与

# 选完offer后，你后悔学本专业吗 #

22090次浏览 159人参与

# 阿里云管培生offer #

37356次浏览 424人参与

# 我的实习求职记录 #

6073367次浏览 83555人参与

# 如何一边实习一边秋招 #

997404次浏览 12669人参与

# 找工作时遇到的神仙HR #

553834次浏览 3803人参与

# 入职第一天，你准备什么时候下班 #

21683次浏览 144人参与

# 招聘要求与实际实习内容不符怎么办 #

10830次浏览 277人参与

# bilibili求职进展汇总 #

33361次浏览 357人参与

214967次浏览 2535人参与

# 学历or实习经历，哪个更重要 #

54127次浏览 424人参与

# 你今年的平均薪资是多少？ #

71120次浏览 345人参与

# 实习工作，你找得还顺利吗？ #

248076次浏览 2913人参与

# 通信硬件薪资爆料 #

609884次浏览 5198人参与

# 海康威视求职进展汇总 #

401004次浏览 3408人参与

# 携程求职进展汇总 #

135955次浏览 932人参与

# 正在实习的你，几点下班 #

53464次浏览 396人参与

# 工作两年想退休了 #

53161次浏览 673人参与

牛客网
牛客企业服务