【有书共读】《机器学习》读书笔记CH13-CH14

第十三章 半监督学习
生成式方法:是直接基于生成式模型的方法。
将高斯混合模型换成混合专家模型、朴素贝叶斯模型等即可推导出其他的生成式半监督学习方法。
半监督支持向量机中最著名的是TSVM
1TSVM对未标记样本进行标记指派与调整过程涉及很大的计算开销,试设计一个高效的改进算法。
在标记调整过程中,可以考虑每次将最有可能指派错误的样本进行调整,对即正负伪标记样本中松弛变量最大且大于1的样本进行标记更改,这样就可以减少迭代的次数。

2、试设计一个能对新样本进行分类图半监督算法。
图半监督算法不会直接对新样本进行分类,可行的办法一是将新样本作为无标记样本再次进行图半监督算法。或者使用已有标记的样本训练一个学习器,然后再对新样本分类。

3、自训练是一种比较原始的半监督学习方法:它现在有标记的样本上学习,然后在无标记的样本上获得伪标记,再在全部样本上进行重复训练,分析该方差有何缺陷。
由于训练样本远远少于无标记样本,如果将全部无标记样本的伪标记直接作为训练样本,将导致很多样本属于噪声样本,十分影响分类器的准确度。应该进行局部伪标记调整来优化分类器,而不是直接的使用全部的伪标记重复训练分类器。

第十四章 概率图模型
机器学习最重要的任务,是根据一些已观察到的证件来对感兴趣的未知变量进行估计和推断。
概率模型提供了一种描述框架,将学习任务归结于计算变量的概率分布。
概率图模型是一类用图来表达变量相关关系的概率模型。
隐马尔可夫模型是结构最简单的动态贝叶斯网。
马尔可夫随机场是典型的马尔可夫网,是一种著名的无向图模型。
#笔记##机器学习##读书笔记#
全部评论

相关推荐

评论
点赞
收藏
分享
牛客网
牛客企业服务