当归蛋

2018-11-08 10:46 中国海洋大学 C++

关注

【有书共读】《机器学习》读书笔记CH11-CH12

第十一章特征选择与稀疏学习

特征定义

相关特征：对当前学习任务有用的属性。

无关特征：对当前学习任务没有。

冗余特征：包含的信息能从其他特征中推演出来。

冗余特征在很多时候不起作用，去除它们会减轻学习过程的负担。但有时冗余特征会降低学习任务的难度。

特征选择的两个环节：子集搜索、子集评价。

子集搜索：“前向”搜索、“后向”搜索、“双向”搜索。

子集评价：信息增益、能判断两个划分差异的机制。

将特征子集搜索机制与子集评价机制相结合，即可得到特征选择方法。

常见的特征选择方法有：过滤式、包裹式、嵌入式。

过滤式：先对数据集进行特征选择、然后再训练学习器，特征选择过程与后续学习器无关

包裹式：特征选择直接吧最终将要使用的学习器的性能作为特征子集评价准则

嵌入式：将特征选择过程与学习器训练过程融为一体。两者在同一个优化过程中完成，即在学习器训练过程中自动地进行了特征选择。LARS是一种嵌入式特征选择方法。

字典学习：为普通稠密表达的样本找到合适的字典，将样本转化为合适的稀疏表示形式，从而使学习任务得以简化，模型复杂度得以降低。

压缩感知：根据部分信息来恢复全部信息。

第十二章计算理论学习

1、试计算决策树桩假设空间的VC维。

若是非连续属性，通过决策树一次划分无法确定节点个数，那么可能导致VC维无限大。仅考虑连续属性单变量的决策树桩。由于决策树的划分是与坐标轴平行的超平面，显然平面上的2个点是可以被打散的，即VC维大于等于2。

对于平面的3各点，如果其中两个点的连线与一条坐标轴平行，另两个点的连线与另一坐标轴平行。比如(0,0),(0,1),(1,0)(0,0),(0,1),(1,0)三个点，无法通过一个与坐标轴平行的超平面来划分。所以VC维小于3。

所以决策树桩假设空间的VC维是2。

2、决策树分类器的假设空间VC维可以为无穷大。

由于决策树如果不限制伸展，会包含整个假设空间。对任意多的样本，决策树可以使得训练误差为0，所以VC维是无穷大。

#笔记##机器学习##读书笔记#

全部评论

推荐最新楼层

06-25 18:45

大连理工大学测试工程师

在西二旗上班真的没有一点活人感

小学在上地实验小学，高中在海淀黄庄，大学在杏坛路，毕业后在西二旗，窒息了半辈子了，想要逃离，却不知道能逃到哪里去。

写不来代码的小黑：想评论点啥但是发现是京✌️，算了给京✌️跪了

点赞评论收藏

昨天 14:39

已编辑

广东白云学院测试工程师

求助，25届毕业生测试简历修改建议

简历被挂麻了，求建议

点赞评论收藏

05-19 16:43

广西师范大学 Java

26届头一次投实习

第一投实习，一家20~99人的小厂，要求我半小时内做出四道题，这正常吗

在努力存钱的ssr很有胆量：俺哥，看到最后一行直接笑了

点赞评论收藏

06-25 20:52

柠檬微趣_C++客户端开发工程师(准入职员工)

柠檬微趣内推

面经：暑假投递，面试时间线拉的比较长自我介绍实习经历介绍问了我他们公司有什么产品，让我说一款的细节设置，以及和竞品的细节差异在这个游戏设计一个中秋节主题关卡，应该怎么设计，什么思路？柠檬微趣2025届校招进行中，2026届暑期实习，日常实习进行中~【招聘动态】研发类、数据类、策划类三大岗位仍有较多机会，欢迎投递【福利待遇】- 北京户口指标、一年免费住宿- 七险一金、丰厚年终奖、免费早晚餐- 带薪年假、带薪全员旅游、年度体检- 社团活动、生日礼物、水果下午茶【内推链接】https://app.mokahr.com/m/recommendation-apply/microfunhr/36717?s...

点赞评论收藏

招聘动态

现代汽车前瞻技术研发挑战赛

快手

全站热榜

创作者周榜

正在热议

# 现代汽车前瞻技术研发急速编程挑战赛 #

# 你觉得专业和学校哪个对薪资影响最大 #

# 听到哪句话就代表面试稳了or挂了？ #

# 选完offer后，你后悔学本专业吗 #