小水滴真的是太可爱了吧

2020-09-22 20:30 门头沟学院产品经理

关注

【机器学习笔记day06】1.4. 数据的特征选择+sklearn.feature_selection

文章目录

1.4. 数据的特征选择
数据的特征选择
- sklearn.feature_selection

1.4. 数据的特征选择

数据的特征选择

降维本质上是从一个维度空间映射到另一个维度空间，特征的多少别没有减少，当然在映射的过程中特征值也会相应的变化。举个例子，现在的特征是1000维，我们想要把它降到500维。降维的过程就是找个一个从1000维映射到500维的映射关系。原始数据中的1000个特征，每一个都对应着降维后的500维空间中的一个值。假设原始特征中有个特征的值是9，那么降维后对应的值可能是3。而对于特征选择来说，有很多方法：

Filter(过滤式):VarianceThreshold
Embedded(嵌入式)：正则化、决策树
Wrapper(包裹式)

其中过滤式的特征选择后，数据本身不变，而数据的维度减少。而嵌入式的特征选择方法也会改变数据的值，维度也改变。Embedded方式是一种自动学习的特征选择方法，后面讲到具体的方法的时候就能理解了。

特征选择主要有两个功能：

（1）减少特征数量，降维，使模型泛化能力更强，减少过拟合

（2）增强特征和特征值之间的理解

sklearn.feature_selection

去掉取值变化小的特征（删除低方差特征）

VarianceThreshold 是特征选择中的一项基本方法。它会移除所有方差不满足阈值的特征。默认设置下，它将移除所有方差为0的特征，即那些在所有样本中数值完全相同的特征。

假设我们要移除那些超过80%的数据都为1或0的特征

from sklearn.feature_selection import VarianceThreshold
X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]]
sel = VarianceThreshold(threshold=(.8 * (1 - .8)))
sel.fit_transform(X)
array([[0, 1],
       [1, 0],
       [0, 0],
       [1, 1],
       [1, 0],
       [1, 1]])

全部评论

推荐最新楼层

12-02 17:22

已编辑

西安交通大学 Java

offer比较，华为，滴滴

华为昇腾 ai软件开发薪资20k x (14-16)，职级13A，5%公积金，c/cpp

BLOOMING7：闭眼滴滴，华子给的又少又累

点赞评论收藏

分享

11-28 13:37

Boston University

评审 100+ 前端简历，总结项目经验的 9 个必踩坑

本文主要聊聊简历的项目经验，都会出现哪些问题。已评审100+份前端简历的基础上，总结出的一些面试简历中的“坑”，希望大家提前绕开。问题 1 - 格式不正确，内容不全面例如这个同学写的简历，就一个项目名称，还有几条描述，内容太简单了。简历中对于一个项目的描述，应该分为以下几个部分：项目名称 （还可以加上时间、个人的角色，这俩是非必须的）项目描述，可使用这个模板 这是一个 xx 系统。它包含了 a b c 功能。我主要负责 x y z 模块。 ，两三句话把项目表达完技术栈，这个一定要单独写出来，要让面试官第一眼就能看到用的什么技术、什么框架，很重要个人职责（或 项目职责），要分条目写清楚个人的工作...

投递银联等公司10个岗位 > 简历中的项目经历要怎么写我的失利项目复盘

点赞评论收藏

分享

10-10 21:40

门头沟学院前端工程师

你们出生产事故了？

哪个程序员要背绩效了？

Java抽象带篮子：难蚌，点进图片上面就是我的大头😆

点赞评论收藏

分享

12-01 01:57

已编辑

重庆邮电大学 golang

双非秋招大结局

这一年，年初找实习，年中实习，年末秋招。投递了200多家只有不到10场面试，最后也只拿了两个offer。终于可以休息了感谢字节在实习的时候收留了我，秋招又给了sp，他真的，我哭死

苏苏加油努力：互联网，制造业都拿了顶级的，厉害

点赞评论收藏

分享

11-30 19:12

已编辑

影石创新科技股份有限公司_测试开发工程师

12月了，25届同学可以考虑准备找实习冲春招了！！

哈喽，大家好，最近看到很多25届的小伙伴都陆续开奖了，也是恭喜这些小伙伴在今年这么内卷的环境下成功上岸，但是目前0offer的同学依然是很多，那么目前绝大部分公司的秋招流程都已经陆续结束了，官网投递通道已经早早关闭了，很多小伙伴已经有了准备春招的打算了，那么今天就给大家分享一下春招的一些注意事项一、明确如何准备春招？1.春招的时间是在 25年的3-5月份，到时候流程和秋招差不多，很多大厂有自己的招聘公众号，到时候会发文春招开始的时间，然后大家去官网投递简历即可，很多小伙伴秋招已经投过一遍了，到时候要记得更新简历欧~ 2.其实这个是正常流程的招聘时间，春招是一直持续到你毕业之前为止的，...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 25届秋招总结 #

465753次浏览 4776人参与

# 晒一晒我的offer #

10033312次浏览 106380人参与

# 地方国企笔面经互助 #

8766次浏览 19人参与

# 如何排解工作中的焦虑 #

73745次浏览 1047人参与

# 我的求职思考 #

4245027次浏览 57465人参与

# 同bg的你秋招战况如何？ #

91175次浏览 696人参与

# 找工作时遇到的神仙HR #

568827次浏览 3888人参与

# 实习，投递多份简历没人回复怎么办 #

2465961次浏览 34936人参与

# 虾皮求职进展汇总 #

131652次浏览 957人参与

# 你投了多少份简历了？ #

68599次浏览 818人参与

# 你上一次加班是什么时候？ #

23277次浏览 186人参与

# 面试被问第一学历差时该怎么回答 #

80350次浏览 516人参与

# 提前批简历挂麻了怎么办 #

150986次浏览 1989人参与

# 现在还是0offer，延毕还是备考 #

828347次浏览 6931人参与

# 比亚迪工作体验 #

45611次浏览 215人参与

# 大疆求职进展汇总 #

421305次浏览 2970人参与

# 来聊聊你目前的求职进展 #

522092次浏览 6228人参与

# 什么专业适合考公 #

15289次浏览 119人参与

# 总结:哪家公司面试体验感最好 #

20602次浏览 94人参与

# 如果公司给你放一天假，你会怎么度过？ #

5124次浏览 65人参与

牛客网
牛客企业服务