2020-09-22 20:32 已编辑门头沟学院产品经理

关注

【机器学习笔记day01】机器学习引言+什么是机器学习 +为什么需要机器学习 +开发机器学习应用程序的步骤+ 环境准备 +我们应该怎么做

文章目录

机器学习引言

机器学习引言

机器学习
机器学习引言
1. sklearn与特征工程
1.1. 数据的来源与类型
1.2. 数据的特征抽取
1.3. 数据的特征预处理
1.4. 数据的特征选择
2. sklearn数据集与机器学习组成
2.1. Scikit-learn数据集
2.2. 模型的选择
2.3. 模型检验-交叉验证
2.4. sklearn的estimator
3. sklearn的分类器算法
3.1. 分类算法之k-近邻
3.2. k-近邻算法案例分析
3.3. 朴素贝叶斯
3.4. 分类算法之逻辑回归
3.5. 逻辑回归算法案例分析
3.6. 分类器性能评估
3.7. 分类算法之决策树、随机森林
4. 回归算法
4.1. 回归算法之线性回归
4.2. 线性回归案例分析
4.3. 回归性能评估与欠拟合、过拟合
4.4. 回归算法之岭回归
4.5. 岭回归案例分析
5. 非监督学习
5.1. 非监督学习之k-means
5.2. k-means案例分析
6. 推荐系统
6.1. 推荐系统评测
6.2. 基于协同过滤的推荐系统
6.3. 代码案例

什么是机器学习

机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点到以“知识”为重点，再到以“学习”为重点，一条自然、清晰的脉络。机器学习是实现人工智能的一个途径，即以机器学习为手段解决人工智能中的问题。机器学习算法是一类从数据中自动分析获得规律（模型），并利用规律对未知数据进行预测的算法

为什么需要机器学习

21世纪机器学习又一次被人们关注，而这些关注的背后是因为整个环境的改变，我们的数据量越来越多，硬件越来越强悍。急需要解放人的生产力，自动去寻找数据的规律。解决更多专业领域的问题。机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域.

开发机器学习应用程序的步骤

（1）收集数据

我们可以使用很多方法收集样本护具，如：制作网络爬虫从网站上抽取数据、从RSS反馈或者API中得到信息、设备发送过来的实测数据。

（2）准备输入数据

得到数据之后，还必须确保数据格式符合要求。

（3）分析输入数据

这一步的主要作用是确保数据集中没有垃圾数据。如果是使用信任的数据来源，那么可以直接跳过这个步骤

（4）训练算法

机器学习算法从这一步才真正开始学习。如果使用无监督学习算法，由于不存在目标变量值，故而也不需要训练算法，所有与算法相关的内容在第（5）步

（5）测试算法

这一步将实际使用第（4）步机器学习得到的知识信息。当然在这也需要评估结果的准确率，然后根据需要重新训练你的算法

（6）使用算法

转化为应用程序，执行实际任务。以检验上述步骤是否可以在实际环境中正常工作。如果碰到新的数据问题，同样需要重复执行上述的步骤

环境准备

我们本次机器学习的课程使用的python程序库：

Numpy、Scikit-learn

在ubuntu或者mac操作系统中，在虚拟环境中安装:

pip3 install Numpy
pip3 install Scikit-learn

Numpy是一个强大的高级数***算的工具库，还具备非常搞笑的向量和矩阵运算功能。Scikit-learn是一个基于python的机器学习库，封装了大量经典以及最新的机器学习模型。

我们应该怎么做

互联网公司机器学习工作、数据挖掘工程师们工作内容是什么?

研究各种算法，设计高大上模型?
深度学习的应用，N层神经网络?
…

大部分复杂模型的算法精进都是数据科学家在做

大多数程序员

跑数据，各种map-reduce，hive SQL，数据仓库搬砖
数据清洗，数据清洗，数据清洗
分析业务，分析case，找特征
常用算法跑模型

我们应该怎么做

学会分析问题
掌握算法基本思想，学会对问题用相应的算法解决
学会利用简便的库或者框架解决问题

全部评论

推荐最新楼层

11-28 23:29

哈尔滨工业大学 Java

阿里巴巴工作心得

首先，关于工作时长，要求早上9点半到岗，午饭12点，1点半再回来。再说说工作氛围，和同事们相处得很愉快，但老板就真的是看运气了，阿里换老板的频率高关于涨薪机制，每年财年结束后会进行绩效评定，4月份会沟通涨幅和年终奖，月底发放。最后，学习和成长方面，阿里有很多开放的学习资源，比如各种文档和培训视频。我闲的时候常常去看看别人的总结，收获不少。

阿里巴巴公司氛围 336人发布

点赞评论收藏

11-27 15:37

门头沟学院嵌入式软件工程师

2026届秋招攻略-前期准备

写在最前：如果你是2026、2027届学生（硕士为主），目前对就业行业和课题方向都比较迷茫，并且以就业为导向（私企为主，国企央企不包含），那么本篇文章可以借鉴一下，对工科专业的学生更加适用。背景：经历了残酷的的2025届秋招，明年的应届毕业生人数更是多到夸张。每年都有超1000多万的学生投入劳动市场，加上就业岗位短时间无法大量增长，这些都是我们无力改变的客观因素.但还是有一些可以自我努力的部分来缓解焦虑，帮你无痛秋招。我先从最开始的入学开始，如果你已就业为导向那么在课题选择上记住一点，实验室今年要毕业的师哥师姐做的什么，什么课题人做得最多就选什么，不要去另辟蹊径，本质上你读硕士的目的是：有基本...

如何一边实习一边秋招没有实习经历，还有机会进大厂吗

点赞评论收藏

11-28 20:35

苏州大学 IC验证工程师

如何评价

qz鹿：*** 祝他毕业就失业

点赞评论收藏

10-23 22:49

门头沟学院测试开发

这个测试一学一个不吱声啊

这个测试你们就学吧，一学一个不吱声 #测试# #公司情报交流地#

转世鼠：赛博电子厂

公司情报交流地

点赞评论收藏

11-26 00:47

四川职业技术学院 golang

字节耐面王

看到牛客上也有不少字节耐面王，作为一名Go后端选手，我也总结一下秋招面试字节的经历：从7月字节国际电商捞人海面开始，到11月底秋招基本结束，总共面了4个流程10次面试，加了4个HR，甚至熬走了俩实习生国际电商，base珠海：7.31一面 -> 8.13二面挂搜索后端，base上海：9.6一面 -> 9.12二面挂国际化广告，solution engineer，base上海：9.30一面 -> 10.9二面 -> 10.15三面挂国际化广告，ads infra，base北京：11.8一面 -> 11.13二面 -> 11.18三面挂前两个流程的面经前面有发，后...

歪脸吴彦祖：我来杀死比赛，我22轮

25届秋招总结

点赞评论收藏

全站热榜

正在热议

10017179次浏览 106302人参与

# 如果公司给你放一天假，你会怎么度过？ #

5033次浏览 65人参与

# 现在还是0offer，延毕还是备考 #

827150次浏览 6927人参与

# 投递实习岗位前的准备 #

1198507次浏览 18564人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #