机器学习的工作流程

打造一个机器学习的应用程序,从工作流程方面熟悉整体的步骤,对后面深入学习有很大的帮助。
整个过程有六个步骤:

1. 获取

机器学习中的数据,可以来自不同的数据源,可能是csv文件,也可能是从服务器拉取出来的日志,或者是自己构建的web爬虫。

2. 检查

获取了数据,下一步进行合理地检查数据,最好的方法是发现不可能或几乎不可能的事情。无论数据是何种类型,检查最极端的情况。它们是否有意义?一个较好的实践是对数据进行简单的统计测试,并将数据可视化。可能有些数据是缺失的或不完整的。

3. 清洗

这一步的目标是将数据转化为适合模型使用的格式。这个阶段包括若干个过程,如过滤、聚集、输入和转化。所需的操作很大程度上取决于数据的类型,以及所使用的库和算法的类型。只有进入模型的数据质量好,模型的质量才能够得到保证。数据清洗这一步很关键。

4. 建模

数据准备完成后,下一阶段进行建模。我们将选择适当的算法,并在数据上训练一个模型。基本的步骤包括将数据分割为训练、测试和验证的集合,训练模型,预测。

5. 评估

模型构建完成后,怎么样确定模型训练得好不好?就需要进行评估。简单来说就是看模型的预测和实际值到底有多接近。

6. 部署

模型的表现能够令人满意,接下来就进行部署,将训练的模型在机器上跑起来,投入应用。

参考文献
[1](美)Alexander T.Combs.PYTHON机器学习实践指南[M].北京:人民邮电出版社.2017.

全部评论

相关推荐

程序员牛肉:1.大头肯定是院校问题,这个没啥说的。 2.虽然有实习,但是实习的内容太水了,在公司待了七个月的时间,看起来就只做了jwt和接入redis。爬取新闻,数据导入。这几个需求值得你做七个月吗?这不就是三四个月的工作量吗?我要是面试官的话真心会认为你能力不太行。所以既然有实习了,一定要好好写,像是Swagger这种东西是真没必要写上去,就拉一个包的事情。 3.我个人觉得话,在校生不要把自己当社招看,除非你的项目是特别牛逼,特别有名的含金量,否则不要写这种密密麻麻的一串子工作职责。你的项目只有一个作用,就是供面试官从中来抽取八股对你进行拷打。 但是你现在这个看不来什么技术点,可以改一下,详细表述一下你用什么技术实现了什么功能,在实现这个功能的过程中,你解决了什么难题。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务