本篇核心内容为数据清洗。 数据清洗 数据工作的步骤应该为: 数据获取 数据清洗 数据分析 数据可视化与建模 因此,上一篇博文中,本人说过,下一篇博文会讲一下数据分析中重要的一步 我们要知道,数据清洗本着为下一步数据分析服务的目的进行,因此,数据处理要根据数据分析确定它是否需要处理,需要怎样的处理,才能适应接下来的分析工作和挖掘工作。 整体分为几个不同的步骤来看。 import pandas as pd import numpy as np 一. 缺失数据的处理 整体的处理方法在理论上我们可以采用填补或者丢弃。选择哪种依情况而定。总体工作对于pandas来说,就利用四个方法: filln...