IBM SPSS Modeler 进行数据挖掘之数据理解
正在加载中...
资料简介:
本文详细介绍了如何使用 IBM SPSS Modeler 来进行数据挖掘工作中的数据理解工作,其中主要包括对缺失值的理解和处理,对异常值的理解和处理,以及如何利用 Modeler 来观察和分析数据项之间的内在关系。
前言
在数据挖掘项目中,数据理解常常不被重视。但其实数据理解在整个数据挖掘项目中扮演着非常重要的角色,可以说是整个项目的基石。在计算机领域有一句话,“Garbage in,garbage out.” 意思就是说,如果你的输入数据没有经过科学的预处理,你所得到的结果必将是错误的。通过数据理解,我们可以理解数据的特性和不足,进而对数据进行预处理,使得将来得到的模型更加稳定和精确。其次通过理解数据项之间的关系,我们可以为建模时输入数据项和模型的选择提供重要的信息。
首先,我们需要了解 CRISP-DM 模型,从而了解数据理解在数据挖掘工作的位置和作用。接着我们利用一个例子,分三个章节来介绍如何利用 Modeler 来理解和处理原始数据中的缺失值,异常值和各个数据项之间的内在关系。
前言
在数据挖掘项目中,数据理解常常不被重视。但其实数据理解在整个数据挖掘项目中扮演着非常重要的角色,可以说是整个项目的基石。在计算机领域有一句话,“Garbage in,garbage out.” 意思就是说,如果你的输入数据没有经过科学的预处理,你所得到的结果必将是错误的。通过数据理解,我们可以理解数据的特性和不足,进而对数据进行预处理,使得将来得到的模型更加稳定和精确。其次通过理解数据项之间的关系,我们可以为建模时输入数据项和模型的选择提供重要的信息。
首先,我们需要了解 CRISP-DM 模型,从而了解数据理解在数据挖掘工作的位置和作用。接着我们利用一个例子,分三个章节来介绍如何利用 Modeler 来理解和处理原始数据中的缺失值,异常值和各个数据项之间的内在关系。
2015-09-02
页数35
浏览2687
下载21
已下载用户的评价7.60分
您还未下载该资料,不能发表评价;
查看我的 待评价资源
查看我的 待评价资源