量化投资:MATLAB数据挖掘技术与实践(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.4 本章小结

本章主要介绍了数据挖掘的内容、过程和常用的工具。数据挖掘的内容包括6个方面,即关联、回归、分类、聚类、预测和诊断。了解数据挖掘的内容,有助于读者加深对数据挖掘概念的理解,同时可让读者从内容角度构建数据挖掘的基本框架,这对于了解和学习以后的数据挖掘相关技术很有帮助。数据挖掘的过程也可划分为6个阶段,即目标的定义、数据的准备、数据的探索、模型的建立、模型的评估和模型的部署。了解了数据挖掘的过程,我们就能知道数据挖掘项目是如何一步一步运行的,这个过程就是数据挖掘项目实施的基本方法论。有了方法论的指导,就可以让数据挖掘项目科学化、规范化,从而少走一些弯路。另外,本章对数据挖掘常用的5种工具(MATLAB、SAS、SPSS、WEKA、R)进行了介绍,主要介绍每种工具的特色及适用场景,这样读者就可以知道在什么情况下选择哪种数据挖掘工具更合适。