作 为一门学科,数据挖掘对于世人来说在很大程度上是透明的。我们在大多数时间都从未注意到它的发生。但每当我们办理商店购物卡、使用信用卡购物或在网上冲浪 时,都在创建数据。这些数据以大数据集形式存储在我们每天与之打交道的公司所拥有的功能强大的计算机上。存在于这些数据集之内的便是模式 - 表明我们的兴趣、习惯和行为。数据挖掘可让人们找到并解读这些模式,从而帮助人们做出更明智的决策,并更好地为客户服务。
第一节:数据挖掘基本知识RapidMiner工具介绍
第二节:数据准备:导入、预处理、导出
第三节:数据挖掘模型和方法
第四节:K-Means 聚类与辨别分析
第五节:线性回归与逻辑回归
第六节:决策树与神经网络
第七节:文本挖掘
第八节:WEB挖掘
第九节:协同过滤、推荐
第十节:时间序列分析
第十一节:离群点分析
第十二节:模型评估-交叉验证与模型优化化
第十三节:过程控制
第十四节:数据转换与执行命令 |