第1章 数据挖掘概述
1.1 数据挖掘简介
1.1.1 数据、信息和知识
1.1.2 数据挖掘的定义
1.2 数据挖掘过程
1.3 数据挖掘方法
1.4 数据挖掘工具及软件
第2章 Clementine概述
2.1 Clementine简介
2.2 Clementine基本操作
2.2.1 Clementine主窗口
2,2.2 数据流的基本操作
第3章 决策树
3.1 分类与决策树概述
3.1.1 分类与预测
3.1.2 决策树的基本原理
3.2 ID3、C4.5 与C5.0
3.2.1 ID3
3.2.2 C4.5
3.2.3 C5.0
3.2.4 在Clementine中应用C5.0
3.3 CART
3.3.1 生成最大树
3.3.2 树的修剪
3.3.3 子树评估
3.3.4 在Clementine中应用CART
第4章 聚类分析
4.1 聚类分析概述
4.1.1 聚类分析的概念
4.1.2 聚类分析的基本方法
4.2 K-Means箅法
4.2.1 数据预处理
4.2.2 K-Means算法流程
4.2.3 在Clementine中应用K.MeanS
4.3 TwoStep算法
4.3.1 构建CF树
4.3.2 聚类
4.3.3 在Clementine中应用TwoStep
第5章 关联规则
5.1 关联规则概述
5.1.1 关联规则的定义
5.1.2 关联规则的基本概念
5.1.3 关联规则挖掘算法
5.2 Apriori算法
5.2.1 Apriori算法原理
5.2.2 在Clementine中应用Apriori算法
5.3 CARMA算法
5.3.1 CARMA算法原理
5.3.2 在Clementine中应用CARMA算法
5.4 序列模式
5.4.1 序列与序列模式
5.4.2 序列模式挖掘算法
5.4.3 在Clementine中应用序列模式挖掘
第6章 数据筛选
6.1 特征选择
6.1.1 特征选择算法概述
6.1.2 筛选
6.1.3 分级
6.1.4 选择
6.1.5 在Clementine中应用特征选择
6.2 异常检测
6.2.1 异常数据挖掘概述
6.2.2 异常检测算法
6.2.3 在Clementine中应用异常检测
第7章 统计模型
7.1 线性回归
7.1.1 线性回归的基本原理
7.1.2 在Clementine中应用线性回归
7.2 二项Logistic回归
7.2.1 二项Logistic回归的基本原理
7.2.2 在Clementine中应用Logistic回归
第8章 神经网络
8.1 神经网络原理
8.1.1 神经网络基本概念
8.1.2 神经网络及其学习
8.2 多层感知器与RBF网络
8.2.1 多层感知器
8.2.2 径向基函数网络
8.2.3 在Clementine中应用神经网络
8.3 Kohonen网络
8.3.1 自组织神经网络
8.3.2 自组织特征映射网络
8.3.3 在Clementine中应用Kohonen网络
第9章 时间序列分析与预测
9.1 时间序列概述
9.1.1 时间序列基本概念
9.1.2 时间序列预测的传统方法
9.2 指数平滑法
9.2.1 指数平滑法概述
9.2.2 指数平滑模型
9.3 ARIMA模型
9.3.1 ARMA模型
9.3.2 差分运算与ARIMA模型
9.3.3 ARIMA建模过程
9.3.4 在Clementine中应用时间序列分析
参考文献