图书介绍
数据挖掘导论PDF|Epub|txt|kindle电子书版本网盘下载
![数据挖掘导论](https://www.shukui.net/cover/66/34444846.jpg)
- 戴红,常子冠,于宁主编 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302381044
- 出版时间:2015
- 标注页数:208页
- 文件大小:46MB
- 文件页数:219页
- 主题词:数据采集-高等学校-教材
PDF下载
下载说明
数据挖掘导论PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 认识数据挖掘1
1.1 数据挖掘的定义1
1.2 机器学习2
1.2.1 概念学习2
1.2.2 归纳学习3
1.2.3 有指导的学习4
1.2.4 无指导的聚类7
1.3 数据查询8
1.4 专家系统8
1.5 数据挖掘的过程9
1.5.1 准备数据10
1.5.2 挖掘数据10
1.5.3 解释和评估数据10
1.5.4 模型应用11
1.6 数据挖掘的作用11
1.6.1 分类11
1.6.2 估计12
1.6.3 预测12
1.6.4 无指导聚类12
1.6.5 关联关系分析13
1.7 数据挖掘技术13
1.7.1 神经网络14
1.7.2 回归分析14
1.7.3 关联分析15
1.7.4 聚类技术16
1.8 数据挖掘的应用16
1.8.1 应用领域16
1.8.2 成功案例18
1.9 Weka数据挖掘软件19
1.9.1 Weka简介19
1.9.2 使用Weka建立决策树模型22
1.9.3 使用Weka进行聚类25
1.9.4 使用Weka进行关联分析26
本章小结27
习题28
第2章 基本数据挖掘技术30
2.1 决策树30
2.1.1 决策树算法的一般过程31
2.1.2 决策树算法的关键技术32
2.1.3 决策树规则40
2.1.4 其他决策树算法41
2.1.5 决策树小结41
2.2 关联规则42
2.2.1 关联规则概述42
2.2.2 关联分析43
2.2.3 关联规则小结46
2.3 聚类分析技术47
2.3.1 K-means算法48
2.3.2 K-means算法小结51
2.4 数据挖掘技术的选择51
本章小结52
习题53
第3章 数据库中的知识发现55
3.1 知识发现的基本过程55
3.1.1 KDD过程模型55
3.1.2 知识发现软件57
3.1.3 KDD过程的参与者58
3.2 KDD过程模型的应用58
3.2.1 步骤1:商业理解58
3.2.2 步骤2:数据理解59
3.2.3 步骤3:数据准备60
3.2.4 步骤4:建模65
3.2.5 评估66
3.2.6 部署和采取行动66
3.3 实验:KDD案例66
本章小结72
习题73
第4章 数据仓库74
4.1 数据库与数据仓库74
4.1.1 数据(库)模型75
4.1.2 规范化与反向规范化77
4.2 设计数据仓库79
4.2.1 数据抽取、清洗、变换和加载79
4.2.2 数据仓库模型82
4.2.3 数据集市85
4.2.4 决策支持系统86
4.3 联机分析处理87
4.3.1 概述87
4.3.2 实验:使用OLAP辅助驾驶员行为分析90
4.4 使用Excel数据透视表和数据透视图分析数据93
4.4.1 创建简单数据透视表和透视图93
4.4.2 创建多维透视表和透视图97
本章小结100
习题100
第5章 评估技术102
5.1 数据挖掘评估概述102
5.1.1 评估内容102
5.1.2 评估工具103
5.2 评估有指导学习模型108
5.2.1 评估分类类型输出模型108
5.2.2 评估数值型输出模型109
5.2.3 计算检验集置信区间111
5.2.4 无指导聚类技术的评估作用112
5.3 比较有指导学习模型112
5.3.1 使用Lift比较模型112
5.3.2 通过假设检验比较模型114
5.4 属性评估115
5.4.1 数值型属性的冗余检查115
5.4.2 数值属性显著性的假设检验117
5.5 评估无指导聚类模型118
本章小结118
习题119
第6章 神经网络技术120
6.1 神经网络概述120
6.1.1 神经网络模型120
6.1.2 神经网络的输入和输出数据格式121
6.1.3 激励函数123
6.2 神经网络训练124
6.2.1 反向传播学习124
6.2.2 自组织映射的无指导聚类127
6.2.3 实验:应用BP算法建立前馈神经网络130
6.3 神经网络模型的优势和缺点138
本章小结138
习题139
第7章 统计技术141
7.1 回归分析141
7.1.1 线性回归分析142
7.1.2 非线性回归149
7.1.3 树回归151
7.2 贝叶斯分析152
7.3 聚类技术156
7.3.1 分层聚类156
7.3.2 基于模型的聚类163
7.4 数据挖掘中的统计技术与机器学习技术165
本章小结165
习题167
第8章 时间序列和基于Web的数据挖掘169
8.1 时间序列分析169
8.1.1 概述169
8.1.2 线性回归分析解决时间序列问题173
8.1.3 神经网络技术解决时间序列问题175
8.2 基于Web的数据挖掘176
8.2.1 概述176
8.2.2 Web文本挖掘178
8.2.3 Web使用挖掘179
8.3 多模型分类技术185
8.3.1 装袋技术185
8.3.2 推进技术185
本章小结186
习题187
附录A 词汇表188
附录B 数据挖掘数据集201
参考文献208