图书介绍

数据仓库基础PDF|Epub|txt|kindle电子书版本网盘下载

数据仓库基础
  • (美)Paulraj Ponniah著;段云峰等译 著
  • 出版社: 北京:电子工业出版社
  • ISBN:7505397842
  • 出版时间:2004
  • 标注页数:573页
  • 文件大小:73MB
  • 文件页数:596页
  • 主题词:数据库系统

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库基础PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 对数据仓库的迫切需求1

本章目标1

1.1 对战略信息的不断增长的需求2

1.1.1 信息危机4

1.1.2 技术趋势5

1.1 机遇和风险6

1.2 以往的决策支持系统的失败8

1.2.1 决策支持系统的历史9

1.2.2 缺乏提供战略信息的能力10

1.3.1 使商业运作起来11

1.3 操作型系统和决策支持系统11

1.3.3 不同的范围,不同的目12

1.3.2 监视商业的运作12

1.4.1 一种新类型的系统环境13

1.4 数据仓库——惟一可行的解决方案13

1.4.3 数据仓库的商业智能14

1.4.2 新环境下的需求处理14

1.5.1 数据仓库是信息传递的一种简单概念15

1.5 数据仓库的定义15

1.5.3 数据仓库是多种技术的混合体16

1.5.2 数据仓库是种环境,而不是产品16

本章小结17

练习题18

复习思考题18

本章目标20

第2章 数据仓库的组成部分20

2.1.1 面向主题的数据21

2.1 定义的特点21

2.1.2 综合的数据22

2.1.4 数据的非易变性24

2.1.3 数据的时间特性24

2.1.5 数据粒度26

2.2.1 它们有什么不同27

2.2 数据仓库和数据集市27

2.2.2 自上而下和自下而上的方法28

2.2.3 一个实用的方法29

2.3 数据仓库的组成部分30

2.3.1 源数据部分31

2.3.2 数据准备部分34

2.3.4 信息传递部分37

2.3.3 数据存储部分37

2.3.5 元数据部分38

2.4.1 元数据的类型39

2.4 数据仓库中的元数据39

2.3.6 管理和控制部分39

2.4.2 元数据的特殊意义40

复习思考题41

本章小结41

练习题42

本章目标43

第3章 数据仓库的发展趋势43

3.1.1 数据仓库正在成为主流44

3.1 数据仓库的持续成长44

3.1.2 数据仓库的扩张45

3.1.3 解决方案和产品46

3.2.1 多种数据类型48

3.2 重要趋势48

3.2.2 数据可视化51

3.2.3 并行处理53

3.2.5 浏览工具55

3.2.4 查询工具55

3.2.7 多维分析56

3.2.6 数据融合56

3.2.9 企业组合数据57

3.2.8 代理技术57

3.2.10 数据仓库和ERP58

3.2.11 数据仓库和知识管理59

3.2.12 数据仓库和CRM60

3.3 标准的出现62

3.2.13 活跃的数据仓库62

3.3.1 元数据63

3.3.2 OLAP64

3.4.1 将数据仓库放入Web中65

3.4 支持Web的数据仓库65

3.4.2 将Web技术引入数据仓库66

3.4.3 支持Web技术的配置67

复习思考题68

本章小结68

练习题69

本章目标70

第4章 规划和项目管理70

4.1.1 关键问题71

4.1 规划你的数据仓库71

4.1.2 商业需求,而非技术74

4.1.4 数据仓库的可行性分析75

4.1.3 高层管理的支持75

4.2 数据仓库项目77

4.1.5 全盘计划77

4.2.1 有什么不同78

4.2.2 准备情况的评估79

4.2.3 生命周期方法80

4.2.4 开发的各阶段82

4.3.1 组织项目团队83

4.3 项目团队83

4.3.2 角色和责任84

4.3.3 技能和经验水平87

4.3.4 用户参与88

4.4 项目管理要素89

4.4.1 项目管理的指导原则90

4.4.2 警告征兆91

4.4.3 成功的因素92

4.4.4 成功项目细审93

4.4.5 采用实用的方法94

本章小结95

练习题96

复习思考题96

5.1 维度分析98

本章目标98

第5章 定义商业需求98

5.1.2 商业数据的维度99

5.1.1 对不可预知的信息的使用99

5.1.3 商业维度的例子101

5.2.1 不完全确定的需求102

5.2 信息包——一个新概念102

5.2.3 维度层次和分类104

5.2.2 商业维度104

5.2.5 关键商业指标或事实106

5.3 收集需求的方法108

5.3.1 采访技巧109

5.3.2 调整联合应用程序设计方法111

5.3.3 回顾已有的文档113

5.4 需求定义:范围和内容114

5.4.2 数据转换115

5.4.1 数据源115

5.4.6 需求定义文档提纲116

5.4.5 信息包表116

5.4.3 数据存储116

5.4.4 信息传递116

复习思考题117

本章小结117

练习题118

本章目标120

第6章 需求——数据仓库的驱动力120

6.1 数据设计121

6.1.1 商业维度的结构123

6.1.3 细节层次124

6.1.2 关键衡量指标的结构124

6.2 体系结构规划125

6.2.1 组成部分的构成126

6.2.2 特殊因素127

6.2.3 工具和产品130

6.3 数据存储规范132

6.3.1 数据库管理系统的选择133

6.3.2 存储规模估计134

6.4 信息传递策略135

6.4.1 查询和报表136

6.4.4 决策支持应用程序137

6.4.3 信息分发137

6.4.2 分析的类型137

复习思考题138

本章小结138

6.4.5 发展和扩大138

练习题139

7.1.1 体系结构:定义141

7.1 掌握数据仓库的体系结构141

第7章 体系结构及其组成部分141

本章目标141

7.1.2 三个要区域的体系结构142

7.2 区别其他结构的特点143

7.2.1 不同目标和范围144

7.2.3 复杂分析和快速响应145

7.2.2 数据内容145

7.2.5 元数据驱动146

7.2.4 灵活性和动态性146

7.3.1 支持数据流的体系结构147

7.3 体系结构框架147

7.3.2 管理和控制模块148

7.4 技术体系结构149

7.4.1 数据获取151

7.4.2 数据存储154

7.4.3 信息传递156

本章小结158

练习题159

复习思考题159

8.1 支持体系结构的基础构造161

本章目标161

第8章 数据仓库的基础构造161

8.1.2 物理基础构造163

8.1.1 操作型基础构造163

8.2 硬件和操作系统165

8.2.1 平台选择166

8.2.2 服务器硬件178

8.3 数据库软件183

8.3.1 并行处理方案184

8.3.2 数据库管理系统的选择186

8.4 工具收集187

8.4.1 先设计好体系结构,再选择工具188

8.4.4 数据转换189

8.4.3 数据抽取189

8.4.2 数据建模189

8.4.8 联机分析处理(OLAP)190

8.4.7 查询和报表190

8.4.5 数据装载190

8.4.6 数据质量190

本章小结191

8.4.11 数据仓库管理191

8.4.9 预警系统191

8.4.10 中间件及连接部件191

练习题192

复习思考题192

9.1 元数据的重要性194

本章目标194

第9章 元数据的重要角色194

9.1.1 数据仓库的关键需求196

9.1.2 为什么元数据对最终用户很关键200

9.1.3 为什么元数据对IT人员很关键201

9.1.4 数据仓库任务自动化203

9.1.5 建立信息上下文205

9.2 按功能区域划分的元数据类型206

9.2.1 数据获取207

9.2.2 数据存储208

9.2.3 信息传递210

9.3.1 内容总揽211

9.3 商业元数据211

9.3.2 商业元数据举例212

9.3.4 谁会受益213

9.3.3 内容重点213

9.4.2 技术元数据举例214

9.4.1 内容总揽214

9.4 技术元数据214

9.4.4 谁会受益216

9.4.3 内容重点216

9.5 如何提供元数据217

9.5.1 元数据需求218

9.5.2 元数据的来源219

9.5.3 元数据管理面临的挑战221

9.5.4 元数据储存库222

9.5.6 实施选项224

9.5.5 元数据集成与标准224

本章小结226

练习题227

复习思考题227

10.1 从需求到数据设计229

本章目标229

第10章 维度建模的原则229

10.1.2 维度建模基础230

10.1.1 设计决策230

10.1.3 E-R建模与维度建模的对比235

10.1.4 使用CASE工具236

10.2.1 一个简单简的星型模式的回顾237

10.2 星型模式237

10.2.2 维度表的内容240

10.2.3 事实表的内容242

10.2.4 不含事实的事实表244

10.2.5 数据粒度245

10.3.1 主键246

10.3 星型模式的键246

10.3.2 替代键247

10.4 星型模式的优势248

10.3.3 外键248

10.4.1 用户容易理解249

10.4.2 优化浏览250

10.4.3 最适于查询处理251

本章小结252

10.4.4 星型连接和星型索引252

练习题253

复习思考题253

本章目标255

第11章 维度建模:高级专题255

11.1 维度表的更新256

11.1.1 慢速变化中的维度256

11.1.2 第1类修改:改正错误257

11.1.3 第2类修改:保存历史数据259

11.1.4 第3类修改:暂时的(软性的)修改260

11.2 各式各样的维度262

11.2.1 大维度263

11.2.2 快速变化中的维度264

11.2.3 废弃维度266

11.3 雪花型模式267

11.3.1 规范化选项268

11.3.2 优势与劣势269

11.3.3 什么时候使用雪花型模式270

11.4 聚集事实表271

11.4.1 事实表的大小273

11.4.3 对事实表进行聚集275

11.4.2 对聚集的需求275

11.4.4 聚集的选项281

11.5 星型模式族283

11.5.1 快照表和事务表284

11.5.2 核心表和定制表285

11.5.3 支持企业价值链或者价值环286

11.5.4 使维度一致287

11.5.5 将事实表标准化288

11.5.6 星型模式族小结289

复习思考题290

本章小结290

练习题291

本章目标292

第12章 数据抽取、转换和装载292

12.1 ETL概览293

12.1.1 最重要和最具有挑战性294

12.1.2 耗时而且费劲295

12.1.3 ETL的需求和步骤296

12.1.4 关键因素297

12.2 数据抽取298

12.2.1 数据源确认299

12.2.2 数据抽取技术300

12.2.3 技术的评估307

12.3 数据转换309

12.3.1 数据转换:基本任务310

12.3.2 主要转换类型311

12.3.4 数据整合和合并313

12.3.5 维度属性的转换315

12.3.6 如何实施转换316

12.4 数据装载318

12.4.1 应用数据:技术和过程319

12.4.2 数据的刷新和更新322

12.4.3 维度表的规程323

12.4.4 事实表:历史与增量的装载324

12.5 ETL总结325

12.5.1 ETL工具选项326

12.5.2 再次强调ETL中的元数据(Metadata)327

12.5.3 ETL的总结和方法328

本章小结329

练习题330

复习思考题330

本章目标332

第13章 数据质量:成功的关键332

13.1 为什么数据质量如此重要333

13.1.1 什么是数据质量334

13.1.2 提高数据质量的好处337

13.1.3 数据质量问题的类型338

13.2 数据质量的挑战341

13.2.1 数据污染的来源342

13.2.2 姓名和地址的行效性344

13.2.3 数据质量低劣带来的代价345

13.3.2 错误发现特性346

13.3.1 数据清洗工具的分类346

13.3 数据质量工具346

13.3.4 数据库管理系统的质量控制347

13.3.3 数据修正特性347

13.4 确保数据质量的第一步348

13.4.1 数据清洗的决策349

13.4.2 谁应该负责352

13.4.3 净化过程353

13.4.4 对数据质量的实用建议355

复习思考题356

本章小结356

练习题357

本章目标359

第14章 信息和用户类型之间的匹配359

14.1.1 数据仓库和操作型系统360

14.1 来自于数据仓库的信息360

14.1.2 信息潜力362

14.1.3 用户—信息接口366

14.2 谁将使用这些信息368

14.1.4 行业应用368

14.2.1 用户的种类369

14.2.2 他们需要什么372

14.2.3 怎样为用户提供信息376

14.3 信息传递机制377

14.3.1 查询379

14.3.2 报表381

14.3.3 分析382

14.4.4 应用程序383

14.5.1 桌面电脑环境384

14.5 信息传递工具384

14.5.2 工具选择的方法学385

14.5.3 选择工具的标准389

14.5.4 信息传递框架390

本章小结391

复习思考题392

练习题393

本章目标394

第15章 数据仓库中的联机分析处理(OLAP)394

15.1.1 对多维分析的需要395

15.1 联机分析处理的要求395

15.1.2 快速的访问和强大的计算能力397

15.1.3 其他分析方法的局限性399

15.1.4 联机分析处理(OLAP)是用户需要的答案401

15.1.5 OLAP的定义和规则403

15.1.6 OLAP的特征405

15.2.1 一般特征406

15.2 主要的特征和功能406

15.2.2 维度分析407

15.2.3 什么是超立方体411

15.2.4 下钻和概括化的操作416

15.2.5 多层次/多视角查看或旋转的操作418

15.3 OLAP模型419

15.2.6 OLAP的使用和好处419

15.3.1 变种的概述420

15.3.2 MOLAP模型421

15.3.3 ROLAP模型422

15.3.4 ROLAP 与 MOLAP423

15.4 OLAP实施的考虑事项424

15.4.1 数据设计和准备425

15.4.2 管理和性能428

15.4.3 OLAP平台429

15.4.4 OLAP工具和产品430

15.4.5 实施步骤431

复习思考题432

本章小结432

练习题433

本章目标434

第16章 数据仓库和Web434

16.1 支持Web的数据仓库435

16.1.1 为什么是Web436

16.1.2 技术的结合438

16.1.3 调整数据仓库以支持Web439

16.1.4 作为数据源的Web440

16.2 基于Web的信息传递机制441

16.2.1 扩展的数据仓库的使用442

16.2.2 新的信息策略444

16.2.3 数据仓库的浏览器技术447

16.2.4 安全问题449

16.3.1 企业OLAP450

16.3 OLAP和Web450

16.3.3 OLAP引擎的设计451

16.3.2 Web-OLAP方法451

16.4 建立支持Web的数据仓库452

16.4.1 数据网络仓库的性质453

16.4.2 对如何实现数据网络仓库的考虑455

16.4.3 将组件放在一起456

16.4.4 Web处理模型457

本章小结458

练习题459

复习思考题459

本章目标461

第17章 数据挖掘基础461

17.1 数据挖掘是什么462

17.1.1 定义数据挖掘463

17.1.2 知识发现过程465

17.1.3 OLAP和数据挖掘468

17.1.4 数据挖掘和数据仓库470

17.2 主要的数据挖掘技术472

17.2.1 聚簇检测(clusterdetection)473

17.2.2 决策树476

17.2.3 基于记忆的推理478

17.2.4 关联分析479

17.2.5 神经网络482

17.2.6 遗传算法484

17.2.7 进入数据挖掘486

17.3 数据挖掘的应用489

17.3.1 数据挖掘的收益490

17.3.2 在零售业的应用491

17.3.3 在电信行业中的应用492

本章小结493

17.3.4 在银行和金融业的应用493

练习题494

复习思考题494

本章目标496

第18章 物理设计过程496

18.1.1 建立标准497

18.1 物理设计步骤497

18.1.3 确定数揣分区方案498

18.1.2 建立聚集计划498

18.1.5 准备索引策略499

18.1.4 建立聚簇选项499

18.2 物理设计考虑的因素500

18.1.7 完成物理建模500

18.1.6 安排存储结构500

18.2.1 物理设计目标501

18.2.2 从逻辑模型到物理模型502

18.2.3 物理模型的组成503

18.2.4 标准的意义505

18.3 物理存储507

18.3.2 优化存储508

18.3.1 存储区数据结构508

18.3.3 使用RAID技术511

18.3.4 估计存储容量512

18.4 为数据仓库建立索引513

18.4.1 索引一览513

18.4.2 B-Tree索引515

18.4.3 位图索引516

18.4.4 簇索引518

18.4.5 为事实表建立索引518

18.4.6 为维度表建立索引519

18.5 提高性能的技术519

18.5.1 数据分区520

18.5.2 数据聚簇521

18.5.3 并行查询521

18.5.4 汇总级别522

18.5.5 参考完整性检查522

18.5.6 初始化参数522

18.5.7 数据阵列523

本章小结523

复习思考题524

练习题524

第19章 数据仓库部署526

本章目标526

19.1 部署的主要任务527

19.1.1 完成用户认可527

19.1.2 执行初始装载528

19.1.3 准备好用户桌面530

19.1.4 完成初始用户培训530

19.1.5 建立最初户支持531

19.1.6 按阶段部署532

19.2 领航系统533

19.2.1 领航数据集市什么时候用534

19.2.2 领航系统的类型535

19.2.3 选择领航系统537

19.2.4 扩展和集成领航系统539

19.3 安全539

19.3.1 安全政策540

19.3.2 管理用户权限541

19.3.3 密码542

19.3.4 安全工具542

19.4 备份和恢复543

19.4.1 为什么备份数据仓备库543

19.4.2 备份策略544

19.4.3 建立一个实际的日程表545

19.4.4 恢复546

本章小结547

复习思考题548

练习题548

第20章 升级和维护550

本章目标550

20.1 监视数据仓库551

20.1.1 统计数据收集552

20.1.2 为升级划使统计数据553

20.1.3 为优化使用统计数据554

20.1.4 向用户公布趋势554

20.2 用户培训和支持555

20.2.1 用户培训内容555

20.2.2 准备培训计划557

20.2.3 执行培训计划558

20.2.4 用户支持559

20.3 管理数据仓库561

20.3.1 平台升级561

20.3.2 数据增长管理562

20.3.3 存储管理562

20.3.4 ETL管理563

20.3.5 数据模型修订564

20.3.6 信息传递增强564

20.3.7 持续的优化565

本章小结565

复习思考题566

练习题566

附录A 项目生存期步骤和列表567

附录B 成功的关键因素571

附录C 评估供应商解决方案的指南572

热门推荐