图书介绍

写给大家看的大数据PDF|Epub|txt|kindle电子书版本网盘下载

写给大家看的大数据
  • (美)赫尔维茨著 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115356130
  • 出版时间:2014
  • 标注页数:260页
  • 文件大小:51MB
  • 文件页数:282页
  • 主题词:数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

写给大家看的大数据PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 大数据入门1

第1章 大数据基础3

数据管理的演化过程4

理解数据管理的几个关键5

关键1:创建可管理的数据结构5

关键2:Web和内容管理7

关键3:管理大数据7

大数据的定义9

构建成功的大数据管理架构10

捕捉、组织、集成分析与模拟10

建立架构基础11

性能问题13

传统与高级分析15

大数据之旅16

第2章 研究大数据类型17

定义结构化的数据18

探索大结构化数据源18

理解关系型数据库在大数据中的角色19

定义非结构化数据21

探索非结构化数据源21

理解CMS在大数据管理中的角色23

理解实时需求和非实时需求23

聚合大数据25

管理不同类型的数据25

将不同类型的数据整合到大数据环境中25

第3章 当老古董遇上新生代:分布式计算27

分布式计算简史27

感谢DARPA27

可持续模型的价值28

了解分布式计算基础29

为什么大数据需要分布式计算29

计算经济的改变30

时延带来的问题30

当需求遇上解决方案31

获取所需的性能31

第二部分 大数据的技术基础33

第4章 深入大数据技术组件35

探索大数据栈36

第0层:带冗余的物理基础架构37

物理冗余网络38

管理硬件:存储与服务器39

基础架构操作39

第1层:安全框架39

进/出应用程序和互联网的界面与接口40

第2层:可操作数据库42

第3层:组织数据服务与工具43

第4层:可分析的数据仓库44

大数据分析45

大数据应用程序46

第5章 虚拟化及其如何支持分布式计算47

理解虚拟化的基本知识47

在大数据中使用虚拟化的重要性48

服务器虚拟化50

应用程序虚拟化50

网络虚拟化51

处理器和内存虚拟化51

数据和存储虚拟化52

使用Hypervisor管理虚拟化53

抽象化与虚拟化54

实现在大数据中的虚拟化54

第6章 云和大数据56

大数据领域中的云56

理解云部署和分发模型57

云部署模型57

云分发模型59

大数据需要云60

在大数据中使用云61

大数据云市场的服务提供商62

亚马逊公共弹性计算云(EC2)63

谷歌的大数据服务64

微软Azure64

OpenStack65

在使用云服务时需要注意什么65

第三部分 大数据管理67

第7章 操作型数据库69

RDBMS在大数据领域的重要性71

非关系型数据库72

Key-Value型数据库73

文档数据库75

MongoDB76

CouchDB77

纵列数据库78

图形数据库79

空间数据库81

混合持久化83

第8章 MapReduce基础85

MapReduce溯源85

理解Map函数86

添加Reduce函数88

结合Map和Reduce89

优化MapReduce91

硬件/网络拓扑92

同步92

文件系统92

第9章 探索Hadoop的世界94

谈谈Hadoop94

理解Hadoop分布式文件系统(HDFS)95

Name节点95

数据节点96

理解HDFS97

Hadoop的MapReduce99

准备数据100

开始Mapping101

Reduce和融合101

第10章 Hadoop基础和生态103

使用Hadoop生态系统构建大数据基础103

使用Hadoop YARN管理资源和应用程序104

使用HBase存储大数据105

使用Hive挖掘大数据106

使用Hadoop生态系统107

Pig和Pig Latin107

Sqoop108

Zookeeper109

第11章 设备和大数据仓库111

使用传统数据仓库装载大数据111

优化数据仓库112

区别大数据结构和数据仓库数据112

一个混合式处理的例子113

大数据分析和数据仓库114

集成的关键115

再思考提取、变换和载入115

改变数据仓库的角色116

改变部署模型116

设备模型117

云模型117

数据仓库的未来117

第四部分 数据分析与大数据119

第12章 定义大数据分析121

使用大数据获得结果121

基本分析122

高级分析123

实用性分析126

货币化分析126

为掌握大数据修改商务智能产品126

数据126

分析算法127

基础架构支持128

大数据分析案例研究128

Orbitz129

Nokia129

NASA129

大数据分析解决方案130

第13章 理解文本分析和大数据131

探索非结构化数据132

理解文本分析133

分析和提取技术135

理解信息抽取136

分类学137

将结果汇总成结构化数据138

开始使用大数据138

客户的声音138

社交媒体分析139

大数据文本分析工具141

Attensity141

Clarabridge142

IBM142

OpenText142

SAS143

第14章 大数据分析的定制化144

构建新的大数据模型145

理解大数据分析的各种方法147

大数据分析的定制应用程序147

大数据分析的半定制化应用程序149

大数据分析框架的特点151

由大到小:大数据悖论153

第五部分 大数据实现155

第15章 集成数据源157

识别你需要的数据157

勘探阶段158

编制阶段159

集成和整合阶段160

理解大数据集成基础161

定义传统ETL163

理解ELT——提取、载入和转换164

大数据质量优化165

使用Hadoop实现ETL166

大数据集成的最佳实践166

第16章 处理实时数据流和复杂事件168

流数据和复杂事件处理169

使用流数据169

数据流169

流的元数据171

使用复杂事件处理172

从流中分离出CEP173

商务领域的数据流和CEP174

第17章 可操作的大数据175

让大数据成为操作过程的一部分175

集成大数据175

疾病诊断中的大数据协作177

理解大数据工作流180

大数据的有效性、准确性和波动性181

数据有效性181

数据波动性182

第18章 在企业中应用大数据184

大数据经济学184

数据类型和数据来源的识别185

修改业务流或创建新的业务流187

大数据工作流的技术影响188

网罗大数据项目的人才188

计算大数据的投入产出(ROI)189

企业数据管理和大数据189

创建大数据实施里程碑190

理解业务紧迫性191

正确地预测工作量191

选择正确的软件开发方法学191

平衡预算和功能192

评估风险承受能力192

迈出第一步193

第19章 大数据环境的安全和管理195

大数据下的安全195

评估业务风险196

大数据中潜藏的风险196

理解数据保护197

数据管理的挑战198

大数据过程审计199

定位关键利益者200

正确运用组织架构200

为管理风险做准备200

制订正确的管理规则和质量保障201

开发管理完善、安全可靠的大数据环境201

第六部分 现实中的大数据解决方案203

第20章 大数据对业务的重要性205

将大数据作为业务规划的工具205

第一步:规划中引入数据206

第步:执行分析206

第三步:检查结果207

第四步:落实计划207

规划过程的另一个维度207

第五步:实时监控208

第六步:调节影响208

第七步:适应性实验208

正确地看待数据分析208

在正确的基础上开始行动209

规划大数据210

调整业务流程210

第21章 从现实视角看数据分析212

理解用户对运动型数据的需求213

流数据对环境的影响214

使用传感器来提供实时水文信息215

实时数据的优势215

流数据对公共政策的影响216

流数据在医疗行业的应用217

流数据在能源行业的应用218

使用流数据提升能量产率218

使用流数据提升能源产出218

连接数据流和历史数据与其他实时数据源219

第22章 从现实视角看大数据分析对业务流程的优化220

了解企业对大数据分析的需求220

使用文本分析提升客户体验221

使用大数据分析进行决策222

使用大数据分析避免欺诈224

整合新数据源的商业价值225

第七部分 十项注意227

第23章 十条大数据最佳实践229

理解你的目标229

建立里程碑230

发现你的数据230

清楚你缺少什么数据230

理解可选技术方案231

规划大数据安全231

规划大数据管理策略231

规划数据管家232

持续测试232

学习最佳实践和利用模式232

第24章 十个大数据资源234

Hurwitz&Associates234

标准化组织234

开放数据基金会234

云安全联盟235

美国国家标准和科技机构235

Apache软件基金会235

OASIS235

供应商的网站236

在线协作套件236

大数据会议237

第25章 十条“要”与“不要”238

要将所有业务单元都涵盖在大数据战略中238

要评估所有的大数据分发模型238

要将传统数据源作为大数据战略的一部分238

要计划持久化元数据239

要分发你的数据239

不要依赖于单一的大数据分析方法239

不要在准备充分之前就膨胀239

不要忽略数据集成的需求239

不要忘记安全地管理数据240

不要忽略数据的管理效率240

术语表241

热门推荐