图书介绍
云计算和大数据技术 概念 应用与实战 第2版PDF|Epub|txt|kindle电子书版本网盘下载
- 王鹏,李俊杰,谢志明,石慧,黄焱编著 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115420800
- 出版时间:2016
- 标注页数:190页
- 文件大小:31MB
- 文件页数:202页
- 主题词:计算机网络-数据处理-高等学校-教材
PDF下载
下载说明
云计算和大数据技术 概念 应用与实战 第2版PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 云计算基础1
1.1云计算技术概述1
1.1.1云计算简介1
1.1.2云计算的特点2
1.1.3云计算技术分类3
1.1.4计算机技术向现代信息技术演进的历程6
1.2集群系统概述7
1.2.1集群系统的基本概念7
1.2.2集群系统的分类8
1.3分布式系统中计算和数据的协作机制8
1.3.1基于计算切分的分布式计算8
1.3.2基于计算和数据切分的混合型分布式计算技术——网格计算10
1.3.3基于数据切分的分布式计算技术11
1.3.4三种分布式系统的分析对比13
1.4云计算与物联网14
练习题16
第2章 大数据基础17
2.1大数据技术概述17
2.1.1大数据简介17
2.1.2大数据产生的原因18
2.1.3数据的计量单位19
2.1.4大数据是人类认识世界的新手段19
2.1.5几类高性能计算系统对比分析20
2.1.6主要的大数据处理系统21
2.1.7大数据处理的基本流程23
2.2大数据的典型应用示例24
2.2.1大数据在高能物理中的应用24
2.2.2推荐系统25
2.2.3搜索引擎系统25
2.2.4百度迁徙26
2.3大数据中的集群技术26
2.3.1集群文件系统的基本概念26
2.3.2集群系统概述27
2.3.3大数据并行计算的层次29
2.3.4大数据系统的分类方法30
2.3.5单一系统映象31
2.3.6集群中的一致性31
2.4云计算与大数据的发展33
2.4.1云计算与大数据发展历程33
2.4.2为云计算与大数据发展做出贡献的科学家36
2.4.3云计算与大数据的国内发展现状37
练习题38
第3章 虚拟化技术39
3.1虚拟化技术简介39
3.1.1虚拟化技术的发展39
3.1.2虚拟化技术的优势和劣势40
3.1.3虚拟化技术的分类41
3.2常见虚拟化软件43
3.2.1 VirtualBox43
3.2.2 VMware Workstation43
3.2.3 KVM44
3.3系统虚拟化44
3.3.1服务器虚拟化45
3.3.2桌面虚拟化47
3.3.3网络虚拟化49
3.4任务使用KV M构建虚拟机群49
3.4.1子任务1系统环境设置49
3.4.2子任务2安装虚拟化软件包50
3.4.3子任务3虚拟系统管理器的使用51
3.4.4子任务4虚拟机的远程访问53
练习题54
第4章 虚拟化平台55
4.1 XenServer简介55
4.1.1 XenServer优点56
4.1.2 XenServer硬件要求56
4.2任务一XenServer部署57
4.2.1子任务1XenServer的安装57
4.2.2子任务2 XenCenter的安装60
4.2.3子任务3制作模板62
4.2.4子任务4创建虚拟机66
4.3 VMware vSphere69
4.3.1 VMware vSphere体系结构69
4.3.2 VMware vSphere 硬件及其功能70
4.3.3 VMware vSphere硬件要求71
4.4任务二vSphere部署73
4.4.1子任务1ESXi的安装73
4.4.2子任务2 vSphere Client的安装75
练习题79
第5章 面向计算——MPI80
5.1 MPI概述80
5.2 MPI的架构和特点80
5.3任务一MPICH并行环境的建立81
5.3.1子任务1系统环境设置82
5.3.2子任务2用户创建和SSH设置82
5.3.3子任务3 NFS服务的安装83
5.3.4子任务4 MPICH编译运行83
5.4任务二MPI分布式程序设计84
5.4.1子任务1简单并行程序的编写85
5.4.2子任务2获取进程标志和机器名86
5.4.3子任务3有消息传递功能的并行程序88
5.4.4子任务4 Monte Carlo法在并行程序设计中的应用91
5.4.5子任务5并行计算中节点间的Reduce操作93
5.4.6设计MPI并行程序时的注意事项95
练习题96
第6章 分布式大数据系统——Hadoop97
6.1 Hadoop概述97
6.2 HDFS97
6.2.1 Google文件系统(GFS)98
6.2.2 HDFS文件的基本结构99
6.2.3 HDFS的存储过程100
6.2.4 YARN架构101
6.3任务一搭建Hadoop系统102
6.3.1子任务1系统环境设置102
6.3.2子任务2用户创建和SSH设置103
6.3.3子任务3 Hadoop安装和配置103
6.3.4子任务4 Hadoop的启动和查看106
6.4 分布式计算框架MapReduce107
6.4.1 MapReduce的发展历史107
6.4.2 MapReduce的基本工作过程107
6.4.3 MapReduce的特点110
6.5任务二Map/Reduce的C语言实现111
6.6任务三在Hadoop系统运行 MapReduce程序112
练习题113
第7章 分布式数据库——HBase114
7.1 HBase114
7.1.1 HBase简介114
7.1.2 HBase物理模型115
7.1.3 HBase架构及基本组件116
7.1.4 HBase组织结构117
7.2任务HBase的搭建与使用118
7.2.1子任务1HBase环境的搭建118
7.2.2子任务2 HBase的启动120
7.2.3子任务3 HBase Shell的使用120
7.2.4子任务4 HBase编程121
练习题128
第8章 数据仓库平台——Hive129
8.1 Hive129
8.1.1 Hive简介129
8.1.2 Hive的体系结构129
8.1.3 Hive元数据存储130
8.1.4 Hive的数据存储132
8.1.5 Hive和普通关系型数据库的差异132
8.2任务Hive的搭建与使用134
8.2.1子任务1MySQL的搭建134
8.2.2子任务2 Hive环境的搭建135
8.2.3子任务3 Hive Client的搭建137
8.2.4子任务4 Hive的基本操作138
8.2.5子任务5 Hive内部表与外部表的操作139
8.2.6子任务6 HWI的使用140
8.2.7子任务7 Beeline与JDBC编程142
8.2.8子任务8 Hive与HBase集成145
练习题147
第9章 基于拓扑的流数据实时计算系统——Storm149
9.1 Storm简介149
9.2 Storm原理及其体系结构150
9.2.1 Storm编程模型原理150
9.2.2 Storm体系结构151
9.2.3 ZooKeeper工作原理151
9.3任务一搭建Storm开发环境152
9.3.1子任务1系统环境设置153
9.3.2子任务2安装Python工具包153
9.3.3子任务3安装ZeroMQ和JZMQ工具包154
9.3.4子任务4安装ZooKeeper工具包155
9.3.5子任务5安装Storm工具包156
9.3.6子任务6复制工具包157
9.3.7子任务7 Storm的启动158
9.4任务二Storm使用实例159
9.4.1子任务1安装Maven工具包159
9.4.2子任务2使用Maven管理 storm-starter160
9.4.3子任务3 WordCountTopology实例分析161
练习题164
第10章 云存储系统——Swift165
10.1云存储概述165
10.1.1什么是云存储165
10.1.2云存储的分类165
10.1.3云存储的特点166
10.1.4存储系统类别167
10.1.5 CAP理论167
10.2 Swift简介168
10.2.1 Swift的发展历程168
10.2.2 Swift的特性168
10.2.3 Swift工作原理169
10.2.4环的数据结构169
10.2.5 Swift的系统架构170
10.3任务一Swift安装部署172
10.3.1子任务1系统环境设置172
10.3.2子任务2配置yum源173
10.3.3子任务3安装配置keystone服务174
10.3.4子任务4安装配置proxy节点178
10.3.5子任务5安装配置存储节点181
10.4任务二jclouds-swift编程184
练习题189
参考文献190