图书介绍
全栈数据之门PDF|Epub|txt|kindle电子书版本网盘下载
![全栈数据之门](https://www.shukui.net/cover/35/30471211.jpg)
- 任柳江著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121309052
- 出版时间:2017
- 标注页数:368页
- 文件大小:81MB
- 文件页数:396页
- 主题词:软件工具-程序设计
PDF下载
下载说明
全栈数据之门PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
0x1 Linux,自由之光1
0x10 Linux,你是我的眼1
0x11 Linux基础,从零开始3
01 Linux之门3
02 文件操作4
03 权限管理6
04 软件安装8
05 实战经验10
0x12 sed与grep,文本处理10
01 文本工具10
02 grep的使用11
03 grep家族13
04 sed的使用14
05 综合案例16
0x13 数据工程,必备Shell18
01 Shell分析18
02 文件探索19
03 内容探索20
04 交差并补20
05 其他常用的命令21
06 批量操作22
07 结语25
0x14 Shell快捷键,Emacs之门25
01 提高效率25
02 光标移动26
03 文本编辑27
04 命令搜索28
05 Emacs入门29
06 Emacs思维31
0x15 缘起Linux,一入Mac误终身32
01 开源生万物32
02 有钱就换Mac32
03 程序员需求33
04 非程序员需求34
05 一入Mac误终身35
0x16 大成就者,集群安装36
01 离线安装36
02 Host与SSH配置37
03 sudo与JDK环境39
04 准备Hadoop包40
05 开启HTTP与配置源41
06 安装ambari-server41
07 后续服务安装42
08 结语44
0x2 Python,道法自然45
0x20 Python,灵犀一指45
0x21 Python基础,兴趣为王47
01 第一语言47
02 数据结构47
03 文件读写49
04 使用模块50
05 函数式编程52
06 一道面试题53
07 兴趣驱动55
0x22 喜新厌旧,2迁移356
01 新旧交替56
02 基础变化57
03 编码问题58
04 其他变化58
05 2to3脚本60
06 PySpark配置61
07 喜新厌旧62
0x23 Anaconda,IPython62
01 Anaconda62
02 安装与配置63
03 pip与源64
04 IPython与Jupyter65
05 结语67
0x24 美不胜收,Python工具67
01 缘起67
02 调试与开发68
03 排版与格式化70
04 辅助工具72
05 实用推荐74
0x25 numpy基础,线性代数75
01 numpy的使用75
02 索引与切片76
03 变形与统计78
04 矩阵运算80
05 实用方法83
06 结语85
0x26 numpy实战,PCA降维85
01 PCA介绍85
02 数据均值化86
03 协方差矩阵87
04 特征值与向量88
05 数据映射降维89
06 sklearn实现90
0x3 大数据,其大无外93
0x30 太大数据,极生两仪93
0x31 神象住世,Hadoop95
01 Hadoop95
02 HDFS96
03 角色与管理97
04 文件操作98
05 结语100
0x32 分治之美,MapReduce100
01 map与reduce函数100
02 分而治之102
03 Hello,World103
04 Streaming接口105
0x33 Hive基础,蜂巢与仓库106
01 引言106
02 Hive接口107
03 分区建表108
04 分区机制110
05 数据导入/导出111
06 Hive-QL112
07 结语114
0x34 Hive深入,实战经验115
01 排序与分布式115
02 多表插入与mapjoin116
03 加载map-reduce脚本117
04 使用第三方UDF119
05 实战经验120
06 生成唯一ID121
0x35 HBase库,实时业务122
01 理论基础122
02 Shell操作123
03 关联Hive表126
04 数据导入128
05 实用经验130
0x36 SQL与NoSQL,Sqoop为媒130
01 SQL与NoSQL130
02 从MySQL导入HDFS131
03 增量导入134
04 映射到Hive135
05 导入Hive表136
06 从HDFS导出到MySQL137
07 从Hive导出到MySQL138
0x4 数据分析,见微知著141
0x40 大数据分析,鲁班为祖师141
0x41 SQL技能,必备MySQL143
01 SQL工具143
02 基础操作144
03 查询套路145
04 join查询146
05 union与exists149
06 实战经验151
0x42 快刀awk,斩乱数据152
01 快刀152
02 一二三要点152
03 一个示例154
04 应用与统计154
05 斩乱麻156
0x43 Pandas,数据之框157
01 数据为框157
02 加载数据158
03 行列索引159
04 行列操作161
05 合并聚合163
06 迭代数据164
07 结语165
0x44 Zeppelin,一统江湖166
01 心潮澎湃166
02 基本使用168
03 SQL与可视化169
04 安装Zeppelin172
05 配置Zeppelin173
06 数据安全174
07 使用心得176
0x45 数据分组,聚合窗口177
01 MySQL聚合177
02 Spark聚合178
03 非聚合字段179
04 Hive实现180
05 group_concat181
06 Hive窗口函数183
07 DataFrame窗口184
08 结语185
0x46 全栈分析,六层内功186
01 引言186
02 MySQL版本186
03 awk版本187
04 Python版本188
05 Hive版本189
06 map-reduce版本190
07 Spark版本190
08 结语191
0x5 机器学习,人类失控193
0x50 机器学习,琅琊论断193
0x51 酸酸甜甜,Orange195
01 可视化学习195
02 数据探索196
03 模型与评估199
04 组件介绍200
05 与Python进行整合202
06 结语204
0x52 sklearn,机器学习205
01 sklearn介绍205
02 数据预处理206
03 建模与预测207
04 模型评估209
05 模型持久化210
06 三个层次210
0x53 特征转换,量纲伸缩211
01 特征工程211
02 独热编码212
03 sklearn示例213
04 标准化与归一化215
05 sklearn与Spark实现216
06 结语219
0x54 描述统计,基础指标220
01 描述性统计220
02 Pandas实现222
03 方差与协方差223
04 Spark-RDD实现224
05 DataFrame实现226
06 Spark-SQL实现227
07 结语227
0x55 模型评估,交叉验证228
01 测试与训练228
02 评价指标229
03 交叉验证231
04 验证数据232
05 OOB数据233
0x56 文本特征,词袋模型234
01 自然语言234
02 中文分词235
03 词袋模型236
04 词频统计237
05 TF-IDF238
06 结语239
0x6 算法预测,占天卜地241
0x60 命由己做,福自己求241
0x61 近朱者赤,相亲kNN243
01 朴素的思想243
02 算法介绍243
03 分类与回归244
04 k与半径245
05 优化计算246
06 实例应用247
0x62 物以类聚,Kmeans248
01 算法描述248
02 建立模型249
03 理解模型251
04 距离与相似性252
05 降维与可视化253
06 无监督学习255
0x63 很傻很天真,朴素贝叶斯257
01 朴素思想257
02 概率公式257
03 三种实现258
04 sklearn示例260
05 朴素却不傻262
0x64 菩提之树,决策姻缘263
01 缘起263
02 Orange演示264
03 scikit-learn模拟266
04 熵与基尼指数267
05 决策过程分析268
06 Spark模拟270
07 结语271
0x65 随机之美,随机森林271
01 树与森林271
02 处处随机273
03 sklearn示例274
04 MLlib示例275
05 特点与应用276
0x66 自编码器,深度之门277
01 深度学习277
02 特征学习278
03 自动编码器280
04 Keras代码282
05 抗噪编码器283
0x7 Spark,唯快不破285
0x70 人生苦短,快用Spark285
0x71 PySpark之门,强者联盟287
01 全栈框架287
02 环境搭建288
03 分布式部署289
04 示例分析290
05 两类算子292
06 map与reduce293
07 AMPLab的野心294
0x72 RDD算子,计算之魂295
01 算子之道295
02 获取数据296
03 过滤与排序297
04 聚合数据298
05 ioin连接299
06 union与zip300
07 读写文件301
08 结语303
0x73 分布式SQL,蝶恋飞舞304
01 SQL工具304
02 命令行CLI304
03 读Hive数据305
04 将结果写入Hive306
05 读写MySQL数据307
06 读写三种文件308
0x74 DataFrame,三角之恋310
01 DataFrame310
02 生成数据框311
03 合并与ioin313
04 select操作314
05 SQL操作315
06 自定义UDF316
07 三角之恋318
0x75 神器之父,Scala入世319
01 Spark与Scala319
02 Scala REPL320
03 编译Scala321
04 sbt编译322
05 示例分析323
06 编译提交325
0x76 机器之心,ML套路326
01 城市套路深326
02 算法与特征工程327
03 管道工作流328
04 OneHotEncoder示例329
05 ML回归实战331
06 特征处理与算法332
07 拟合与评估334
0x8 数据科学,全栈智慧337
0x80 才高八斗,共分天下337
0x81 自学数据,神蟒领舞339
01 机器学习339
02 语言领域339
03 Python数据生态340
04 相关资料341
05 书籍推荐342
06 性感的职业343
0x82 数据科学,七大技能343
01 七大技能343
02 SQL与NoSQL技能344
03 Linux工具集344
04 Python或者R语言生态345
05 Hadoop与Spark生态345
06 概率、统计与线性代数346
07 机器学习与深度学习346
08 业务及杂项347
09 结语347
0x83 大无所大,生态框架348
01 计算生态348
02 离线计算348
03 交互分析349
04 实时处理350
05 算法挖掘351
06 发行版本352
07 其他工具353
0x84 集体智慧,失控哲学354
01 数据是宝354
02 一分为二355
03 回归统一356
04 聚少成多356
05 你中有我357
06 从小看大358
07 大事化小358
08 少即是多359
0x85 一技之长,一生之用359
01 一技之长359
02 数据分析相关360
03 Python相关360
04 Hadoop相关361
05 Spark相关361
06 模型相关362
07 算法相关362
08 一生之用363
0x86 知识作谱,数据为栈363
01 知识作谱363
02 理论基础363
03 Python/R编程364
04 分析与可视化365
05 大数据365
06 ETL与特征工程366
07 机器学习与深度学习366
08 工具与库367
09 全栈为用367