图书介绍

全栈数据之门PDF|Epub|txt|kindle电子书版本网盘下载

全栈数据之门
  • 任柳江著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121309052
  • 出版时间:2017
  • 标注页数:368页
  • 文件大小:81MB
  • 文件页数:396页
  • 主题词:软件工具-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

全栈数据之门PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

0x1 Linux,自由之光1

0x10 Linux,你是我的眼1

0x11 Linux基础,从零开始3

01 Linux之门3

02 文件操作4

03 权限管理6

04 软件安装8

05 实战经验10

0x12 sed与grep,文本处理10

01 文本工具10

02 grep的使用11

03 grep家族13

04 sed的使用14

05 综合案例16

0x13 数据工程,必备Shell18

01 Shell分析18

02 文件探索19

03 内容探索20

04 交差并补20

05 其他常用的命令21

06 批量操作22

07 结语25

0x14 Shell快捷键,Emacs之门25

01 提高效率25

02 光标移动26

03 文本编辑27

04 命令搜索28

05 Emacs入门29

06 Emacs思维31

0x15 缘起Linux,一入Mac误终身32

01 开源生万物32

02 有钱就换Mac32

03 程序员需求33

04 非程序员需求34

05 一入Mac误终身35

0x16 大成就者,集群安装36

01 离线安装36

02 Host与SSH配置37

03 sudo与JDK环境39

04 准备Hadoop包40

05 开启HTTP与配置源41

06 安装ambari-server41

07 后续服务安装42

08 结语44

0x2 Python,道法自然45

0x20 Python,灵犀一指45

0x21 Python基础,兴趣为王47

01 第一语言47

02 数据结构47

03 文件读写49

04 使用模块50

05 函数式编程52

06 一道面试题53

07 兴趣驱动55

0x22 喜新厌旧,2迁移356

01 新旧交替56

02 基础变化57

03 编码问题58

04 其他变化58

05 2to3脚本60

06 PySpark配置61

07 喜新厌旧62

0x23 Anaconda,IPython62

01 Anaconda62

02 安装与配置63

03 pip与源64

04 IPython与Jupyter65

05 结语67

0x24 美不胜收,Python工具67

01 缘起67

02 调试与开发68

03 排版与格式化70

04 辅助工具72

05 实用推荐74

0x25 numpy基础,线性代数75

01 numpy的使用75

02 索引与切片76

03 变形与统计78

04 矩阵运算80

05 实用方法83

06 结语85

0x26 numpy实战,PCA降维85

01 PCA介绍85

02 数据均值化86

03 协方差矩阵87

04 特征值与向量88

05 数据映射降维89

06 sklearn实现90

0x3 大数据,其大无外93

0x30 太大数据,极生两仪93

0x31 神象住世,Hadoop95

01 Hadoop95

02 HDFS96

03 角色与管理97

04 文件操作98

05 结语100

0x32 分治之美,MapReduce100

01 map与reduce函数100

02 分而治之102

03 Hello,World103

04 Streaming接口105

0x33 Hive基础,蜂巢与仓库106

01 引言106

02 Hive接口107

03 分区建表108

04 分区机制110

05 数据导入/导出111

06 Hive-QL112

07 结语114

0x34 Hive深入,实战经验115

01 排序与分布式115

02 多表插入与mapjoin116

03 加载map-reduce脚本117

04 使用第三方UDF119

05 实战经验120

06 生成唯一ID121

0x35 HBase库,实时业务122

01 理论基础122

02 Shell操作123

03 关联Hive表126

04 数据导入128

05 实用经验130

0x36 SQL与NoSQL,Sqoop为媒130

01 SQL与NoSQL130

02 从MySQL导入HDFS131

03 增量导入134

04 映射到Hive135

05 导入Hive表136

06 从HDFS导出到MySQL137

07 从Hive导出到MySQL138

0x4 数据分析,见微知著141

0x40 大数据分析,鲁班为祖师141

0x41 SQL技能,必备MySQL143

01 SQL工具143

02 基础操作144

03 查询套路145

04 join查询146

05 union与exists149

06 实战经验151

0x42 快刀awk,斩乱数据152

01 快刀152

02 一二三要点152

03 一个示例154

04 应用与统计154

05 斩乱麻156

0x43 Pandas,数据之框157

01 数据为框157

02 加载数据158

03 行列索引159

04 行列操作161

05 合并聚合163

06 迭代数据164

07 结语165

0x44 Zeppelin,一统江湖166

01 心潮澎湃166

02 基本使用168

03 SQL与可视化169

04 安装Zeppelin172

05 配置Zeppelin173

06 数据安全174

07 使用心得176

0x45 数据分组,聚合窗口177

01 MySQL聚合177

02 Spark聚合178

03 非聚合字段179

04 Hive实现180

05 group_concat181

06 Hive窗口函数183

07 DataFrame窗口184

08 结语185

0x46 全栈分析,六层内功186

01 引言186

02 MySQL版本186

03 awk版本187

04 Python版本188

05 Hive版本189

06 map-reduce版本190

07 Spark版本190

08 结语191

0x5 机器学习,人类失控193

0x50 机器学习,琅琊论断193

0x51 酸酸甜甜,Orange195

01 可视化学习195

02 数据探索196

03 模型与评估199

04 组件介绍200

05 与Python进行整合202

06 结语204

0x52 sklearn,机器学习205

01 sklearn介绍205

02 数据预处理206

03 建模与预测207

04 模型评估209

05 模型持久化210

06 三个层次210

0x53 特征转换,量纲伸缩211

01 特征工程211

02 独热编码212

03 sklearn示例213

04 标准化与归一化215

05 sklearn与Spark实现216

06 结语219

0x54 描述统计,基础指标220

01 描述性统计220

02 Pandas实现222

03 方差与协方差223

04 Spark-RDD实现224

05 DataFrame实现226

06 Spark-SQL实现227

07 结语227

0x55 模型评估,交叉验证228

01 测试与训练228

02 评价指标229

03 交叉验证231

04 验证数据232

05 OOB数据233

0x56 文本特征,词袋模型234

01 自然语言234

02 中文分词235

03 词袋模型236

04 词频统计237

05 TF-IDF238

06 结语239

0x6 算法预测,占天卜地241

0x60 命由己做,福自己求241

0x61 近朱者赤,相亲kNN243

01 朴素的思想243

02 算法介绍243

03 分类与回归244

04 k与半径245

05 优化计算246

06 实例应用247

0x62 物以类聚,Kmeans248

01 算法描述248

02 建立模型249

03 理解模型251

04 距离与相似性252

05 降维与可视化253

06 无监督学习255

0x63 很傻很天真,朴素贝叶斯257

01 朴素思想257

02 概率公式257

03 三种实现258

04 sklearn示例260

05 朴素却不傻262

0x64 菩提之树,决策姻缘263

01 缘起263

02 Orange演示264

03 scikit-learn模拟266

04 熵与基尼指数267

05 决策过程分析268

06 Spark模拟270

07 结语271

0x65 随机之美,随机森林271

01 树与森林271

02 处处随机273

03 sklearn示例274

04 MLlib示例275

05 特点与应用276

0x66 自编码器,深度之门277

01 深度学习277

02 特征学习278

03 自动编码器280

04 Keras代码282

05 抗噪编码器283

0x7 Spark,唯快不破285

0x70 人生苦短,快用Spark285

0x71 PySpark之门,强者联盟287

01 全栈框架287

02 环境搭建288

03 分布式部署289

04 示例分析290

05 两类算子292

06 map与reduce293

07 AMPLab的野心294

0x72 RDD算子,计算之魂295

01 算子之道295

02 获取数据296

03 过滤与排序297

04 聚合数据298

05 ioin连接299

06 union与zip300

07 读写文件301

08 结语303

0x73 分布式SQL,蝶恋飞舞304

01 SQL工具304

02 命令行CLI304

03 读Hive数据305

04 将结果写入Hive306

05 读写MySQL数据307

06 读写三种文件308

0x74 DataFrame,三角之恋310

01 DataFrame310

02 生成数据框311

03 合并与ioin313

04 select操作314

05 SQL操作315

06 自定义UDF316

07 三角之恋318

0x75 神器之父,Scala入世319

01 Spark与Scala319

02 Scala REPL320

03 编译Scala321

04 sbt编译322

05 示例分析323

06 编译提交325

0x76 机器之心,ML套路326

01 城市套路深326

02 算法与特征工程327

03 管道工作流328

04 OneHotEncoder示例329

05 ML回归实战331

06 特征处理与算法332

07 拟合与评估334

0x8 数据科学,全栈智慧337

0x80 才高八斗,共分天下337

0x81 自学数据,神蟒领舞339

01 机器学习339

02 语言领域339

03 Python数据生态340

04 相关资料341

05 书籍推荐342

06 性感的职业343

0x82 数据科学,七大技能343

01 七大技能343

02 SQL与NoSQL技能344

03 Linux工具集344

04 Python或者R语言生态345

05 Hadoop与Spark生态345

06 概率、统计与线性代数346

07 机器学习与深度学习346

08 业务及杂项347

09 结语347

0x83 大无所大,生态框架348

01 计算生态348

02 离线计算348

03 交互分析349

04 实时处理350

05 算法挖掘351

06 发行版本352

07 其他工具353

0x84 集体智慧,失控哲学354

01 数据是宝354

02 一分为二355

03 回归统一356

04 聚少成多356

05 你中有我357

06 从小看大358

07 大事化小358

08 少即是多359

0x85 一技之长,一生之用359

01 一技之长359

02 数据分析相关360

03 Python相关360

04 Hadoop相关361

05 Spark相关361

06 模型相关362

07 算法相关362

08 一生之用363

0x86 知识作谱,数据为栈363

01 知识作谱363

02 理论基础363

03 Python/R编程364

04 分析与可视化365

05 大数据365

06 ETL与特征工程366

07 机器学习与深度学习366

08 工具与库367

09 全栈为用367

热门推荐