图书介绍
套路 机器学习 北美数据科学家的私房课PDF|Epub|txt|kindle电子书版本网盘下载
- 林荟著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121326585
- 出版时间:2017
- 标注页数:316页
- 文件大小:54MB
- 文件页数:334页
- 主题词:数据管理
PDF下载
下载说明
套路 机器学习 北美数据科学家的私房课PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 白话数据科学1
1.1 什么是数据科学3
1.2 什么是数据科学家5
1.2.1 数据科学家需要的技能6
1.2.2 数据科学算法总结10
1.3 数据科学可以解决什么问题20
1.3.1 前提要求20
1.3.2 问题种类22
1.4 小结25
第2章 数据集26
2.1 服装消费者数据26
2.2 航空公司满意度调查33
2.3 生猪疫情风险预测数据37
第3章 数据分析流程41
3.1 从问题到数据42
3.2 从数据到信息44
3.3 从信息到行动46
第4章 数据预处理47
4.1 介绍47
4.2 数据清理50
4.3 缺失值填补52
4.3.1 中位数或众数填补53
4.3.2 K-近邻填补54
4.3.3 装袋树填补56
4.4 中心化和标量化56
4.5 有偏分布59
4.6 处理离群点63
4.7 共线性66
4.8 稀疏变量70
4.9 编码名义变量71
4.10 小结73
第5章 数据操作75
5.1 数据读写76
5.1.1 取代传统数据框的tibble对象76
5.1.2 高效数据读写:readr包80
5.1.3 数据表对象读取83
5.2 数据整合91
5.2.1 base包:apply()91
5.2.2 plyr包:ddply()函数93
5.2.3 dplyr包96
5.3 数据整形102
5.3.1 reshape2包102
5.3.2 tidyr包105
5.4 小结107
第6章 基础建模技术109
6.1 有监督和无监督109
6.2 误差及其来源111
6.2.1 系统误差和随机误差111
6.2.2 因变量误差117
6.2.3 自变量误差121
6.3 数据划分和再抽样122
6.3.1 划分训练集和测试集123
6.3.2 重抽样131
6.4 小结135
第7章 模型评估度量136
7.1 回归模型评估度量136
7.2 分类模型评估度量139
7.2.1 Kappa统计量141
7.2.2 ROC曲线143
7.2.3 提升图145
7.3 小结146
第8章 特征工程148
8.1 特征构建149
8.2 特征提取152
8.2.1 初步探索特征153
8.2.2 主成分分析158
8.2.3 探索性因子分析163
8.2.4 高维标度化167
8.2.5 知识扩展:3种降维特征提取方法的理论171
8.3 特征选择177
8.3.1 过滤法178
8.3.2 绕封法188
8.4 小结195
第9章 线性回归及其衍生196
9.1 普通线性回归197
9.1.1 最小二乘线性模型197
9.1.2 回归诊断201
9.1.3 离群点、高杠杆点和强影响点203
9.2 收缩方法205
9.2.1 岭回归205
9.2.2 Lasso209
9.2.3 弹性网络212
9.3 知识扩展:Lasso的变量选择功能213
9.4 主成分和偏最小二乘回归214
9.5 小结221
第10章 广义线性模型压缩方法222
10.1 初识glmnet223
10.2 收缩线性回归227
10.3 逻辑回归235
10.3.1 普通逻辑回归235
10.3.2 收缩逻辑回归236
10.3.3 知识扩展:群组Lasso逻辑回归239
10.4 收缩多项回归243
10.5 泊松收缩回归246
10.6 小结249
第11章 树模型250
11.1 分裂准则252
11.2 树的修剪256
11.3 回归树和决策树260
11.4 装袋树268
11.5 随机森林273
11.6 助推法277
11.7 知识扩展:助推法的可加模型框架283
11.8 知识扩展:助推树的数学框架286
11.8.1 数学表达286
11.8.2 梯度助推数值优化289
11.9 小结290
第12章 神经网络292
12.1 投影寻踪回归(Projection Pursuit Regression)293
12.2 神经网络(Neural Networks)296
12.3 神经网络拟合299
12.4 训练神经网络300
12.5 用caret包训练神经网络302
12.6 小结311
参考文献312