图书介绍
自然语言处理理论与实战PDF|Epub|txt|kindle电子书版本网盘下载
![自然语言处理理论与实战](https://www.shukui.net/cover/7/31386696.jpg)
- 白宁超,冯暄,唐聃等著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121343902
- 出版时间:2018
- 标注页数:344页
- 文件大小:27MB
- 文件页数:362页
- 主题词:自然语言处理-研究
PDF下载
下载说明
自然语言处理理论与实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 基础入门1
1.1 什么是自然语言处理1
1.1.1 自然语言处理概述1
1.1.2 自然语言处理的发展历史3
1.1.3 自然语言处理的工作原理6
1.1.4 自然语言处理的应用前景7
1.2 开发工具与环境7
1.2.1 Sublime Text和Anaconda介绍7
1.2.2 开发环境的安装与配置8
1.3 实战:第一个小程序的诞生13
1.3.1 实例介绍13
1.3.2 源码实现13
第2章 快速上手Python15
2.1 初识Python编程语言15
2.1.1 Python概述15
2.1.2 Python能做什么17
2.1.3 Python的语法和特点19
2.2 Python进阶24
2.2.1 HelloWorld24
2.2.2 语句和控制流24
2.2.3 函数27
2.2.4 List列表29
2.2.5 元组32
2.2.6 set集合33
2.2.7 字典33
2.2.8 面向对象编程:类34
2.2.9 标准库36
2.3 Python深入——第三方库36
2.3.1 Web框架36
2.3.2 科学计算37
2.3.3 GUI37
2.3.4 其他库37
第3章 线性代数39
3.1 线性代数介绍39
3.2 向量40
3.2.1 向量定义40
3.2.2 向量表示42
3.2.3 向量定理42
3.2.4 向量运算43
3.3 矩阵47
3.3.1 矩阵定义47
3.3.2 矩阵表示48
3.3.3 矩阵运算48
3.3.4 线性方程组51
3.3.5 行列式51
3.3.6 特征值和特征向量55
3.4 距离计算56
3.4.1 余弦距离56
3.4.2 欧氏距离57
3.4.3 曼哈顿距离58
3.4.4 明可夫斯基距离59
3.4.5 切比雪夫距离61
3.4.6 杰卡德距离62
3.4.7 汉明距离63
3.4.8 标准化欧式距离64
3.4.9 皮尔逊相关系数65
第4章 概率论67
4.1 概率论介绍67
4.2 事件68
4.2.1 随机试验68
4.2.2 随机事件和样本空间69
4.2.3 事件的计算70
4.3 概率71
4.4 概率公理73
4.5 条件概率和全概率76
4.5.1 条件概率76
4.5.2 全概率77
4.6 贝叶斯定理78
4.7 信息论79
4.7.1 信息论的基本概念79
4.7.2 信息度量80
第5章 统计学85
5.1 图形可视化85
5.1.1 饼图85
5.1.2 条形图88
5.1.3 热力图91
5.1.4 折线图93
5.1.5 箱线图96
5.1.6 散点图99
5.1.7 雷达图102
5.1.8 仪表盘104
5.1.9 可视化图表用法106
5.2 数据度量标准108
5.2.1 平均值108
5.2.2 中位数108
5.2.3 众数110
5.2.4 期望111
5.2.5 方差112
5.2.6 标准差113
5.2.7 标准分114
5.3 概率分布115
5.3.1 几何分布115
5.3.2 二项分布116
5.3.3 正态分布118
5.3.4 泊松分布121
5.4 统计假设检验123
5.5 相关和回归125
5.5.1 相关125
5.5.2 回归127
5.5.3 相关和回归的联系130
第6章 语言学132
6.1 语音132
6.1.1 什么是语音132
6.1.2 语音的三大属性133
6.1.3 语音单位134
6.1.4 记音符号135
6.1.5 共时语流音变136
6.2 词汇137
6.2.1 什么是词汇137
6.2.2 词汇单位137
6.2.3 词的构造138
6.2.4 词义及其分类140
6.2.5 义项与义素141
6.2.6 语义场142
6.2.7 词汇的构成143
6.3 语法143
6.3.1 什么是语法143
6.3.2 词类144
6.3.3 短语148
6.3.4 单句150
6.3.5 复句152
第7章 自然语言处理155
7.1 自然语言处理的任务和限制155
7.2 自然语言处理的主要技术范畴156
7.2.1 语音合成156
7.2.2 语音识别156
7.2.3 中文自动分词157
7.2.4 词性标注158
7.2.5 句法分析158
7.2.6 文本分类159
7.2.7 文本挖掘160
7.2.8 信息抽取161
7.2.9 问答系统161
7.2.10 机器翻译162
7.2.11 文本情感分析163
7.2.12 自动摘要164
7.2.13 文字蕴涵165
7.3 自然语言处理的难点165
7.3.1 语言环境复杂165
7.3.2 文本结构形式多样166
7.3.3 边界识别限制166
7.3.4 词义消歧167
7.3.5 指代消解168
7.4 自然语言处理展望169
第8章 语料库173
8.1 语料库浅谈173
8.2 语料库深入174
8.3 自然语言处理工具包:NLTK176
8.3.1 NLTK简介176
8.3.2 安装NLTK177
8.3.3 使用NLTK180
8.3.4 在Python NLTK下使用Stanford NLP186
8.4 获取语料库194
8.4.1 国内外著名语料库195
8.4.2 网络数据获取197
8.4.3 NLTK获取语料库200
8.5 综合案例:走进大秦帝国208
8.5.1 数据采集和预处理208
8.5.2 构建本地语料库208
8.5.3 大秦帝国语料操作209
第9章 中文自动分词216
9.1 中文分词简介216
9.2 中文分词的特点和难点218
9.3 常见中文分词方法219
9.4 典型中文分词工具220
9.4.1 HanLP中文分词220
9.4.2 其他中文分词工具223
9.5 结巴中文分词224
9.5.1 基于Python的结巴中文分词224
9.5.2 结巴分词工具详解227
9.5.3 结巴分词核心内容230
9.5.4 结巴分词基本用法233
第10章 数据预处理241
10.1 数据清洗241
10.2 分词处理242
10.3 特征构造242
10.4 特征降维与选择243
10.4.1 特征降维243
10.4.2 特征选择243
10.5 简单实例244
10.6 本章小结249
第11章 马尔可夫模型250
11.1 马尔可夫链250
11.1.1 马尔可夫简介250
11.1.2 马尔可夫链的基本概念251
11.2 隐马尔可夫模型253
11.2.1 形式化描述253
11.2.2 数学形式描述255
11.3 向前算法解决HMM似然度256
11.3.1 向前算法定义256
11.3.2 向前算法原理256
11.3.3 现实应用:预测成都天气的冷热258
11.4 文本序列标注案例:Viterbi算法259
第12章 条件随机场263
12.1 条件随机场介绍263
12.2 简单易懂的条件随机场265
12.2.1 CRF的形式化表示265
12.2.2 CRF的公式化表示266
12.2.3 深度理解条件随机场268
第13章 模型评估269
13.1 从统计角度介绍模型概念269
13.1.1 算法模型269
13.1.2 模型评估和模型选择270
13.1.3 过拟合与欠拟合的模型选择272
13.2 模型评估与选择275
13.2.1 模型评估的概念275
13.2.2 模型评估的评测指标275
13.2.3 以词性标注为例分析模型评估276
13.2.4 模型评估的几种方法278
13.3 ROC曲线比较学习器模型279
第14章 命名实体识别281
14.1 命名实体识别概述281
14.2 命名实体识别的特点与难点284
14.3 命名实体识别方法284
14.4 中文命名实体识别的核心技术286
14.5 展望295
第15章 自然语言处理实战296
15.1 GitHub数据提取与可视化分析296
15.1.1 了解GitHub的API296
15.1.2 使用NetworkX作图299
15.1.3 使用NetworkX构建兴趣图301
15.1.4 NetWorkX部分统计指标304
15.1.5 构建GitHub的兴趣图305
15.1.6 可视化318
15.2 微博话题爬取与存储分析320
15.2.1 数据采集320
15.2.2 数据提取329
15.2.3 数据存储332
15.2.4 项目运行与分析333
附录A Python与其他语言调用337
附录B Git项目上传简易教程339
参考文献341