图书介绍

自然语言处理综论PDF|Epub|txt|kindle电子书版本网盘下载

自然语言处理综论
  • (美)Daniel Jurafsky,(美)James H.Martin著;冯志伟,孙乐译 著
  • 出版社: 北京:电子工业出版社
  • ISBN:7121007762
  • 出版时间:2005
  • 标注页数:588页
  • 文件大小:39MB
  • 文件页数:613页
  • 主题词:自然语言处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

自然语言处理综论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

1.1 语音与语言处理中的知识1

第1章 导论1

1.2 歧义3

1.3 模型和算法4

1.4 语言、思维和理解4

1.5 学科现状与近期发展6

1.6 语音和语言处理简史7

1.6.1 基础研究:20世纪40年代和20世纪50年代7

1.6.2 两个阵营:1957年至1970年8

1.6.3 四个范型:1970年至1983年8

1.6.5 不同领域的合流:1994年至1999年9

1.6.4 经验主义和有限状态模型的复苏:1983年至1993年9

1.6.6 多重发现10

1.6.7 心理学的简要注记10

1.7 小结11

1.8 文献和历史说明11

第一部分 词汇的计算机处理13

第2章 正则表达式与自动机14

2.1 正则表达式14

2.1.1 基本正则表达式模式15

2.1.2 析取、组合与优先关系18

2.1.3 一个简单的例子18

2.1.4 一个比较复杂的例子19

2.1.5 高级算符20

2.1.6 正则表达式中的替换、存储器与ELIZA21

2.2 有限状态自动机22

2.2.1 用FSA来识别羊的语言22

2.2.2 形式语言25

2.2.3 另外的例子26

2.2.4 非确定FSA27

2.2.5 使用NFSA接收符号串28

2.2.6 识别就是搜索31

2.2.7 确定自动机与非确定自动机的关系32

2.3 正则语言与FSA33

2.4 小结34

2.5 文献和历史说明35

第3章 形态学与有限状态转录机36

3.1 英语形态学概观37

3.1.1 屈折形态学38

3.1.2 派生形态学40

3.2 有限状态形态剖析41

3.2.1 词表和形态顺序规则41

3.2.2 用有限状态转录机进行形态剖析44

3.2.3 正词法规则和有限状态转录机48

3.3 把FST词表与规则相结合50

3.4 与词表无关的FST:PORTER词干处理器52

3.5 人是怎样进行形态处理的53

3.6 小结54

3.7 文献和历史说明54

第4章 计算音系学与文本-语音转换56

4.1 言语语音与语音标音法57

4.1.1 发音器官58

4.1.2 辅音:发音部位60

4.1.3 辅音:发音方法61

4.1.4 元音62

4.1.5 音节63

4.2 音位和音位规则64

4.3 音位规则和转录机65

4.4 计算音系学中的一些高级问题68

4.4.1 元音和谐68

4.4.2 模板式形态学70

4.4.3 优选理论70

4.5 音位规则的机器学习74

4.6 TTS中从文本映射到语音75

4.6.1 发音词典75

4.6.2 词典之外的查找:文本分析77

4.6.3 基于有限状态转录机(FST)的发音词典79

4.7.1 韵律的音系学性质82

4.7 文本-语音转换中的韵律82

4.7.2 韵律的语音和声学性质83

4.7.3 语音合成中的韵律83

4.8 人处理音位和形态的过程84

4.9 小结85

4.10 文献和历史说明85

第5章 发音与拼写的概率模型87

5.1 关于拼写错误88

5.2 拼写错误模式89

5.3 非词错误的检查90

5.4 概率模型90

5.5 把贝叶斯方法应用于拼写92

5.6 最小编辑距离95

5.7 英语的发音变异97

5.8 发音问题研究中的贝叶斯方法101

5.8.1 发音变异的决策树模型104

5.9 加权自动机105

5.9.1 从加权自动机计算似然度:向前算法106

5.9.2 解码:Viterbi算法109

5.9.3 加权自动机和切分112

5.9.4 用切分来进行词表的自动归纳113

5.10 人类发音研究114

5.11 小结116

5.12 文献和历史说明116

第6章 N元语法118

6.1 语料库中单词数目的计算119

6.2 简单的(非平滑的)N元语法121

6.2.1 N元语法及其对训练语料库的敏感性126

6.3 平滑128

6.3.1 加1平滑129

6.3.2 Witten-Bell打折法131

6.3.3 Good-Turing打折法134

6.4 回退135

6.4.1 回退与打折相结合136

6.5 删除插值法137

6.6.1 上下文有关的错拼更正138

6.6 拼写和发音的N元语法138

6.6.2 发音模型的N元语法139

6.7 熵140

6.7.1 用于比较模型的交叉熵142

6.7.2 英语的熵143

6.8 小结144

6.9 文献和历史说明144

第7章 HMM与语音识别146

7.1 语音识别的总体结构147

7.2 隐马尔可夫模型概述150

7.3 再谈Viterbi算法152

7.4 先进的解码方法157

7.4.1 A*解码算法158

7.5 语音的声学处理162

7.5.1 声波162

7.5.2 怎样解释波形163

7.5.3 声谱163

7.5.4 特征抽取166

7.6 声学概率的计算166

7.7 语音识别系统的训练169

7.8 用于语音合成的波形生成171

7.8.1 音高和音延的修正171

7.8.2 单元选择172

7.9 人的语音识别173

7.10 小结174

7.11 文献和历史说明175

第二部分 句法的计算机处理177

第8章 词的分类与词类标注178

8.1 大多数英语词的分类179

8.2 英语的标记集185

8.3 词类标注186

8.4 基于规则的词类标注187

8.5 随机词类标注189

8.5.1 说明问题的一个例子190

8.5.2 实际的HMM标注算法191

8.6 基于转换的标注193

8.6.1 怎样应用TBL规则193

8.6.2 怎样学习TBL规则194

8.7 其他问题196

8.7.1 多重标记和多项词196

8.7.2 未知词197

8.7.3 基于类的N元语法197

8.8 小结198

8.9 文献和历史说明199

第9章 英语的上下文无关语法201

9.1 组成性202

9.2 上下文无关规则和树203

9.3 句子级的结构207

9.4 名词短语209

9.4.1 在中心名词前的成分209

9.4.2 名词后的成分210

9.5 并列关系212

9.6 一致关系212

9.7 动词短语和次范畴化214

9.8 助动词216

9.9 口语的句法216

9.9.1 不流畅现象217

9.11 有限状态语法和上下文无关语法218

9.10 语法等价与范式218

9.12 语法和人的语言处理219

9.13 小结220

9.14 文献和历史说明221

第10章 基于上下文无关语法的剖析223

10.1 剖析就是搜索224

10.1.1 自顶向下剖析225

10.1.2 自底向上剖析225

10.1.3 自顶向下剖析与自底向上剖析的对比227

10.2 基本的自顶向下剖析227

10.2.1 增加自底向上过滤230

10.3.1 左递归232

10.3 基本的自顶向下剖析的问题232

10.3.2 歧义233

10.3.3 子树的重复剖析236

10.4 Earley算法238

10.4.1 预测240

10.4.2 扫描240

10.4.3 完成240

10.4.4 示例240

10.4.5 从线图中检索剖析树242

10.5 有限状态剖析方法243

10.7 文献和历史说明246

10.6 小结246

第11章 特征与合一248

11.1 特征结构249

11.2 特征结构的合一251

11.3 语法中的特征结构255

11.3.1 一致关系256

11.3.2 中心语特征258

11.3.3 次范畴化259

11.3.4 其他词类的次范畴化262

11.3.5 长距离依存关系263

11.4.1 合一的数据结构264

11.4 合一的实现264

11.4.2 合一算法266

11.5 带有合一约束的剖析270

11.5.1 把合一结合到Earley剖析器中270

11.5.2 复制的必要性274

11.5.3 合一剖析275

11.6 类型与继承277

11.6.1 类型的扩充279

11.6.2 合一的其他扩充280

11.7 小结280

11.8 文献和历史说明280

第12章 词汇化剖析与概率剖析282

12.1 概率上下文无关语法283

12.1.1 PCFG的概率CYK剖析286

12.1.2 PCFG概率的学习287

12.2 PCFG的问题288

12.3 概率词汇化的CFG289

12.4 依存语法293

12.4.1 范畴语法295

12.5 人的剖析295

12.6 小结300

12.7 文献和历史说明300

第13章 语言的复杂性302

13.1 Chomsky层级303

13.2 怎么判断一种语言不是正则的304

13.2.1 抽吸引理305

13.2.2 英语和其他自然语言是正则语言吗307

13.3 自然语言是上下文无关的吗309

13.4 计算复杂性和人的语言处理311

13.5 小结314

13.6 文献和历史说明315

第三部分 语义的计算机处理317

第14章 意义的表示法318

14.1 意义表示的计算要求319

14.1.2 无歧义表示320

14.1.1 可能性验证320

14.1.3 规范形式321

14.1.4 推论与变元322

14.1.5 表达能力323

14.2 语言的意义结构323

14.2.1 谓词论元结构323

14.3 一阶谓词演算324

14.3.1 FOPC基础325

14.3.2 FOPC的语义326

14.3.3 变量和逻辑量词327

14.3.4 推论329

14.4 某些与语言学相关的概念330

14.4.1 范畴330

14.4.2 事件331

14.4.3 时间表示333

14.4.4 体336

14.4.5 信念表示338

14.4.6 缺陷340

14.5 有关的表示方法341

14.6 意义的其他表示方法341

14.6.1 作为行动的意义341

14.7 小结342

14.6.2 作为真值的意义342

14.8 文献和历史说明343

第15章 语义分析344

15.1 句法驱动的语义分析344

15.1.1 给上下文无关语法规则扩充语义346

15.1.2 量词辖域和复杂项的转译351

15.2 给英语片断附加语义分析352

15.2.1 句子352

15.2.2 名词短语353

15.2.3 动词短语355

15.2.4 介词短语357

15.3 把语义分析结合到Earley剖析中359

15.4 惯用语和组成性360

15.5 鲁棒的语义分析361

15.5.1 语义语法361

15.5.2 信息抽取363

15.6 小结367

15.7 文献和历史说明368

第16章 词汇语义学370

16.1 词位及其涵义之间的关系371

16.1.1 同形关系371

16.1.2 多义关系373

16.1.3 同义关系375

16.1.4 上下位关系376

16.2 WORDNET:词汇关系信息库377

16.3 词的内在结构380

16.3.1 题元角色380

16.3.2 选择限制385

16.3.3 基元分解388

16.3.4 语义场390

16.4 语言的创造性与词典391

16.4.1 隐喻391

16.4.2 换喻392

16.4.3 隐喻和换喻的计算方法392

16.5 小结392

16.6 文献和历史说明393

第17章 词义排歧与信息检索394

17.1 基于选择限制的排歧394

17.1.1 选择限制的局限性395

17.2 鲁棒的词义排歧396

17.2.1 机器学习方法397

17.2.2 基于词典的方法402

17.3 信息检索403

17.3.1 向量空间模型403

17.3.2 检索词加权405

17.3.3 检索词的选择和创造407

17.3.5 改进用户的查询条件408

17.3.4 同形关系、多义关系和同义关系408

17.4 信息检索的其他任务409

17.5 小结410

17.6 文献和历史说明411

第四部分 语用的计算机处理413

第18章 话语414

18.1 所指判定415

18.1.1 所指现象417

18.1.2 同指的句法和语义约束419

18.1.3 代词解释中的优先关系422

18.1.4 代词判定算法423

18.2.1 现象430

18.2 文本的连贯430

18.2.2 基于推理的判定算法431

18.3 话语结构436

18.4 所指和连贯的心理语言学研究438

18.5 小结441

18.6 文献和历史说明441

第19章 对话与会话智能代理443

19.1 什么使对话出现差别444

19.1.1 话轮和话段444

19.1.2 对话的共同基础446

19.1.3 会话隐涵447

19.2 对话行为448

19.3 对话行为的自动解释451

19.3.1 对话行为的计划推理解释452

19.3.2 对话行为的基于提示的解释456

19.3.3 要点460

19.4 对话结构与连贯性460

19.5 会话智能代理中的对话管理464

19.6 小结468

19.7 文献和历史说明469

第20章 自然语言生成471

20.1 语言生成导引472

20.2 生成的体系结构473

20.3 表层实现474

20.3.1 系统语法474

20.3.2 功能合一语法477

20.3.3 要点481

20.4 话语规划481

20.4.1 文本说明图481

20.4.2 修辞关系483

20.4.3 小结487

20.5 其他问题487

20.5.1 微规划487

20.5.4 语音生成488

20.5.3 生成系统评价488

20.5.2 词汇选择488

20.6 小结489

20.7 文献和历史说明489

第21章 机器翻译492

21.1 语言的相似性和差异性494

21.2 转换模型497

21.2.1 句法转换498

21.2.2 词汇转换499

21.3 中间语的思想:使用意义500

21.4 直接转换502

21.5 使用统计技术504

21.5.2 忠实性的量化505

21.5.1 流畅性的量化505

21.5.3 输出的搜索506

21.6 可用性与系统开发506

21.7 小结508

21.8 文献和历史说明508

附录A 正则表达式的算符510

附录B PORTER STEMMING算法511

附录C 标记集C5和C7514

附录D HMM模型的训练:向前-向后算法519

参考文献525

术语表577

热门推荐