图书介绍
信息检索 算法与启发式方法 第2版PDF|Epub|txt|kindle电子书版本网盘下载
![信息检索 算法与启发式方法 第2版](https://www.shukui.net/cover/17/30276943.jpg)
- (美)格罗斯曼,(美)弗里德著 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115235756
- 出版时间:2010
- 标注页数:232页
- 文件大小:27MB
- 文件页数:245页
- 主题词:情报检索
PDF下载
下载说明
信息检索 算法与启发式方法 第2版PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 引言1
第2章 检索模型与算法7
2.1 向量空间模型8
2.1.1 相似度计算举例11
2.1.2 相似度13
2.2 概率检索模型14
2.2.1 简单的词项权重15
2.2.2 非二值独立模型24
2.2.3 泊松模型25
2.2.4 文档片段29
2.2.5 概率模型的关键问题30
2.3 语言模型32
2.3.1 平滑33
2.3.2 语言模型举例34
2.4 推理网络40
2.4.1 相关背景41
2.4.2 链接矩阵42
2.4.3 相关性排序44
2.4.4 推理网络实例45
2.5 扩展布尔检索47
2.5.1 引入查询权重48
2.5.2 扩展为任意数量的查询词48
2.5.3 自动插入布尔逻辑49
2.6 LSI49
2.6.1 LSI举例50
2.6.2 选择较优的k值52
2.6.3 与其他检索模型比较52
2.6.4 可能的扩展52
2.6.5 运行时性能52
2.7 神经网络52
2.7.1 向量空间53
2.7.2 相关反馈53
2.7.3 学习与调整54
2.7.4 概率检索54
2.7.5 基于片段的概率检索55
2.7.6 联合权重55
2.7.7 文档聚类56
2.8 遗传算法56
2.8.1 文档表示形式58
2.8.2 查询权重的自动赋值58
2.8.3 自动生成带权重的布尔查询59
2.9 模糊集检索59
2.9.1 布尔检索60
2.9.2 使用概念层次62
2.9.3 采用区间和提升效率62
2.10 本章小结63
2.11 练习题64
第3章 检索实用策略65
3.1 相关反馈66
3.1.1 基于向量空间模型的相关反馈67
3.1.2 基于概率模型的相关反馈68
3.2 聚类73
3.2.1 结果集聚类74
3.2.2 层次聚类74
3.2.3 不采用预定义矩阵的聚类方法75
3.2.4 在层次聚类结果中进行查询77
3.2.5 效率方面77
3.3 基于段落的检索78
3.3.1 基于标记的段落划分方法78
3.3.2 动态段落划分方法79
3.3.3 合并基于段落的相似度79
3.4 n元语法80
3.4.1 D'Amore与Mah方法80
3.4.2 Damashek算法81
3.4.3 Pearce与Nicholas方法81
3.4.4 Teufel81
3.4.5 Cavnar和Vayda82
3.5 回归分析82
3.6 同义词表84
3.6.1 自动构建同义词表84
3.6.2 使用人工构建的同义词表90
3.7 语义网络91
3.7.1 距离计算方法92
3.7.2 基于“概念”扩展查询词95
3.7.3 基于约束激活扩散的排序95
3.8 语言解析96
3.8.1 单个词96
3.8.2 简单短语97
3.8.3 复杂短语97
3.9 本章小结100
3.10 练习100
第4章 CLIR102
4.1 简介102
4.1.1 资源102
4.1.2 评测103
4.2 跨越语言障碍103
4.2.1 查询翻译104
4.2.2 文档翻译105
4.2.3 短语翻译105
4.2.4 译文的选择105
4.2.5 翻译删减技术107
4.3 跨语言检索模型与算法107
4.3.1 CLIR中的语言模型107
4.3.2 双语语料库方法112
4.3.3 可比语料库方法113
4.4 跨语言检索实用策略117
4.4.1 跨语言检索的相关反馈117
4.4.2 词干还原118
4.4.3 n元语法模型120
4.4.4 音译名120
4.4.5 命名实体识别121
4.4.6 检索融合122
4.5 本章小结122
4.6 练习题123
第5章 检索效率优化124
5.1 倒排索引124
5.1.1 构建倒排索引126
5.1.2 压缩倒排索引127
5.1.3 变长索引压缩129
5.1.4 基于倒排表大小的变长压缩130
5.1.5 索引剪枝132
5.1.6 在构建索引前对文档重新排序132
5.2 查询处理133
5.2.1 倒排索引的修订133
5.2.2 部分结果集检索134
5.2.3 简化向量空间135
5.3 签名文件136
5.4 重复文档检测138
5.4.1 精确重复检测139
5.4.2 近似重复检测139
5.5 本章小结141
5.6 练习题142
第6章 结构化数据与文本的融合143
6.1 关系模型回顾145
6.2 相关工作进展150
6.2.1 独立系统的融合150
6.2.2 自定义运算符151
6.2.3 NFN方法152
6.2.4 使用标准SQL进行文献搜索153
6.3 信息检索作为关系应用153
6.3.1 预处理155
6.3.2 实施案例156
6.3.3 布尔检索158
6.3.4 邻近搜索161
6.3.5 使用标准SQL计算相关度162
6.3.6 相关反馈在关系模型中的实现164
6.3.7 关系信息检索系统164
6.4 使用关系模式进行半结构化搜索165
6.4.1 背景165
6.4.2 使用静态关系模式支持XML-QL165
6.4.3 存储XML元数据166
6.4.4 跟踪XML文档167
6.4.5 INDEX关系167
6.5 多维数据模型168
6.6 协同器168
6.6.1 因特网协同器168
6.6.2 内联网协同器169
6.7 本章小结171
6.8 练习题171
第7章 并行信息检索172
7.1 并行文本扫描搜索172
7.1.1 文本硬件扫描173
7.1.2 并行签名文件174
7.2 并行索引176
7.2.1 在连接机上实现并行索引176
7.2.2 连接机的倒排索引178
7.2.3 在DAP上实现并行索引179
7.2.4 并行索引划分179
7.2.5 在CM-5机上实现并行倒排索引算法180
7.2.6 在倒排表上执行布尔操作180
7.2.7 作为RDBMS应用的并行检索180
7.2.8 并行索引小结181
7.3 聚类与分类181
7.4 大型的并行信息检索系统182
7.4.1 PADRE182
7.4.2 并行信息检索框架182
7.4.3 PLIERS182
7.5 本章小结183
7.6 练习题184
第8章 分布式信息检索185
8.1 分布式检索的理论模型186
8.1.1 集中式信息检索系统模型186
8.1.2 分布式信息检索系统模型187
8.2 Web搜索189
8.2.1 Web搜索引擎评测189
8.2.2 高准确率检索189
8.2.3 查询日志分析190
8.2.4 PageRank算法190
8.2.5 Web搜索引擎的效果提升191
8.3 结果融合191
8.4 P2P信息系统192
8.5 其他的体系结构194
8.5.1 共享磁盘体系结构195
8.5.2 分布式磁盘体系结构195
8.6 本章小结195
8.7 练习题195
第9章 总结与下一步研究方向197
参考文献203
索引229