图书介绍
半结构化数据管理关键算法研究与实证PDF|Epub|txt|kindle电子书版本网盘下载
- 张引著 著
- 出版社: 北京:中国社会科学出版社
- ISBN:9787520325059
- 出版时间:2018
- 标注页数:212页
- 文件大小:23MB
- 文件页数:224页
- 主题词:数据结构;算法分析
PDF下载
下载说明
半结构化数据管理关键算法研究与实证PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一章 半结构化数据的应用背景1
第一节 研究背景2
第二节 研究内容及意义6
一 研究内容6
二 研究意义8
第三节 本书结构9
第二章 半结构化数据的基础知识12
第一节 半结构化数据的结构特征12
第二节 半结构化数据的结构模型15
第三节 半结构化数据的模式语言16
第四节 半结构化数据的查询语言17
第五节 半结构化数据的应用程序接口19
第三章 半结构化数据的管理模型22
第一节 半结构化数据模式提取的相关研究23
第二节 半结构化数据节点编码的相关研究26
第三节 半结构化数据索引的相关研究27
第四节 半结构化数据查询处理的相关研究30
第四章 半结构化数据的模式提取33
第一节 半结构化数据的元素内容模型34
一 半结构化数据的树状结构模型34
二 半结构化数据的元素内容模型36
三 提取大规模半结构化数据模式的质量标准38
第二节 基于正则表达式的模式提取方法39
一 元素内容模型的正则表示39
二 XStruct算法简介42
三 XStruct算法的优缺点46
第三节 基于集合/序列的模式提取方法——XTree48
一 XTree算法的组成48
二 基于集合/序列的元素内容模型50
三 XTree的数据结构51
四 提取元素内容模型55
五 识别数据类型57
六 提取属性58
七 输出模式59
第四节 实证研究59
一 XTree的算法的时间和空间复杂度分析60
二 元素内容模型的有序性判断对模式准确性的影响61
三 实验环境及测试工具63
四 测试数据集64
五 提取不同文档的模式的时间和内存消耗以及准确性67
六 XTree算法提取同结构的不同大小的数据模式的时间消耗71
第五节 小结72
第五章 半结构化数据的节点编码75
第一节 半结构化数据节点编码的特点76
一 半结构化数据节点编码的质量评价标准76
二 基于区间的节点编码方案77
三 基于前缀的节点编码方案82
四 ORDPATH编码方案85
第二节 D2编码方案89
一 D2编码方案的基本概念89
二 静态D2编码92
三 动态D2编码94
第三节 D2编码的二进制表示95
一 D2编码的二进制表示96
二 D2物理编码的比较102
第四节 实证研究106
一 D2物理编码长度分析106
二 D2物理编码长度实验107
第五节 小结109
第六章 半结构化数据的索引和查询处理111
第一节 D2-Index索引策略112
一 主索引112
二 辅助索引117
三 索引的动态更新123
第二节 基于D2-Index索引策略的查询处理130
一 查询语言130
二 查询器133
第三节 实证研究137
第四节 小结140
第七章 半结构化数据与大数据143
第一节 大数据时代来临143
第二节 大数据基础146
一 大数据的定义146
二 传统数据分析方法149
三 大数据分析方法151
四 大数据分析模式153
五 大数据分析工具154
第三节 大数据应用157
一 应用演化157
二 大数据分析的关键领域159
三 大数据的典型应用170
四 大数据的研究现状及发展趋势177
第八章 总结187
第一节 主要内容187
第二节 未来研究展望189
一 大规模半结构化数据模式的更新189
二 大规模半结构化数据的信息检索190
三 分布式半结构化数据的管理190
参考文献191