图书介绍
智能Web算法PDF|Epub|txt|kindle电子书版本网盘下载
- (美)玛若曼尼斯,(美)巴宾寇著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121254567
- 出版时间:2015
- 标注页数:374页
- 文件大小:67MB
- 文件页数:399页
- 主题词:互联网络-程序设计
PDF下载
下载说明
智能Web算法PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
1 什么是智能Web1
1.1 智能Web应用实例3
1.2 智能应用的基本要素4
1.3 什么应用会受益于智能5
1.3.1 社交网络6
1.3.2 Mashup7
1.3.3 门户网站8
1.3.4 维基9
1.3.5 文件分享网站9
1.3.6 网络游戏11
1.4 如何构建智能应用11
1.4.1 检查功能和数据12
1.4.2 获取更多的数据12
1.5 机器学习、数据挖掘及其他16
1.6 智能应用中八个常见的误区17
1.6.1 误区1:数据是可靠的18
1.6.2 误区2:计算能马上完成19
1.6.3 误区3:不用考虑数据规模19
1.6.4 误区4:不考虑解决方案的可扩展性19
1.6.5 误区5:随处使用同样的方法19
1.6.6 误区6:总是能知道计算时间20
1.6.7 误区7:复杂的模型更好20
1.6.8 误区8:存在无偏见的模型20
1.7 小结20
1.8 参考资料21
2 搜索22
2.1 用Lucene实现搜索23
2.1.1 理解Lucene代码24
2.1.2 搜索的基本步骤31
2.2 为什么搜索不仅仅是索引33
2.3 用链接分析改进搜索结果35
2.3.1 PageRank简介35
2.3.2 计算PageRank向量37
2.3.3 alpha:网页间跳转的影响38
2.3.4 理解幂方法40
2.3.5 结合索引分值和PageRank分值45
2.4 根据用户点击改进搜索结果47
2.4.1 用户点击初探48
2.4.2 朴素贝叶斯分类器的使用50
2.4.3 整合Lucene索引、PageRank和用户点击54
2.5 Word、PDF等无链接文档的排序58
2.5.1 DocRank算法简介58
2.5.2 DocRank的原理60
2.6 大规模实现的有关问题65
2.7 用户得到了想要的结果吗?精确度和查全率67
2.8 总结69
2.9 To Do70
2.10 参考资料72
3 推荐系统73
3.1 一个在线音乐商店:基本概念74
3.1.1 距离与相似度的概念75
3.1.2 走近相似度的计算80
3.1.3 什么才是最好的相似度计算公式83
3.2 推荐引擎是怎么工作的84
3.2.1 基于相似用户的推荐85
3.2.2 基于相似条目的推荐94
3.2.3 基于内容的推荐98
3.3 推荐朋友、文章与新闻报道104
3.3.1 MyDiggSpace.com简介105
3.3.2 发现朋友106
3.3.3 DiggDelphi的内部工作机制108
3.4 像Netflix.com那样推荐电影114
3.4.1 电影数据集的介绍及推荐器114
3.4.2 数据标准化与相关系数117
3.5 大规模的实现与评估123
3.6 总结124
3.7 To Do125
3.8 参考资料127
4 聚类:事物的分组128
4.1 聚类的需求129
4.1.1 网站中的用户组:案例研究129
4.1.2 用SQL order by子句分组131
4.1.3 用数组排序分组132
4.2 聚类算法概述135
4.2.1 基于分组结构的聚类算法分类136
4.2.2 基于数据类型和结构的聚类算法分类137
4.2.3 根据数据规模的聚类算法分类137
4.3 基于链接的算法138
4.3.1 树状图:基本的聚类数据结构139
4.3.2 基于链接的算法概况141
4.3.3 单链接算法142
4.3.4 平均链接算法144
4.3.5 最小生成树算法147
4.4 k-means算法149
4.4.1 初识k-means算法150
4.4.2 k-means的内部原理151
4.5 鲁棒的链接型聚类(ROCK)153
4.5.1 ROCK简介154
4.5.2 为什么ROCK这么强大154
4.6 DBSCAN159
4.6.1 基于密度的算法简介159
4.6.2 DBSCAN的原理162
4.7 超大规模数据聚类165
4.7.1 计算复杂性166
4.7.2 高维度167
4.8 总结168
4.9 To Do169
4.10 参考资料171
5 分类:把事物放到它该在的地方172
5.1 对分类的需求173
5.2 分类器的概述177
5.2.1 结构分类算法178
5.2.2 统计分类算法180
5.2.3 分类器的生命周期181
5.3 邮件的自动归类与垃圾邮件过滤182
5.3.1 朴素贝叶斯分类184
5.3.2 基于规则的分类197
5.4 用神经网络做欺诈检测210
5.4.1 交易数据中关于欺诈检测的一个用例210
5.4.2 神经网络概览212
5.4.3 一个可用的神经网络欺诈检测器214
5.4.4 神经网络欺诈检测器剖析218
5.4.5 创建通用神经网络的基类226
5.5 你的结果可信吗232
5.6 大数据集的分类235
5.7 总结237
5.8 To Do239
5.9 参考资料242
6 分类器组合244
6.1 信贷价值:分类器组合案例研究246
6.1.1 数据的简要说明247
6.1.2 为真实问题生成人工数据250
6.2 用单分类器做信用评估255
6.2.1 朴素贝叶斯的基准线255
6.2.2 决策树基准线258
6.2.3 神经网络的基准线260
6.3 在同一个数据集中比较多个分类器263
6.3.1 McNemar检验264
6.3.2 差额比例检验266
6.3.3 Cochran Q检验与F检验268
6.4 bagging: bootstrap聚合(bootstrap aggregating)270
6.4.1 bagging实例272
6.4.2 bagging分类器底层细节274
6.4.3 分类器集成276
6.5 boosting:一种迭代提高的方法279
6.5.1 boosting分类器实例280
6.5.2 boosting分类器底层细节282
6.6 总结286
6.7 To Do288
6.8 参考资料292
7 智能技术大汇集:一个智能新闻门户293
7.1 功能概览295
7.2 获取并清洗内容296
7.2.1 各就各位——预备——开抓!296
7.2.2 搜索预备知识回顾298
7.2.3 一个抓取并处理好的新闻数据集299
7.3 搜索新闻301
7.4 分配新闻类别304
7.4.1 顺序问题304
7.4.2 使用NewsProcessor类进行分类309
7.4.3 分类器310
7.4.4 分类策略:超越底层的分类313
7.5 用NewsProcessor类创建新闻分组316
7.5.1 聚类全部文章317
7.5.2 在一个新闻类别中聚类文章321
7.6 基于用户评分的动态内容展示325
7.7 总结328
7.8 To Do329
7.9 参考资料333
附录A BeanShell简介334
A.1 什么是BeanShell334
A.2 为什么使用BeanShell335
A.3 运行BeanShell335
A.4 参考资料336
附录B 网络采集337
B.1 爬虫组件概况337
B.1.1 采集的步骤338
B.1.2 我们的简单爬虫338
B.1.3 开源Web爬虫339
B.2 参考资料340
附录C 数学知识回顾341
C.1 向量和矩阵341
C.2 距离的度量342
C.3 高级矩阵方法344
C.4 参考资料344
附录D 自然语言处理345
D.1 参考资料347
附录E 神经网络348
E.1 参考资料349
索引350