图书介绍
OpenCL异构计算PDF|Epub|txt|kindle电子书版本网盘下载
- (美)贾斯特著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302286851
- 出版时间:2012
- 标注页数:277页
- 文件大小:71MB
- 文件页数:298页
- 主题词:图形软件
PDF下载
下载说明
OpenCL异构计算PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 并行编程入门1
引言1
OpenCL1
本书目标2
并行思维2
并发编程模型和并行编程模型6
线程和共享内存9
消息传递通信9
不同的并行粒度10
数据共享和同步11
本书结构11
参考文献12
扩展阅读和相关网站13
第2章OpenCL简介15
引言15
OpenCL标准15
OpenCL规范15
kemel和OpenCL执行模型16
平台和设备19
主机-设备交互19
执行环境21
上下文22
命令队列22
事件23
内存对象23
flush命令和finish命令26
新建一个OpenCL程序对象26
OpenCL的kernel27
内存模型29
编写kemel31
向量相加实例的完整代码32
小结39
参考文献39
第3章OpenCL设备架构41
引言41
硬件权衡41
性能随频率的提升及其限制43
超标量执行44
VLIW44
SIMD和向量处理47
硬件多线程48
多核架构51
集成:片上系统和APU53
高速缓存层次和内存系统54
架构设计空间55
CPU设计56
GPU体系结构60
APU和类APU的设计63
小结64
参考文献65
第4章OpenCL基本实例67
引言67
应用实例67
简单的矩阵相乘67
图像卷积实例77
小结85
第5章OpenCL的并发与执行模型87
引言87
kernel, work_item, workgroup和执行域87
OpenCL同步:kernel, fence和barrier90
队列与全局同步94
OpenCL内存一致性96
事件96
命令barrier与marker108
主机端内存模型109
buffer对象110
image刘象113
设备端内存模型115
设备端宽松的内存一致性116
全局内存117
本地内存119
常量内存121
私有内存122
小结122
第6章OpenCL在CPU/GPU平台上的实现123
引言123
OpenCL在AMD PHENOM Ⅱ X6上的实现123
OpenCL在AMD RADEON HD6970 GPU上的实现128
多线程和内存系统130
基于clause的SIMD执行132
资源分配137
OpenCL的内存性能139
OpenCL全局内存139
本地内存——软件管理的cache142
小结148
参考文献149
第7章OpenCL案例学习1:卷积151
引言151
计算卷积的kernel151
选择合适的workgroup大小151
将数据缓存到本地内存154
执行卷积160
小结161
代码清单162
主机端代码162
kernel代码166
参考文献171
第8章OpenCL案例学习2:视频处理173
引言173
获得视频帧173
CPU上的解码174
在GPU上解码视频175
在OpenCL中处理一个视频179
在多个视频上处理多个不同effect180
事件链180
最终输出显示到屏幕181
OpenCL/OpenGL协同工作能力181
小结184
第9章OpenCL案例学习3:直方图185
引言185
选择适量的work-group185
选择最优的work-group大小186
全局内存访存优化187
使用原子操作计算局部直方图189
本地内存访存优化190
局部直方图的规约192
全局规约193
完整的kernel代码193
性能和小结196
第10章OpenCL案例学习4:混合粒子模拟197
引言197
计算概览197
GPU实现200
创建buffer200
构造加速结构201
计算碰撞201
合成202
CPU实现202
负载均衡203
性能和小结204
生成均匀网格的kernel代码205
粒子模拟的kernel代码206
第11章OpenCL扩展211
引言211
扩展机制概览211
设备拆分214
双精度225
参考文献233
第12章OpenCL的性能剖析和调试235
引言235
基于事件的剖析236
AMD APP Profiler238
收集OpenCL程序轨迹239
收集OpenCL GPU Kernel性能计数器242
AMD APP KernelAnalyzer243
演示AMD APP Profiler245
启动AMD APP Profiler245
使用应用程序的轨迹数据以发现性能瓶颈245
使用GPU性能计数器发现kernel的性能瓶颈247
调试OpenCL应用程序248
gDEBugger概览249
使用gDEBugger调试并行OpenCL应用程序249
AMD printf扩展251
小结253
第13章WebCL255
引言255
框架设计256
WebCL实验性实现257
Firefox扩展257
连接JavaScript和OpenCL258
WebCL动手练习260
Web照片编辑器264
讨论266
小结268
参考文献268
扩展阅读和相关网站269
索引271