图书介绍

OpenCL异构计算PDF|Epub|txt|kindle电子书版本网盘下载

OpenCL异构计算
  • (美)贾斯特著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302286851
  • 出版时间:2012
  • 标注页数:277页
  • 文件大小:71MB
  • 文件页数:298页
  • 主题词:图形软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

OpenCL异构计算PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 并行编程入门1

引言1

OpenCL1

本书目标2

并行思维2

并发编程模型和并行编程模型6

线程和共享内存9

消息传递通信9

不同的并行粒度10

数据共享和同步11

本书结构11

参考文献12

扩展阅读和相关网站13

第2章OpenCL简介15

引言15

OpenCL标准15

OpenCL规范15

kemel和OpenCL执行模型16

平台和设备19

主机-设备交互19

执行环境21

上下文22

命令队列22

事件23

内存对象23

flush命令和finish命令26

新建一个OpenCL程序对象26

OpenCL的kernel27

内存模型29

编写kemel31

向量相加实例的完整代码32

小结39

参考文献39

第3章OpenCL设备架构41

引言41

硬件权衡41

性能随频率的提升及其限制43

超标量执行44

VLIW44

SIMD和向量处理47

硬件多线程48

多核架构51

集成:片上系统和APU53

高速缓存层次和内存系统54

架构设计空间55

CPU设计56

GPU体系结构60

APU和类APU的设计63

小结64

参考文献65

第4章OpenCL基本实例67

引言67

应用实例67

简单的矩阵相乘67

图像卷积实例77

小结85

第5章OpenCL的并发与执行模型87

引言87

kernel, work_item, workgroup和执行域87

OpenCL同步:kernel, fence和barrier90

队列与全局同步94

OpenCL内存一致性96

事件96

命令barrier与marker108

主机端内存模型109

buffer对象110

image刘象113

设备端内存模型115

设备端宽松的内存一致性116

全局内存117

本地内存119

常量内存121

私有内存122

小结122

第6章OpenCL在CPU/GPU平台上的实现123

引言123

OpenCL在AMD PHENOM Ⅱ X6上的实现123

OpenCL在AMD RADEON HD6970 GPU上的实现128

多线程和内存系统130

基于clause的SIMD执行132

资源分配137

OpenCL的内存性能139

OpenCL全局内存139

本地内存——软件管理的cache142

小结148

参考文献149

第7章OpenCL案例学习1:卷积151

引言151

计算卷积的kernel151

选择合适的workgroup大小151

将数据缓存到本地内存154

执行卷积160

小结161

代码清单162

主机端代码162

kernel代码166

参考文献171

第8章OpenCL案例学习2:视频处理173

引言173

获得视频帧173

CPU上的解码174

在GPU上解码视频175

在OpenCL中处理一个视频179

在多个视频上处理多个不同effect180

事件链180

最终输出显示到屏幕181

OpenCL/OpenGL协同工作能力181

小结184

第9章OpenCL案例学习3:直方图185

引言185

选择适量的work-group185

选择最优的work-group大小186

全局内存访存优化187

使用原子操作计算局部直方图189

本地内存访存优化190

局部直方图的规约192

全局规约193

完整的kernel代码193

性能和小结196

第10章OpenCL案例学习4:混合粒子模拟197

引言197

计算概览197

GPU实现200

创建buffer200

构造加速结构201

计算碰撞201

合成202

CPU实现202

负载均衡203

性能和小结204

生成均匀网格的kernel代码205

粒子模拟的kernel代码206

第11章OpenCL扩展211

引言211

扩展机制概览211

设备拆分214

双精度225

参考文献233

第12章OpenCL的性能剖析和调试235

引言235

基于事件的剖析236

AMD APP Profiler238

收集OpenCL程序轨迹239

收集OpenCL GPU Kernel性能计数器242

AMD APP KernelAnalyzer243

演示AMD APP Profiler245

启动AMD APP Profiler245

使用应用程序的轨迹数据以发现性能瓶颈245

使用GPU性能计数器发现kernel的性能瓶颈247

调试OpenCL应用程序248

gDEBugger概览249

使用gDEBugger调试并行OpenCL应用程序249

AMD printf扩展251

小结253

第13章WebCL255

引言255

框架设计256

WebCL实验性实现257

Firefox扩展257

连接JavaScript和OpenCL258

WebCL动手练习260

Web照片编辑器264

讨论266

小结268

参考文献268

扩展阅读和相关网站269

索引271

热门推荐