-
内容大纲
本书内容丰富,注重编程实战,涉及异构并行计算的基本概念、编程模型和应用案例,适合技术开发人员和学术研究人员学习与参考。本书主要由四个部分组成:第一部分(第2~6章)介绍异构并行计算编程的基本概念,包括数据并行化、GPU架构、CUDA编程及程序性能优化方法等内容;第二部分(第7~12章)介绍并行模式,包括卷积、模板、并行直方图、归约、前缀和、归并等内容;第三部分(第13~19章)介绍高级模式及应用,包括排序、稀疏矩阵计算、图遍历、深度学习、迭代式磁共振成像重建、静电势能图和计算思维等内容;第四部分(第20~22章)介绍高级编程实践,包括异构计算集群编程、CUDA动态并行化等内容。 -
作者介绍
-
目录
译者序
推荐序
前言
致谢
第1章 引言
1.1 异构并行计算
1.2 为什么需要速度与并行性
1.3 加快实际应用的速度
1.4 并行编程中的挑战
1.5 相关的并行编程接口
1.6 本书的总体目标
1.7 本书的章节安排
参考文献
第一部分 基本概念
第2章 异构数据并行计算
2.1 数据并行性
2.2 CUDA C程序结构
2.3 向量加法核
2.4 设备全局存储和数据传输
2.5 核函数和线程
2.6 调用核函数
2.7 编译
2.8 总结
2.8.1 函数声明
2.8.2 内核调用和网格启动
2.8.3 内置(预定义)变量
2.8.4 运行时应用程序编程接口
练习
参考文献
第3章 多维网格和数据
3.1 多维网格组织
3.2 将线程映射到多维数据
3.3 图像模糊:更复杂的内核
3.4 矩阵乘法
3.5 总结
练习
第4章 计算架构和调度
4.1 现代GPU架构
4.2 块调度
4.3 同步和透明可扩展性
4.4 线程束和SIMD硬件
4.5 控制发散
4.6 线程束调度和延迟容忍
4.7 资源划分和占用率
4.8 查询设备属性
4.9 总结
练习
参考文献
第5章 内存架构和数据局部性
5.1 内存访问效率的重要性
5.2 CUDA内存类型
5.3 利用平铺减少内存流量
5.4 平铺的矩阵乘法内核
5.5 边界检查
5.6 内存使用对占用率的影响
5.7 总结
练习
第6章 性能方面的考虑
6.1 内存合并
6.2 隐藏内存延迟
6.3 线程粗化
6.4 优化清单
6.5 了解计算瓶颈
……
第二部分 并行模式
第三部分 高级模式及应用
第四部分 高级实践
附录 数值方面的考虑
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
