-
内容大纲
本书主要围绕AI系统的理论基础与技术基础知识展开,结合实例进行介绍,旨在让读者了解AI系统的来龙去脉,形成对AI系统的系统化与层次化的初步理解,掌握AI系统基本理论、技术、实际应用及研究方向,为后续从事具体的学习研究工作和项目开发工作奠定基础。
本书首先介绍AI的历史、现状与发展及AI系统的基本知识,后分为AI硬件与体系结构、AI编译与计算架构、AI推理系统与引擎、AI框架核心模块四篇进行详细介绍,涉及AI系统从底层原理到应用落地的全貌,反映了AI系统架构的前沿技术。
本书可供人工智能、计算机及相关专业从业人员,以及对人工智能感兴趣的人员阅读,同时也可作为人工智能系统架构相关课程的配套教材。 -
作者介绍
-
目录
第1章 AI系统概述
1.1 AI历史与现状
1.2 AI发展驱动力
1.3 AI系统架构介绍
1.4 AI系统与AI算法关系
第一篇 AI硬件与体系结构
第2章 AI计算体系
2.1 引言
2.2 AI计算模式
2.3 关键设计指标
2.4 核心计算之矩阵乘
2.5 计算之比特位宽
第3章 AI芯片体系
3.1 CPU基础
3.2 CPU指令集架构
3.3 CPU计算本质
3.4 CPU计算时延
3.5 GPU基础
3.6 AI专用芯片基础
第4章 GPU——以英伟达为例
4.1 引言
4.2 TensorCore基本原理
4.3 TensorCore架构演进
4.4 TensorCore深度剖析
4.5 分布式通信
4.6 NVLink原理剖析
4.7 NVSwitch深度解析
第5章 TPU——以谷歌为例
5.1 引言
5.2 谷歌TPUv1脉动阵列
5.3 谷歌TPUv2训练芯片
5.4 谷歌TPUv3Pod服务器
5.5 谷歌TPUv4与光路交换
第6章 NPU——以昇腾为例
6.1 引言
6.2 昇腾AI处理器
6.3 昇腾AI核心单元
6.4 昇腾数据布局转换
第7章 AI芯片思考与展望
7.1 GPU架构与CUDA关系
7.2 从GPU对AI芯片思考
7.3 AI芯片发展方向
7.4 超异构计算
第二篇 AI编译与计算架构
第8章 传统编译器
8.1 引言
8.2 传统编译器介绍
8.3 GCC基本介绍与特征
8.4 LLVM架构设计和原理
8.5 LLVMIR基本概念
8.6 LLVMIR细节详解
8.7 LLVM前端和优化层
8.8 LLVM后端代码生成
第9章 AI编译器
9.1 引言
9.2 AI编译器历史阶段
9.3 AI编译器基本架构
9.4 AI编译器挑战与思考
第10章 前端优化
10.1 引言
10.2 图算IR
10.3 算子融合
10.4 布局转换原理
10.5 内存分配算法
10.6 常量折叠原理
10.7 公共子表达式消除原理
10.8 死代码消除
10.9 代数简化
第11章 后端优化
11.1 引言
11.2 计算与调度
11.3 算子手工优化
11.4 算子循环优化
11.5 指令和存储优化
11.6 Auto-Tuning原理
第12章 计算架构
12.1 芯片的编程体系
12.2 SIMD&SIMT与芯片架构
12.3 SIMD&SIMT与编程关系
12.4 CUDA计算结构
第13章 CANN&AscendC计算架构
13.1 昇腾异构计算架构CANN
13.2 CANN与算子
13.3 算子开发编程语言AscendC
13.4 AscendC语法扩展
13.5 AscendC编程范式——以向量为例
第三篇 AI推理系统与引擎
第14章 推理系统
14.1 引言
14.2 推理系统介绍
14.3 推理流程全景
14.4 推理系统架构
14.5 推理引擎架构
14.6 昇腾推理引擎MindIE
14.7 昇腾计算语言AscendCL
第15章 模型小型化
15.1 推理参数了解
15.2 CNN模型小型化
15.3 Transformer模型小型化
第16章 模型轻量化
16.1 引言
16.2 量化基本原理
16.3 感知量化训练
16.4 训练后量化与部署
16.5 模型剪枝原理
16.6 知识蒸馏原理
第17章 模型转换
17.1 引言
17.2 推理文件格式
17.3 自定义计算图
17.4 模型转换流程
第18章 计算图优化架构
18.1 引言/647日
18.2 离线图优化技术
18.3 其他计算图优化
第19章 Kernel优化
19.1 引言
19.2 卷积计算原理
19.3 Im2Col算法
19.4 Winograd算法
19.5 QNNPACK算法
19.6 推理内存布局
第四篇 AI框架核心模块
第20章 AI框架基础
20.1 引言
20.2 AI框架作用
20.3 AI框架之争
20.4 AI框架的编程范式
20.5 昇思MindSpore关键特性
第21章 自动微分
21.1 引言
21.2 什么是微分
21.3 微分计算模式
21.4 微分实现方式
21.5 动手实现自动微分
21.6 动手实现PyTorch微分
21.7 自动微分的挑战和未来
第22章 计算图
22.1 引言
22.2 计算图基本原理
22.3 计算图与自动微分
22.4 计算图的调度与执行
22.5 计算图的控制流实现
22.6 动态图与静态图转换
第23章 分布式并行
23.1 引言
23.2 数据并行
23.3 数据并行进阶
23.4 张量并行
23.5 流水并行
23.6 混合并行
23.7 昇思MindSpore并行
参考文献
索引
彩图
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...