欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • AI系统(原理与架构)(精)
      • 作者:编者:ZOMI酱//苏统华|责编:许蕾
      • 出版社:科学
      • ISBN:9787030792877
      • 出版日期:2024/09/01
      • 页数:884
    • 售价:79.6
  • 内容大纲

        本书主要围绕AI系统的理论基础与技术基础知识展开,结合实例进行介绍,旨在让读者了解AI系统的来龙去脉,形成对AI系统的系统化与层次化的初步理解,掌握AI系统基本理论、技术、实际应用及研究方向,为后续从事具体的学习研究工作和项目开发工作奠定基础。
        本书首先介绍AI的历史、现状与发展及AI系统的基本知识,后分为AI硬件与体系结构、AI编译与计算架构、AI推理系统与引擎、AI框架核心模块四篇进行详细介绍,涉及AI系统从底层原理到应用落地的全貌,反映了AI系统架构的前沿技术。
        本书可供人工智能、计算机及相关专业从业人员,以及对人工智能感兴趣的人员阅读,同时也可作为人工智能系统架构相关课程的配套教材。
  • 作者介绍

  • 目录

      第1章  AI系统概述
        1.1  AI历史与现状
        1.2  AI发展驱动力
        1.3  AI系统架构介绍
        1.4  AI系统与AI算法关系
    第一篇  AI硬件与体系结构
      第2章  AI计算体系
        2.1  引言
        2.2  AI计算模式
        2.3  关键设计指标
        2.4  核心计算之矩阵乘
        2.5  计算之比特位宽
      第3章  AI芯片体系
        3.1  CPU基础
        3.2  CPU指令集架构
        3.3  CPU计算本质
        3.4  CPU计算时延
        3.5  GPU基础
        3.6  AI专用芯片基础
      第4章  GPU——以英伟达为例
        4.1  引言
        4.2  TensorCore基本原理
        4.3  TensorCore架构演进
        4.4  TensorCore深度剖析
        4.5  分布式通信
        4.6  NVLink原理剖析
        4.7  NVSwitch深度解析
      第5章  TPU——以谷歌为例
        5.1  引言
        5.2  谷歌TPUv1脉动阵列
        5.3  谷歌TPUv2训练芯片
        5.4  谷歌TPUv3Pod服务器
        5.5  谷歌TPUv4与光路交换
      第6章  NPU——以昇腾为例
        6.1  引言
        6.2  昇腾AI处理器
        6.3  昇腾AI核心单元
        6.4  昇腾数据布局转换
      第7章  AI芯片思考与展望
        7.1  GPU架构与CUDA关系
        7.2  从GPU对AI芯片思考
        7.3  AI芯片发展方向
        7.4  超异构计算
    第二篇  AI编译与计算架构
      第8章  传统编译器
        8.1  引言
        8.2  传统编译器介绍
        8.3  GCC基本介绍与特征
        8.4  LLVM架构设计和原理
        8.5  LLVMIR基本概念

        8.6  LLVMIR细节详解
        8.7  LLVM前端和优化层
        8.8  LLVM后端代码生成
      第9章  AI编译器
        9.1  引言
        9.2  AI编译器历史阶段
        9.3  AI编译器基本架构
        9.4  AI编译器挑战与思考
      第10章  前端优化
        10.1  引言
        10.2  图算IR
        10.3  算子融合
        10.4  布局转换原理
        10.5  内存分配算法
        10.6  常量折叠原理
        10.7  公共子表达式消除原理
        10.8  死代码消除
        10.9  代数简化
      第11章  后端优化
        11.1  引言
        11.2  计算与调度
        11.3  算子手工优化
        11.4  算子循环优化
        11.5  指令和存储优化
        11.6  Auto-Tuning原理
      第12章  计算架构
        12.1  芯片的编程体系
        12.2  SIMD&SIMT与芯片架构
        12.3  SIMD&SIMT与编程关系
        12.4  CUDA计算结构
      第13章  CANN&AscendC计算架构
        13.1  昇腾异构计算架构CANN
        13.2  CANN与算子
        13.3  算子开发编程语言AscendC
        13.4  AscendC语法扩展
        13.5  AscendC编程范式——以向量为例
    第三篇  AI推理系统与引擎
      第14章  推理系统
        14.1  引言
        14.2  推理系统介绍
        14.3  推理流程全景
        14.4  推理系统架构
        14.5  推理引擎架构
        14.6  昇腾推理引擎MindIE
        14.7  昇腾计算语言AscendCL
      第15章  模型小型化
        15.1  推理参数了解
        15.2  CNN模型小型化
        15.3  Transformer模型小型化
      第16章  模型轻量化

        16.1  引言
        16.2  量化基本原理
        16.3  感知量化训练
        16.4  训练后量化与部署
        16.5  模型剪枝原理
        16.6  知识蒸馏原理
      第17章  模型转换
        17.1  引言
        17.2  推理文件格式
        17.3  自定义计算图
        17.4  模型转换流程
      第18章  计算图优化架构
        18.1  引言/647日
        18.2  离线图优化技术
        18.3  其他计算图优化
      第19章  Kernel优化
        19.1  引言
        19.2  卷积计算原理
        19.3  Im2Col算法
        19.4  Winograd算法
        19.5  QNNPACK算法
        19.6  推理内存布局
    第四篇  AI框架核心模块
      第20章  AI框架基础
        20.1  引言
        20.2  AI框架作用
        20.3  AI框架之争
        20.4  AI框架的编程范式
        20.5  昇思MindSpore关键特性
      第21章  自动微分
        21.1  引言
        21.2  什么是微分
        21.3  微分计算模式
        21.4  微分实现方式
        21.5  动手实现自动微分
        21.6  动手实现PyTorch微分
        21.7  自动微分的挑战和未来
      第22章  计算图
        22.1  引言
        22.2  计算图基本原理
        22.3  计算图与自动微分
        22.4  计算图的调度与执行
        22.5  计算图的控制流实现
        22.6  动态图与静态图转换
      第23章  分布式并行
        23.1  引言
        23.2  数据并行
        23.3  数据并行进阶
        23.4  张量并行
        23.5  流水并行

        23.6  混合并行
        23.7  昇思MindSpore并行
    参考文献
    索引
    彩图