-
内容大纲
本书基于当前主流的高性能CPU设计规格,全面介绍了高性能超标量CPU微架构的设计,并做出对应的分析。主要内容包括业界主流高性能处理器架构及超标量流水线背景知识(第1章);CPU前端,包括指令提取单元、分支预测单元、指令译码单元的设计和优化,以及指令缓存的相关设计(第2、3章);分支预测单元的原理、设计和优化,寄存器重命名与发射队列的原理和设计(第4、5章);执行单元与浮点运算单元的设计实现(第6、7章);访存单元与数据缓存设计(第8章);重排序缓冲的原理及设计(第9章);Intel P6 CPU微架构设计实例(第10章)。微架构设计对应于指令的生命周期,为读者提供直观和清晰的视角,便于读者对高性能CPU设计深入理解。
本书提供了高清学习视频,读者可以直接扫描二维码观看。
本书可作为从事高性能CPU相关研发工作专业人员的参考书,或用作高等院校计算机及集成电路相关专业研究生和高年级本科生的教学参考用书,也可供对CPU设计感兴趣的读者阅读。 -
作者介绍
-
目录
序
前言
第1章 CPU架构与流水线技术概述
1.1 复杂指令集与精简指令集概述
1.2 ARM指令集概述
1.2.1 条件执行与跳转类指令定义
1.2.2 数据处理与访存类指令定义
1.3 RISC-V指令集概述
1.3.1 寄存器结构与特权模式定义
1.3.2 RISC-V指令概述
1.4 MIPS指令集概述
1.5 超标量CPU设计概述
1.5.1 流水线技术概述
1.5.2 超长指令字设计
第2章 CPU前端与指令缓存设计
2.1 内存的层次结构与缓存的基本架构
2.2 指令缓存分类与访问读取
2.2.1 指令缓存结构的分类
2.2.2 指令缓存的访问读取
2.3 指令缓存的替换策略选择
2.3.1 基于新近的策略设计
2.3.2 基于频率的策略设计
2.3.3 近少常使用策略设计
2.4 指令缓存的性能衡量标准与硬件预取设计
2.5 TLB与缓存的组织方式
2.6 微操作缓存与循环缓冲器设计
2.7 指令提取单元设计
2.8 指令译码单元设计
2.8.1 RISC指令译码设计
2.8.2 x86指令格式概述
2.8.3 x86指令译码设计
第3章 分支预测单元设计
3.1 分支预测的原理
3.2 分支跳转方向预测
3.2.1 基于饱和计数器的预测器设计
3.2.2 TAGE预测器及其衍生设计
3.2.3 感知机预测器设计
3.3 分支跳转目标预测
3.3.1 分支目标缓冲与分支目标缓冲子系统设计
3.3.2 返回地址栈设计
3.3.3 循环预测器设计
3.3.4 间接跳转分支指令预测设计
3.4 分支预测单元与取指令单元解耦合设计
3.5 分支预测单元的设计思路
第4章 寄存器重命名单元设计
4.1 寄存器重命名技术概述
4.2 寄存器重命名的原理与过程概述
4.2.1 发射队列前读寄存器重命名设计
4.2.2 发射队列后读寄存器重命名设计
4.3 寄存器重命名技术的设计空间
4.3.1 寄存器重命名的范围与结构
4.3.2 重命名缓冲的类型
4.3.3 寄存器重命名缓冲的数量设计
4.3.4 重命名缓冲的读写端口设计
4.4 寄存器重命名的映射方法
4.5 寄存器重命名可能的实现方案
4.6 寄存器重命名的实现过程
第5章 发射队列设计
5.1 发射队列的原理
5.2 发射队列设计空间
5.2.1 发射队列的范围与结构
5.2.2 发射队列的类型与结构参数
5.3 操作数获取策略
5.3.1 发射队列前读寄存器与发射队列后读寄存器策略
5.3.2 整型和浮点寄存器分开的操作数获取策略
5.3.3 发射队列前读寄存器与发射队列后读寄存器的比较
5.4 发射队列的工作机制
5.5 发射队列在超标量CPU中的应用
第6章 执行单元设计
6.1 算术逻辑运算单元设计
6.1.1 加减法类与移位类指令的实现
6.1.2 前导零检测指令实现
6.2 定点乘法运算设计
6.2.1 部分积生成器实现
6.2.2 部分积压缩器实现
6.3 单指令多数据SIMD设计
6.4 旁路网络设计
第7章 浮点运算单元设计
7.1 浮点数据格式与运算标准——IEEE754
7.2 浮点加法运算原理与设计
7.2.1 浮点加法数据流设计
7.2.2 双路径算法原理与实现
7.2.3 前导零预测编码原理与实现
7.2.4 并行纠错树原理与实现
7.3 浮点乘法运算原理与设计
7.4 浮点除法开方运算原理与设计
7.4.1 SRT算法原理与实现
7.4.2 Newton-Raphson迭代法原理与实现
7.4.3 Goldschmidt迭代法原理与实现
第8章 访存单元设计
8.1 内存模型概述
8.1.1 内存类型概述
8.1.2 内存格式概述
8.1.3 内存的访问顺序
8.1.4 内存指令概述
8.2 数据缓存概述
8.2.1 数据缓存层次概述
8.2.2 缓存技术的应用与发展
8.3 数据缓存控制设计
8.3.1 访存控制结构概述
8.3.2 Load指令执行流程
8.3.3 Store指令执行流程
8.3.4 Load Store交织执行流程
8.4 数据缓存预取技术
8.4.1 数据缓存硬件预取原理
8.4.2 数据缓存硬件预取结构
8.4.3 数据缓存硬件预取模式
第9章 重排序缓冲设计
9.1 重排序缓冲的原理
9.2 重排序缓冲的设计空间
9.2.1 重排序缓冲的范围布局与对执行结果的存储
9.2.2 重排序缓冲的条目与端口数量
9.3 重排序缓冲运行示例
第10章 高性能CPU设计实例:Intel P6微架构
10.1 Intel P6微架构概述
10.2 Intel P6微架构的流水线设计
10.3 Intel P6微架构前端设计
10.3.1 指令提取单元设计
10.3.2 分支预测单元设计
10.3.3 指令译码单元设计
10.3.4 寄存器别名表设计
10.3.5 分配器设计
10.4 Intel P6微架构乱序执行引擎设计
10.4.1 保留站设计
10.4.2 重排序缓冲设计
10.4.3 P6微架构乱序执行示例
10.5 Intel P6微架构内存子系统设计
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...