-
内容大纲
本书不仅介绍了如何测量CPU、内存、磁盘SSD、网络的性能,如何观察、记录、跟踪、汇总性能指标,还讨论了如何设计和创建性能测试工具KUtrace,以及如何对观察结果进行推理。
本书不仅适合软件开发人员阅读,还适合计算机相关专业的师生参考。 -
作者介绍
理查德·L.赛茨(Richard L.Sites),美国国家工程院院士。在职业生涯的大部分时间中,他负责硬件与软件的交接,特别关注CPU/软件性能交互。他担任了DEC Alpha处理器的架构师,发明了处理器的性能计数器。他还在DEC、Adobe、Google和Tesla公司编写过低开销的微代码,负责过软件跟踪。 -
目录
第一部分 测量
第1章 我的程序太慢了
1.1 数据中心环境
1.2 数据中心的硬件
1.3 数据中心的软件
1.4 长尾时延
1.5 思维框架
1.6 数量级估测
1.7 为什么事务很慢
1.8 5种基本资源
1.9 小结
第2章 测量CPU时间
2.1 发展历史
2.2 现状
2.3 测量add指令的时延
2.4 直线代码失败
2.5 简单循环、循环开销失败、优化编译器失败
2.6 死变量失败
2.7 更好的循环
2.8 依赖变量
2.9 实际执行时延
2.10 更多细微差别
2.11 小结
习题
第3章 测量内存层次
3.1 内存计时
3.2 关于内存
3.3 缓存组织
3.4 数据对齐
3.5 页表缓存组织
3.6 测量内存的步骤
3.7 测量缓存行的大小
3.8 问题:预取第N+1行
3.9 依赖加载
3.10 非随机的DRAM
3.11 测量每个缓存级别的总大小
3.12 测量每个级别的缓存相联度
3.13 页表缓存时间
3.14 缓存利用不足
3.15 小结
习题
第4章 CPU与内存的交互
4.1 缓存交互
4.2 简单矩阵乘法的动态
4.3 估测
4.4 初始化、反复核对和观察
4.5 初始结果
4.6 更快的矩阵乘法,转置方法
4.7 更快的矩阵乘法,子块方法
4.8 感知缓存的计算
4.9 小结
习题
第5章 测量磁盘SSD的传输时间
5.1 关于硬盘
5.2 关于SSD
5.3 软件磁盘访问和磁盘缓冲
5.4 磁盘读取有多快
5.5 一次粗略估算
5.6 磁盘写入有多快
5.7 结果
5.8 从磁盘读取
5.9 写入磁盘
5.10 从SSD读取
5.11 写入SSD
5.12 多次传输
5.13 小结
习题
第6章 测量网络流量
6.1 关于以太网
6.2 关于集线器、交换机和路由器
6.3 关于TCP IP
6.4 关于数据包
6.5 关于RPC
6.6 空程差
6.7 观察网络流量
6.8 示例RPC消息的定义
6.9 示例日志设计
6.10 使用RPC的示例客户-服务器系统
6.11 示例服务器程序
6.12 自旋锁
6.13 示例客户端程序
6.14 测量一个示例客户-服务器RPC
6.15 后处理RPC日志
6.16 观察
6.17 小结
习题
第7章 磁盘和网络数据库的交互
7.1 时间对齐
7.2 多个客户端
7.3 自旋锁的应用
7.4 实验
7.5 磁盘数据库
7.6 实验
7.7 实验
7.8 日志
7.9 理解事务时延的变化
7.10 小结
习题
第二部分 观察
第8章 日志
8.1 观察工具
8.2 日志
8.3 基本日志
8.4 扩展日志
8.5 时间戳
8.6 RPC ID
8.7 日志文件的格式
8.8 管理日志文件
8.9 小结
第9章 聚合措施测量
9.1 均匀的事件率与阵发的事件率
9.2 测量间隔
9.3 时间线
9.4 进一步汇总时间线
9.5 直方图的时间尺度
9.6 聚合每个事件的测量结果
9.7 一段时间的值的模式
9.8 更新间隔
9.9 事务采样
9.10 小结
第10章 仪表板
10.1 示例服务
10.2 示例仪表板
10.3 主仪表板
10.4 实例仪表板
10.5 服务器仪表板
10.6 健全检查
10.7 小结
习题
第11章 其他现有工具
11.1 观察工具的分类
11.2 要观察的数据
11.3 top命令
11.4 proc和 sys伪文件
11.5 time命令
11.6 perf命令
11.7 oprofile
11.8 strace
11.9 ltrace
11.10 ftrace
11.11 mtrace
11.12 blktrace
11.13 tcpdump和Wireshark
11.14 locktrace
11.15 输入负载、出站调用
11.16 小结
习题
第12章 跟踪工具
12.1 跟踪工具的优势
12.2 跟踪工具的缺点
12.3 3个起始问题
12.4 示例1:早期的程序计数器跟踪
12.5 示例2:每个函数的计数和时间
12.6 案例分析:Gmail的按函数跟踪
12.7 小结
第13章 优秀观察工具的设计原则
13.1 需要观察什么
13.2 有多频繁?要多久
13.3 开销有多大
13.4 设计的后果
13.5 案例分析:直方图桶
13.6 设计数据显示
13.7 小结
第三部分 内核-用户跟踪
第14章 KUtrace的目标、设计、
实现
14.1 概述
14.2 目标
14.3 设计
14.4 实现
14.5 内核补丁和Linux内核可加载模块
14.6 控制程序
14.7 后处理
14.8 关于安全问题的一点说明
14.9 小结
第15章 KUtrace中的Linux内核补丁
15.1 跟踪缓冲区数据结构
15.2 原始跟踪块的格式
15.3 跟踪条目
15.4 IPC跟踪条目
15.5 时间戳
15.6 事件编号
15.7 嵌套的跟踪条目
15.8 代码
15.9 数据包跟踪
15.10 AMD Intel x86-64补丁
15.11 小结
习题
第16章 KUtrace的Linux内核可加载模块
16.1 内核接口数据结构
16.2 模块加载 卸载
16.3 初始化和控制跟踪
16.4 实现跟踪调用
16.5 Insert
16.6 InsertN
16.7 切换到一个新的跟踪块
16.8 小结
第17章 KUtrace的用户态的运行时控制
17.1 控制跟踪
17.2 独立的kutrace_control程序
17.3 底层的kutrace_lib库
17.4 可加载模块的控制接口
17.5 小结
第18章 KUtrace的后处理
18.1 后处理的细节
18.2 rawtoevent程序
18.3 eventtospan程序
18.4 spantotrim程序
18.5 spantospan程序
18.6 samptoname_k和samptoname_u程序
18.7 makeself程序
18.8 KUtrace的JSON格式
18.9 小结
第19章 KUtrace中软件动态的显示
19.1 概述
19.2 区域①—控件
19.3 区域②—y轴
19.4 区域③—主时间线
19.5 区域④—IPC图例
19.6 区域⑤—x轴
19.7 区域⑥—保存/还原
19.8 辅助控件
19.9 小结
第四部分 推理
第20章 寻找什么
20.1 概述
20.2 寻找原因
第21章 执行太多
21.1 概述
21.2 程序
21.3 谜团
21.4 探索和分析
21.5 理解谜团
21.6 小结
第22章 执行缓慢
22.1 概述
22.2 程序
22.3 谜团
22.4 浮点运算对立程序
22.5 内存对立程序
22.6 理解谜团
22.7 小结
第23章 等待CPU
23.1 程序
23.2 谜团
23.3 探索和分析
23.4 谜团
23.5 理解谜团
23.6 附加谜团
23.7 小结
习题
第24章 等待内存
24.1 程序
24.2 谜团
24.3 探索和分析
24.4 谜团2:访问页表
24.5 理解谜团
24.6 小结
习题
第25章 等待磁盘
25.1 程序
25.2 谜团
25.3 探索和分析
25.4 读取40MB
25.5 顺序读取4KB的块
25.6 随机读取4KB的块
25.7 在SSD上写入和同步
25.8 在SSD上读取40MB
25.9 两个程序同时访问两个文件
25.10 理解谜团
25.11 小结
习题
第26章 等待网络
26.1 概述
26.2 程序
26.3 实验
26.4 实验1中的谜团
26.5 实验1的探索与分析
26.6 实验1中RPC之间的时间
26.7 实验
26.8 实验
26.9 实验
26.10 理解谜团
26.11 附加异常
26.12 小结
第27章 等待锁
27.1 概述
27.2 程序
27.3 实验1:长时间持有锁
27.4 实验1中的谜团
27.5 探索和分析实验
27.6 实验2:修复锁捕获
27.7 实验3:通过多个锁修复锁争用
27.8 实验4:通过锁住更少的工作来修复锁争用
27.9 实验5:通过为仪表板使用RCU来修复锁争用
27.10 小结
第28章 等待时间
28.1 定期工作
28.2 超时
28.3 时间分片
28.4 内在的执行延迟
28.5 小结
第29章 等待队列
29.1 概述
29.2 请求的分布
29.3 队列的结构
29.4 工作任务
29.5 主任务
29.6 Dequeue操作
29.7 Enqueue操作
29.8 PlainSpinLock类
29.9 “工作”例程
29.10 简单的示例
29.11 哪些地方可能发生了问题
29.12 CPU频率
29.13 复杂的示例
29.14 等待CPU:RPC日志
29.15 等待CPU:KUtrace
29.16 PlainSpinLock存在的缺陷
29.17 根本原因
29.18 修复PlainSpinLock:可观察性
29.19 负载均衡
29.20 队列深度:可观察性
29.21 结尾处的自旋
29.22 剩下的最后一个缺陷
29.23 交叉检查
29.24 小结
习题
第30章 全书回顾
30.1 你学到了什么
30.2 我们没有讲什么
30.3 接下来的工作
30.4 全书小结
附录A 示例服务器
附录B 跟踪条目
术语表
参考文献
KUtrace HTML图例
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...