-
内容大纲
全链路压测是互联网服务容量保障工作人员的重要工作,也是横跨多个领域的技术。本书采用“理论联系实际,再从实际回溯到理论”的方式,深入浅出地阐述全链路压测的知识。本书前4章聚焦于全链路压测的基础知识,先对全链路压测的基本知识和发展前景等进行深入介绍,再展开讲解全链路压测的技术实现、组织保障和工具建设,其间穿插一些实例代码和图表,帮助读者融会贯通。第5章和第6章介绍全链路压测的衍生实践,包括微服务架构下的容量治理,以及容量规划与容量预测,将全链路压测的应用价值扩大到更广的领域。第7章用4个案例讲解全链路压测在不同类型企业的落地实践,涵盖全链路压测在容量保障和混沌工程领域的应用。第8章从技术、管理和职业发展这3个方面,以问答形式阐述多个全链路压测问题,为读者带来更多的思考。
本书内容既包括全链路压测的理论知识,又包括丰富的实践案例,适合架构师、研发人员、性能测试人员、运维人员、网站可靠性工程师、团队管理者、项目经理等阅读。 -
作者介绍
吴骏龙,Wish China QA Director,阿里本地生活前高级测试经理,毕业于中国科学技术大学,硕士学位。在软件质量体系、服务容量保障、服务稳定性建设、软件研发效能等领域深耕多年,善于通过创新手段解决质量和效能难题,拥有多项国内外专利。极客时间专栏作者,多次受邀于业界各技术大会发表演讲,传播先进理念和方法论,具备一定的行业影响力。 -
目录
第1章 认识全链路压测
1.1 全链路压测概述
1.1.1 互联网服务的容量保障
1.1.2 全链路压测的概念
1.1.3 全链路压测的价值
1.1.4 全链路压测的特点
1.2 全链路压测的演进之路
1.2.1 基线容量测试
1.2.2 集群缩放压测
1.2.3 流量回放
1.2.4 单链路压测
1.3 全链路压测的发展前景
1.4 本章小结
第2章 全链路压测的技术实现
2.1 压测数据隔离
2.1.1 逻辑隔离
2.1.2 物理隔离
2.1.3 影子库与影子表
2.1.4 逻辑隔离与物理隔离的对比
2.2 中间件改造和应用服务改造
2.2.1 中间件改造
2.2.2 应用服务改造
2.3 压测模型构建
2.3.1 线上日志回放
2.3.2 链路聚合技术
2.3.3 新场景的压测模型构建
2.3.4 全链路压测的服务范围
2.4 压测流量构造
2.4.1 压测流量构造的成本权衡
2.4.2 压测流量构造工具的技术选型
2.5 容量指标监控
2.5.1 资源类指标
2.5.2 应用类指标
2.5.3 网络类指标
2.5.4 链路类指标
2.5.5 中间件指标
2.5.6 压测端指标
2.5.7 舆情指标
2.5.8 容量指标监控原则
2.6 全链路压测的实施流程
2.6.1 压测方案设计
2.6.2 压测方案评审
2.6.3 压测准备
2.6.4 压测执行
2.6.5 结果反馈
2.6.6 持续跟进
2.7 本章小结
第3章 全链路压测的组织保障
3.1 全链路压测需要什么样的团队
3.1.1 运维驱动:GOC团队的建立和意义
3.1.2 测试驱动:是否需要独立的专项测试团队
3.1.3 谁对服务容量负责
3.2 全链路压测如何运营
3.2.1 Program机制
3.2.2 全链路压测SOP
3.2.3 常态化执行制度和容量问题分级规范
3.2.4 激励措施和竞争模式
3.3 中小型公司如何建设全链路压测
3.3.1 粗放式建设
3.3.2 善用云服务商的收费机制
3.3.3 用好开源工具
3.3.4 购买解决方案
3.4 本章小结
第4章 全链路压测的工具建设
4.1 优秀开源工具精粹
4.1.1 链路追踪工具
4.1.2 流量构造工具
4.1.3 容量监控工具
4.2 分布式压测平台建设
4.2.1 架构设计
4.2.2 压测状态流转
4.2.3 实时数据(热数据)
4.2.4 异步数据(冷数据)
4.2.5 吞吐量限制与动态调节
4.2.6 压测场景编排
4.2.7 监控模块
4.3 全链路压测管理平台建设
4.3.1 全链路压测管理平台功能概览
4.3.2 压测链路与模型管理
4.3.3 压测风险识别与结果跟进
4.4 无人值守全链路压测的技术实现
4.4.1 自适应压测策略
4.4.2 自动化风险管控
4.5 本章小结
第5章 微服务架构下的容量治理
5.1 微服务架构的特点和容量风险
5.1.1 微服务架构的特点
5.1.2 微服务架构的容量风险
5.2 容量指标分析实战
5.2.1 响应时间应关注平均值,还是分位线?
5.2.2 响应时间一定越短越好吗?
5.2.3 CPU利用率低,服务容量就一定没有问题吗?
5.2.4 “压不上去”了,就是服务容量达到瓶颈了吗?
5.2.5 容量指标只是偶尔“抖动”一下,要不要关注?
5.3 扩容:为服务增添“燃料”
5.3.1 扩容方案
5.3.2 扩容注意点
5.4 限流:让我“缓一缓”
5.4.1 限流策略
5.4.2 限流位置
5.5 降级:弃车保帅
5.5.1 降级实现
5.5.2 降级策略和要点
5.6 熔断:上游的服务,我们来保护你
5.7 容灾:我还有“一条命”
5.7.1 常见容灾手段
5.7.2 容灾衡量指标
5.7.3 两地三中心
5.7.4 异地多活
5.8 预案建设:提前准备,胸有成竹
5.8.1 认识预案
5.8.2 预案演练
5.9 本章小结
第6章 容量规划与容量预测
6.1 容量规划的本质
6.2 容量规划的系统化方法
6.2.1 容量测量
6.2.2 容量预测
6.2.3 资源部署
6.2.4 容量验证
6.3 智能化容量预测
6.3.1 智能化容量预测过程
6.3.2 相关度分析与服务画像
6.3.3 容量预测迭代与校准
6.3.4 警惕业务场景变化
6.4 浅谈排队论
6.4.1 排队论基础知识
6.4.2 排队论应用策略:排队模型与公式
6.4.3 排队论应用案例
6.5 本章小结
第7章 全链路压测实战案例
7.1 某大型企业“双11”大促活动容量保障案例
7.1.1 明确背景与目标
7.1.2 重点链路梳理
7.1.3 服务架构治理
7.1.4 大促流量预估
7.1.5 大促全链路压测
7.1.6 大促活动容量保障体系
7.1.7 案例总结
7.2 某创业公司全链路压测建设之路
7.2.1 全链路压测的建设背景
7.2.2 全链路压测的技术方案
7.2.3 全链路压测的管理方案
7.2.4 案例总结
7.3 某商业银行全链路压测实践案例
7.3.1 业务和技术背景
7.3.2 全链路压测的技术方案
7.3.3 全链路压测的实施效果
7.3.4 案例总结
7.4 全链路压测与混沌工程的融合案例
7.4.1 异常场景下的全链路压测
7.4.2 高负载下的故障模拟
7.4.3 全链路压测与攻防演练的融合
7.4.4 案例总结
7.5 本章小结
第8章 全链路压测快问快答
8.1 技术篇
8.1.1 统一基础设施是实施全链路压测的必要条件吗?
8.1.2 完全依赖开源工具能够实现全链路压测吗?
8.1.3 金融公司是否难以进行全链路压测?
8.1.4 业务迭代速度较快,如何降低全链路压测模型的更新成本?
8.1.5 业务技术团队认为通过限流足以规避容量风险,不需要进行服务优化,是这样吗?
8.1.6 如何做到全链路压测的常态化实施?
8.2 管理篇
8.2.1 我所在的公司没有任何容量保障基础,如何推动全链路压测的建设?
8.2.2 全链路压测适合自上而下推动,还是自下而上推动?
8.2.3 制定和推动全链路压测流程规范时阻力重重,该怎么办?
8.2.4 业务技术团队不认可全链路压测的结果,该怎么办?
8.2.5 “大厂”的全链路压测经验,能够复制到中小型企业吗?
8.3 职业发展篇
8.3.1 是什么契机让你开始从事全链路压测工作的?
8.3.2 你在实施全链路压测的过程中遇到的最大困难是什么?
8.3.3 从事全链路压测工作,能为我的职业发展带来什么帮助?
8.3.4 执行全链路压测非常辛苦,经常要熬夜,对此你有什么建议吗?
8.4 本章小结
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...