-
内容大纲
本书采用循序渐进的讲解方式,介绍了如何从零开始构建一个企业级监控平台的相关理论技术和实践方法。首先从监控系统总体设计原理出发,逐步介绍企业级监控系统的常用架构、各个组件模块作用、运行模式、监控体系的建设路线、监控信息的合并算法、监控颗粒度设置经验以及如何保障监控系统自身可靠性等内容;随后自底向上依次对硬件设备、操作系统、虚拟机、常用数据库和中间件、容器和容器编排、系统和应用日志以及应用链路等常见监控领域实施监控的技术原理、常用监控指标以及实现方式等内容作了介绍;最后对监控系统下阶段发展趋势也即智能监控作涉及相关技术原理及常用智能监控功能作了展望及介绍。通过对本书的系统学习,可以对计算机监控系统的基本原理、设计思想、实现方式等方面有全面而深入的了解。 -
作者介绍
-
目录
第1章 监控系统规划及原理
1.1 IT监控运维管理的发展历程
1.1.1 新兴的中国市场(1985—1994年)
1.1.2 运营商大建设期(1995—2000年)
1.1.3 多元化的监控运维系统(2001—2010年)
1.1.4 面向云和应用(2010年至今)
1.2 监控体系总体规划
1.2.1 IT运营体系的阶段性
1.2.2 监控体系建设的阶段性
1.3 监控系统的分类
1.4 监控系统工作原理
1.5 监控系统运行模式分类
1.5.1 主动/被动监控
1.5.2 有代理/无代理
1.6 监控事件总线
1.6.1 什么是集中监控事件总线
1.6.2 事件总线的市场格局
1.6.3 监控事件总线的功能设计
本章小结
第2章 计算机硬件设备监控
2.1 计算机的分类
2.2 数据中心常见的计算机种类
2.2.1 大型机
2.2.2 小型机、PC服务器
2.2.3 RISC、CISC
2.2.4 刀片机
2.3 计算机硬件设备监控
2.3.1 大型机设备监控
2.3.2 小型机设备监控
2.3.3 PC Server设备监控
2.3.4 刀片机设备监控
本章小结
第3章 虚拟机监控
3.1 虚拟化分类
3.1.1 硬件虚拟化
3.1.2 桌面虚拟化
3.1.3 应用程序虚拟化
3.1.4 网络虚拟化
3.2 ESXi虚拟化监控
3.2.1 ESXi虚拟化概述
3.2.2 ESXi架构图及监控入口
3.2.3 使用Zabbix监控ESXi
3.3 KVM虚拟化监控
3.3.1 KVM虚拟化概述
3.3.2 使用Zabbix监控KVM
本章小结
第4章 操作系统监控
4.1 操作系统的种类
4.1.1 类UNIX系统
4.1.2 Windows系统
4.2 操作系统功能模块
4.3 CPU监控
4.3.1 CPU相关概念
4.3.2 CPU状态
4.4 内存监控
4.4.1 内存相关概念
4.4.2 内存状态
4.5 进程监控
4.5.1 进程相关概念
4.5.2 进程状态监控
4.6 文件属性监控
4.6.1 Windows中的文件属性
4.6.2 类UNIX中的文件属性
4.7 文件系统监控
4.7.1 文件系统概念
4.7.2 文件系统状态
4.8 网络模块监控
4.8.1 网络流量监控
4.9 监控系统如何监控操作系统
4.9.1 Windows
4.9.2 Linux
本章小结
第5章 数据库监控
5.1 数据库分类
5.1.1 关系型数据库
5.1.2 非关系型数据库
5.2 数据库状态指标分类
5.3 当前连接数与最大允许连接数
5.3.1 连接数的相关概念
5.3.2 连接数指标实例
5.4 QPS/TPS
5.4.1 QPS/TPS的相关概念
5.4.2 QPS/TPS指标实例
5.5 慢查询
5.5.1 慢查询的相关概念
5.5.2 慢查询指标实例
5.6 磁盘I/O监控
5.6.1 磁盘I/O相关概念
5.6.2 磁盘I/O的获取
5.7 其他针对性指标
5.7.1 Mysql Binlog cache的相关概念
5.7.2 Mysql Binlog cache指标实例
5.7.3 Oracle表空间的概念
5.7.4 Oracle表空间指标实例
5.7.5 Mysql MHA高可用集群的概念
5.7.6 Mysql MHA高可用集群指标
5.7.7 Oracle集群的概念
5.7.8 Oracle集群指标实例
本章小结
第6章 中间件监控
6.1 Nginx监控
6.1.1 Nginx概述
6.1.2 Nginx服务的进程及端口
6.1.3 服务可用性监控
6.1.4 Nginx日志监控
6.1.5 Nginx状态页监控
6.2 Tomcat监控
6.2.1 Tomcat概述
6.2.2 请求吞吐量指标和延迟指标
6.2.3 线程池指标
6.2.4 Errors错误率指标
6.2.5 JVM内存使用情况指标
6.2.6 JVM监控工具
6.3 ActiveMQ监控
6.3.1 ActiveMQ概述
6.3.2 生产者数量监控
6.3.3 消费者数量监控
6.3.4 队列深度监控
6.3.5 ActiveMQ监控实践
本章小结
第7章 Docker容器监控
7.1 Docker容器运行状态
7.2 Docker容器性能指标
7.3 cAdvisor对容器监控
7.3.1 CPU的监控
7.3.2 内存的监控
7.3.3 磁盘的监控
7.3.4 网络的监控
7.4 Docker容器内的应用日志监控
本章小结
第8章 Kubernetes监控
8.1 Kubernetes简介
8.2 Prometheus简介
8.3 Prometheus部署
8.4 Kubernetes集群监控
8.4.1 宿主机监控
8.4.2 容器监控
8.4.3 集群资源监控
8.4.4 API Server监控
8.4.5 应用系统监控
本章小结
第9章 应用监控
9.1 应用性能管理概述
9.2 调用链路跟踪
9.2.1 Span的概念
9.2.2 Trace的概念
9.3 APM系统的设计与实现
9.3.1 APM系统通用架构
9.3.2 Span的创建及SpanContext的传递逻辑
9.3.3 TraceID和SpanID的生成方法
9.3.4 代码注入方法
9.3.5 APM系统性能优化
本章小结
第10章 日志监控
10.1 日志的基本概念
10.2 日志的作用
10.2.1 运维监控
10.2.2 资源管理
10.2.3 入侵检测
10.2.4 取证和审计
10.2.5 挖掘分析
10.3 常见日志类型及格式
10.3.1 W3C Extended Log File格式
10.3.2 Apache access log
10.3.3 Syslog
10.4 日志规范
10.4.1 应用日志打印规范
10.4.2 日志的轮转归档
10.4.3 日志的爆发抑制
10.5 日志监控基本原理
10.5.1 前置式日志监控
10.5.2 集中式日志监控
10.5.3 日志监控的基本过程
10.6 日志监控的常见场景
10.6.1 关键字监控
10.6.2 多节点日志监控
10.6.3 应用系统性能监控
10.6.4 应用系统业务量异常监控
10.6.5 安全监控与异常IP自动封禁
10.7 日志采集与传输
10.7.1 拉式采集(PULL)
10.7.2 推式采集(PUSH)
10.7.3 日志过滤
10.8 日志解析与日志监控策略
10.8.1 日志解析工具
10.8.2 正则表达式
10.8.3 日志监控策略
10.9 常见日志监控系统
10.9.1 基于ELK的日志监控
10.9.2 基于Splunk的日志监控
本章小结
第11章 智能监控
11.1 智能监控概述
11.1.1 Gartner AIOps
11.1.2 NoOps
11.1.3 智能监控实施路径
11.2 监控数据治理
11.2.1 大数据平台选型
11.2.2 大数据平台设计
11.2.3 监控运维数据治理
11.3 监控动态基线
11.3.1 动态阈值设计与计算
11.3.2 基于动态阈值异常检测
11.3.3 监控动态阈值案例
11.4 监控自愈
11.4.1 什么是自愈
11.4.2 自愈的优势
11.4.3 监控自愈模块设计
11.4.4 监控自愈案例分享
本章小结
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...