-
内容大纲
本书主要分析Hadoop 3.2.0的新特性和新功能,共5章。首先简单介绍Hadoop,让刚接触Hadoop的读者对它有个基本了解;接着介绍目前使用比较多的分布式文件系统HDFs,内容涉及NameNode的原理、HA、HDFS Federation和HDFS 3.0中新增的特性;然后从应用管理和资源调度这两个方面介绍一个通用的资源管理平台YARN;再后讨论如何在YARN平台中运行应用,比如如何将应用迁移到YARN平台,以及非Hadoop的应用是如何兼容YARN模式的。最后,书中给出了一些工作实战指南,包括如何搭建一个生产可用的Hadoop 3.0集群;如何将现有Hadoop 2.0集群升级到Hadoop 3.0,及其在升级过程中遇到的问题;如何针对Had00p进行二次开发,并参与社区,向社区贡献代码;一个大数据平台应具备哪些必备组件等。
本书适合Hadoop研发工程师、运维工程师以及数据仓库工程师阅读。 -
作者介绍
孙志伟,金山云数据平台架构师,专注于Hadoop生态和数据平台建设,曾就职于网易、转转等互联网公司。对大数据处理、分布式计算与数据采集有着浓厚的兴趣。一直从事Hadoop研发与运维工作,努力钻研技术并坚持分享。有着丰富的一线研发与运维经验,是多个社区的Contributor,积极活跃于开源社区。 硕士,毕业于华北电力大学。 -
目录
第1章 Hadoop
1.1 简介
1.1.1 Hadoop 1.0
1.1.2 Hadoop 2.0
1.2 Hadoop 3.0
1.3 阅读Hadoop源码
1.3.1 单元测试
1.3.2 断点调试代码
1.4 小结
第2章 HDFS
2.1 HDFS简介
2.2 解析NameNode中的元数据及其内存结构
2.2.1 解析NameNode中的元数据
2.2.2 解析NameNode的内存结构
2.3 解析NameNode的HA功能
2.3.1 基于QJM的HA
2.3.2 故障转移
2.3.3 多NameNode模式
2.4 HDFS的Federation
2.4.1 基于viewfs的Federation
2.4.2 基于Router的Federation
2.5 纠删码
2.5.1 纠删码的原理
2.5.2 HDFS EC
2.5.3 HDFS EC的实现
2.5.4 对比HDFS EC策略与三副本策略
2.6 下一代对象存储系统Ozone
2.6.1 Ozone初体验
2.6.2 Ozone架构
2.7 小结
第3章 YARN
3.1 YARN简介
3.2 解析ResourceManager的HA功能
3.2.1 故障转移
3.2.2 数据恢复
3.3 YARN Federation
3.3.1 架构
3.3.2 Router
3.3.3 State Store和Policy Store
3.3.4 AMRMProxy
3.3.5 跨子集群运行
3.4 中央调度器
3.4.1 Capacity调度器
3.4.2 Fair调度器
3.4.3 调度扩展
3.5 分布式调度器
3.5.1 分布式调度器的架构
3.5.2 opportunistic container
3.6 YARN Shared Cache
3.6.1 资源本地化
3.6.2 Shared Cache的架构
3.6.3 Shared Cache实例
3.7 小结
第4章 Application on YARN
4.1 MapReduce的简介
4.2 MapReduce的源码分析
4.2.1 InputSplit
4.2.2 环形缓冲区
4.2.3 溢写和归并
4.2.4 Shuffle
4.3 MapReduce on YARN
4.3.1 YARN的事件机制和状态机机制
4.3.2 MR ApplicationMaster
4.4 Applicationon YARN
4.5 小结
第5章 实战指南
5.1 Hadoop 3.x的部署
5.1.1 Hadoop 3.x HA的部署
5.1.2 Hadoop 3.x Federation的部署
5.2 Hadoop升级
5.2.1 Hadoop 2.0升级为Hadoop 3.0
5.2.2 Hadoop 3.0降级为Hadoop 2.0
5.2.3 升级/降级中遇到的问题
5.3 二次开发
5.3.1 与其他自研系统融合
5.3.2 自身功能扩展之自动识别修复后的数据盘
5.3.3 合并社区Patch
5.3.4 提交Pull Request
5.4 周边系统平台
5.4.1 任务调度平台
5.4.2 监控平台
5.4.3 集群诊断分析平台
5.5 小结
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...