-
内容大纲
本书以Hadoop 3.x及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解VMware中Centos 7操作系统的安装;第2章讲解操作系统集群环境的配置;第3~16章讲解Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统F1ume、Kafka、storm、Spark以及分布式搜索系统E1asticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过案例演示了各个框架的实际应用。读者即使没有任何大数据基础,通过阅读本书,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。
本书通俗易懂,内容丰富,适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读,也可作为培训机构和大专院校大数据专业课程的教学用书。 -
作者介绍
-
目录
第1章 VMware中安装CentOS
1.1 下载CentOS 7镜像文件
1.2 新建虚拟机
1.3 安装操作系统
1.4 动手练习
第2章 CentOS 7集群环境配置
2.1 系统环境配置
2.1.1 新建用户
2.1.2 修改用户权限
2.1.3 关闭防火墙
2.1.4 设置固定IP
2.1.5 修改主机名
2.1.6 新建资源目录
2.2 安装JDK
2.3 克隆虚拟机
2.4 配置主机IP映射
2.5 动手练习
第3章 Hadoop
3.1 Hadoop简介
3.1.1 Hadoop生态系统架构
3.1.2 Hadoop不同版本架构对比
3.2 YARN基本架构及组件
3.3 YARN工作流程
3.4 配置集群各节点SSH无密钥登录
3.4.1 无密钥登录原理
3.4.2 无密钥登录操作步骤
3.5 搭建Hadoop 3.x分布式集群
3.6 动手练习
第4章 HDFS
4.1 HDFS简介
4.1.1 设计目标
4.1.2 总体架构
4.1.3 主要组件
4.1.4 文件读写
4.2 HDFS命令行操作
4.3 HDFS Web界面操作
4.4 HDFS Java API操作
4.4.1 读取数据
4.4.2 创建目录
4.4.3 创建文件
4.4.4 删除文件
4.4.5 遍历文件和目录
4.4.6 获取文件或目录的元数据
4.4.7 上传本地文件
4.4.8 下载文件到本地
4.5 动手练习
第5章 MapReduce
5.1 MapReduce简介
5.1.1 设计思想
5.1.2 任务流程
5.1.3 工作原理
5.2 MapReduce程序编写步骤
5.3 案例分析:单词计数
……
第6章 ZooKeeper
第7章 HDFS与YARN HA
第8章 HBase
第9章 Hive
第10章 Sqoop
第11章 Kafka
第12章 Flume
第13章 Storm
第14章 Elasticsearch
第15章 Scala
第16章 Spark
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...