-
内容大纲
HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统。利用HBase技术可以在廉价的PC服务器上搭建大规模的存储化集群,可以对数十亿级别的大数据进行实时性的高性能读写,在满足高性能的同时还保证了数据存取的原子性。
本书由浅入深地讲解HBase的概念、安装、配置、部署、高级用法、性能调优,内容既兼顾了初学者,也适用于想要深入学习HBase的读者。
本书适用于以前没有接触过HBase,或者对HBase有所了解并希望深入学习的读者,同时适用于HBase应用开发人员和系统管理人员。不管你是HBase新手还是HBase专家,相信都能从本书中有所收获。 -
作者介绍
-
目录
前言
第1章 大数据时代的必然产物——HBase
1.1 HBase的发展历程
1.2 HBase的特征
1.3 HBase的优缺点
1.3.1 HBase的优点
1.3.2 HBase的缺点
1.4 HBase与关系数据库的区别
1.5 使用HBase的时机
1.6 HBase的应用场景
1.7 HBase的数据模型
1.8 HBase的逻辑视图
第2章 HBase基本架构与快速入门
2.1 HBase基本架构
2.2 HBase分布式环境搭建
2.2.1 设置服务器名称
2.2.2 Hadoop单机安装
2.2.3 Hadoop集群安装
2.2.4 ZooKeeper集群安装
2.2.5 HBase集群安装
2.3 HBase容器化技术搭建
2.3.1 CentOS环境下安装Docker
2.3.2 Windows 10环境下安装Docker
2.3.3 利用Docker安装HBase
2.4 HBase快速入门
2.4.1 使用HBase Shell
2.4.2 使用create命令
2.4.3 使用alter命令
2.4.4 使用list命令
2.4.5 使用describe命令
2.4.6 使用put命令
2.4.7 使用get命令
2.4.8 使用scan命令
2.4.9 使用deleteall命令
第3章 HBase基本操作
3.1 help命令
3.2 常规命令
3.2.1 查询集群状态信息(status命令)
3.2.2 查看如何操作表(table_help命令)
3.2.3 查询HBase版本信息(version命令)
3.2.4 查看当前用户(whoami命令)
3.2.5 查看进程列表(processlist命令)
3.3 DDL命令
3.3.1 创建表(create命令)
3.3.2 修改表信息(alter命令)
3.3.3 异步修改表信息(alter_async命令)
3.3.4 获取表的详细信息(describe命令)
3.3.5 获取HBase中所有的表(list命令)
3.3.6 判断表是否存在(exists命令)
3.3.7 以对象的方式操作表(get_table命令)
3.3.8 启用表(enable命令)
3.3.9 启用所有满足正则表达式的表(enable_all命令)
3.3.10 判断表是否被启用(is_enabled命令)
3.3.11 禁用表(disable命令)
3.3.12 禁用所有满足正则表达式的表(disable_all命令)
3.3.13 判断表是否被禁用(is_disabled命令)
3.3.14 删除表(drop命令)
3.3.15 删除所有满足正则表达式的表(drop_all命令)
3.3.16 获取RowKey所在的区域(locate_region命令)
3.3.17 显示HBase支持的过滤器(show_filters命令)
3.4 命名空间
3.4.1 创建命名空间(create_namespace命令)
3.4.2 修改命名空间(alter_namespace命令)
3.4.3 获取命名空间详情(describe_namespace命令)
3.4.4 获取命名空间下所有表的名称(list_namespace_tables命令)
3.4.5 获取所有的命名空间(list_namespace命令)
3.4.6 删除命名空间(drop_namespace命令)
3.5 DML命令
3.5.1 新增或者修改数据(put命令)
3.5.2 全表扫描数据(scan命令)
3.5.3 获取表中数据的总行数(count命令)
3.5.4 获取表中的数据(get命令)
3.5.5 删除列族中的某个列(delete命令)
3.5.6 删除整行数据(delete命令)
3.5.7 列值自增(incr命令)
3.5.8 获取自增后的列值(get_counter命令)
3.5.9 获取表所对应的Region数量(get_splits命令)
3.5.10 清空整个表数据,不保留分区(truncat命令)
3.5.11 清空整个表数据,保留分区(truncat_preserve命令)
第4章 Java对接HBase
4.1 从“HelloWorld”开始
4.2 创建表
4.3 添加数据
4.4 批量添加数据
4.5 内容追加
4.6 修改数据
4.7 删除数据
4.8 批量删除
4.9 原子性操作
4.10 批量操作
4.11 自增
4.12 判断数据是否存在
4.13 代码封装
第5章 客户端API进阶
5.1 数据查询
5.2 数据扫描
5.3 过滤器快速实战
5.4 RowKey过滤器
5.5 RowKey前缀过滤器
5.6 RowKey模糊过滤器
5.7 列族过滤器
5.8 列过滤器
5.9 多列前缀过滤器
5.10 首次列键过滤器
5.11 列键过滤器
5.12 列值过滤器
5.13 单列值过滤器
5.14 列值排除过滤器
5.15 随机行过滤器
5.16 分页过滤器
5.17 多个过滤器综合查询
第6章 HBase批量加载
6.1 HBase批量加载简介
6.2 海量交易记录数据存储案例
6.2.1 案例开发准备工作
6.2.2 编写实体类
6.2.3 创建读取数据的Mapper类
6.2.4 编写驱动类
6.2.5 上传数据到HDFS
6.2.6 将导入的HDFS数据与HBase进行关联
第7章 协处理器
7.1 协处理器简介
7.2 协处理器分类
7.3 Coprocessor接口
7.4 协处理器的加载
7.4.1 使用配置文件加载
7.4.2 从表描述器中加载
7.5 RegionObserver类
7.5.1 Region状态
7.5.2 处理客户端API事件
7.6 自定义Observer案例
第8章 Phoenix在HBase中的整合应用
8.1 Phoenix简介
8.2 安装Phoenix
8.2.1 下载
8.2.2 安装
8.3 连接Phoenix
8.4 Phoenix快速入门
8.4.1 创建表
8.4.2 删除表
8.4.3 插入数据
8.4.4 分页查询
第9章 HBase架构原理解析
9.1 HBase架构原理
9.1.1 RegionServer流程解析
9.1.2 StoreFile和HFile结构
9.1.3 MemStore和StoreFile
9.2 HBase写流程
9.3 HBase读流程
9.4 HBase如何进行增删改查
9.5 数据刷写
9.5.1 刷写操作的触发时机
9.5.2 刷写流程
9.6 数据合并
9.7 数据拆分
第10章 HBase性能优化
10.1 表设计优化
10.1.1 预分区
10.1.2 RowKey设计优化
10.1.3 列族数量优化
10.1.4 版本优化
10.2 HBase提升写效率
10.3 MemStore调优
10.4 合并调优
10.5 WAL调优
10.6 HBase读取优化
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...