-
内容大纲
本书介绍了多种数据库管理系统的基本概念以及代表性数据库管理系统的使用和优化方法,覆盖了传统的关系数据库、数据仓库,以及列族、键值、文档、图等NoSQL数据库系统。通过阅读本书,读者可以较全面地了解支撑大数据应用所需的数据库管理系统的概念、特征和相关技术,并且可以学习代表性关系数据库系统的使用方法,将理论和实际相结合。
本书可作为大数据相关专业本科生和研究生教材,也可供从事大数据相关工作的工程技术人员参考使用。 -
作者介绍
-
目录
本书编委会
前言
第1章 绪论
1.1 大数据的基本概念
1.2 数据库管理系统
1.2.1 数据库管理系统的基本概念
1.2.2 数据库管理系统的发展历史
1.2.3 数据库管理系统的要素
1.3 大数据对数据库管理系统的需求和挑战
1.4 本书结构
第2章 关系型数据库管理系统
2.1 关系数据库概述
2.1.1 关系模型
2.1.2 关系数据的存储
2.1.3 关系数据库的索引
2.1.4 关系数据库中的查询处理算法
2.1.5 并发控制
2.1.6 数据库恢复
2.2 关系数据库MySQL概述
2.3 MySQL应用
2.3.1 SQL概述
2.3.2 数据定义语句
2.3.3 数据处理语句
2.3.4 事务和锁定声明
2.3.5 其他
2.4 存储过程
2.4.1 概述
2.4.2 建立存储过程
2.4.3 调用存储过程
2.4.4 查询存储过程
2.4.5 删除存储过程
2.5 视图
2.6 分区
2.7 复制
2.8 MySQL的Java客户端JDBC
2.8.1 JDBC概述
2.8.2 JDBCAPI
2.8.3 Java通过JDBCAPI操作MySQL
第3章 数据仓库Hive
3.1 数据仓库概述
3.1.1 数据仓库的概念和特征
3.1.2 数据仓库的体系结构
3.1.3 数据仓库的模型
3.1.4 数据仓库关键技术
3.1.5 数据仓库与大数据
3.2 Hive概述
3.2.1 Hive存储结构
3.2.2 Hive体系结构
3.2.3 Hive的任务执行流程
3.3 Hive的特征
3.3.1 一致性
3.3.2 可扩展性
3.3.3 事务
3.4 Hive的基本概念
3.4.1 基本数据类型
3.4.2 数据类型转换
3.4.3 复杂数据类型
3.4.4 文本文件数据编码
3.4.5 数据读取模式
3.4.6 文件格式与压缩
3.4.7 Hive压缩
3.4.8 Hive关键字
3.5 Hive的使用
3.5.1 Hive命令
3.5.2 HiveDDL
3.5.3 HiveDML
3.5.4 HiveQL基本查询
3.5.5 Hive函数
3.5.6 HiveQL高级查询
3.6 面向大数据的优化策略
3.6.1 分桶
3.6.2 视图和索引
3.6.3 模式设计
3.7 Hive的调优
3.7.1 使用EXPLAIN查看执行计划
3.7.2 Hive配置管理
3.7.3 限制调整
3.7.4 JOIN优化
3.7.5 本地模式
3.7.6 并行执行
3.7.7 严格模式
3.7.8 调整Mapper和Reducer个数
3.7.9 JVM重用
3.7.10 动态分区调整
3.7.11 推测执行
3.7.12 单个MapReduce中的多个GROUPBY
3.7.13 虚拟列
3.8 Java通过JDBC操作Hive
第4章 NoSQL概述
4.1 NoSQL与非关系型数据库
4.2 NoSQL数据模型
4.2.1 键值数据库
4.2.2 文档数据库
4.2.3 列族数据库
4.2.4 图数据库
4.2.5 四者对比
4.3 NoSQL数据库中的事务
4.3.1 CAP理论
4.3.2 BASE原则
4.3.3 一致性协议
4.4 NoSQL关键技术
4.4.1 NoSQL的技术原则
4.4.2 存储技术
4.4.3 数据划分技术
4.4.4 索引技术
第5章 键值数据库
5.1 模型结构
5.2 特征
5.2.1 一致性
5.2.2 可扩展性
5.2.3 事务
5.3 关键技术
5.3.1 索引技术
5.3.2 查询支持
5.4 Redis
5.4.1 Redis数据类型
5.4.2 Redis的持久化
5.4.3 Redis事务
5.4.4 Redis的发布订阅
5.4.5 Redis的主从复制
5.5 Redis的Java客户端Jedis
5.5.1 Jedis所需要的jar包
5.5.2 Jedis常用操作
5.5.3 Jedis Pool
第6章 列族数据库
6.1 模型结构
6.2 特征
6.2.1 一致性
6.2.2 可用性
6.2.3 可扩展性
6.3 HBase应用
6.3.1 HBase数据模型
6.3.2 HBase体系结构
6.3.3 HBase基本Shell操作
6.3.4 HBase压缩
6.3.5 可用客户端Java
6.4 架构与设计
6.4.1 表设计规则
6.4.2 RowKey设计
6.4.3 列族的数量
6.4.4 版本的数量
6.5 HBase集成
6.5.1 HBase与Hive集成
6.5.2 MapReduce与HBase互操作
第7章 非关系型文档数据库
7.1 模型结构
7.2 特征
7.2.1 一致性
7.2.2 可扩展性
7.2.3 事务
7.2.4 可用性
7.3 MongoDB
7.3.1 概述
7.3.2 Mongo Shell
7.3.3 MongoDB基本操作
7.3.4 索引
7.3.5 副本集
7.3.6 分片
7.4 MongoDB的Java客户端
7.4.1 MongoDB驱动包的获得
7.4.2 Java操作举例
第8章 非关系型图数据库
8.1 图数据库
8.1.1 图模型的模型和定义
8.1.2 图数据库的应用
8.1.3 图管理的关键技术
8.2 Neo4j概述
8.2.1 Neo4j的特点
8.2.2 Neo4j的数据模型
8.2.3 Neo4j关键技术
8.3 Neo4j的应用
8.3.1 使用嵌入在Java应用程序中的Neo4j
8.3.2 Neo4j的Java客户端环境配置
8.3.3 一个简单的小型图数据库例子
8.3.4 属性值
8.3.5 带索引的用户数据库
8.4 Neo4j的优化
8.4.1 索引
8.4.2 批量导入/导出
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...