-
内容大纲
本书系统地介绍了大数据技术的原理与应用,主要内容包括绪论、分布式计算编程基础,大数据处理框架Hadoop,Hadoop分布式文件系统、分布式数据库HBase、分布式计算框架MapReduce,数据仓库Hive,Spark Streaming、数据可视化、基于大数据的电商精准营销、好友推荐案例分析等。本书用简单易懂的语言,生动有趣的实例和图形展示知识点,将概念、隙理与应用融会贯通,并对大数据工具软件进行了细致的梳理。
本书适合大数据应用行业的技术人员阅读,也可作为高等学校相关专业的教学用书。 -
作者介绍
-
目录
第1章 绪论
1.1 大数据的发展历程
1.2 大数据的概念
1.3 大数据的特征
1.4 大数据的应用
1.5 大数据分析方法
1.6 大数据面临的挑战
习题
第2章 分布式计算编程基础
2.1 分布式系统
2.2 分布式计算架构
2.3 分布式文件系统
2.4 CAP定理
习题
第3章 大数据处理框架Hadoop
3.1 Hadoop简介
3.2 Hadoop生态系统
3.3 Hadoop的安装与使用
习题
第4章 Hadoop分布式文件系统
4.1 HDFS简介
4.2 HDFS的设计原则
4.3 HDFS的核心概念
4.4 HDFS的体系结构
4.5 HDFS的存储原理
4.6 HDFS的数据读写流程
4.7 HDFS的编程实现
习题
第5章 分布式数据库HBase
5.1 HBase简介
5.2 HBase数据模型
5.3 HBase的系统架构
5.4 HBase表结构设计
5.5 HBase的数据读写流程
5.6 HBase编程实践
习题
第6章 分布式计算框架MapReduce
6.1 MapReduce简介
6.2 MapReduce的计算模型
6.3 MapReduce的工作原理
6.4 MapReduce编程实践
习题
第7章 数据仓库Hive
7.1 Hive简介
7.2 Hive的架构
7.3 Hive的数据类型及应用
7.4 Hive的数据模型
7.5 DDL的应用
7.6 DML的应用
7.7 JDBC访问
习题
第8章 Spark Streaming
8.1 流计算概述
8.2 流计算的概念
8.3 Spark概述
8.4 Spark Standalone模式的架构
8.5 Spark Streaming简介
8.6 编写Spark Streaming程序的基本步骤
8.7 创建Streaming Context对象
8.8 Spark Streaming数据源
8.9 Spark Streaming程序示例
习题
第9章 数据可视化
9.1 可视化概述
9.2 可视化的作用
9.3 可视化工具
9.4 可视化典型案例
习题
第10章 基于大数据的电商精准营销
10.1 数据预处理概述
10.2 数据探索与可视化
第11章 好友推荐案例分析
11.1 任务需求
11.2 准备工作
11.3 创建Maven项目
11.4 FriendRecommend程序的实现
11.5 运行程序与结果验证
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
