-
内容大纲
本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoop和Flume、数据分发工具Kafka、MapReduce计算框架与应用、基于内存的计算框架Spark、Spark的安装与应用、机器学习、基于Hive的交互式数据处理、数据同步工具与数据可视化和推荐算法与应用。本书在介绍Hadoop、HBase、Sqoop和Flume、MapReduce、Hive和Spark等相关章节时安排了入门级实验,且以电子资源的方式提供给学生,以便读者更好地学习和掌握大数据的关键技术。
本书可以作为高等院校计算机类、信息管理与信息系统等相关专业的大数据课程教材,也可供从事大数据技术开发、研究和应用的研究人员和工程技术人员参考。 -
作者介绍
-
目录
第1篇 大数据基础
第1章 大数据概述
1.1 大数据简介
1.1.1 数据及大数据分类
1.1.2 大数据的基本定义
1.2 大数据的特性
1.2.1 大数据时代
1.2.2 大数据的“4V”特性
1.3 大数据生态系统
1.3.1 大数据主要平台
1.3.2 大数据生态架构
1.4 大数据的应用
1.4.1 应用案例
1.4.2 大数据应用的特点
1.5 本章小结
思考与练习
第2章 Linux集群
2.1 计算机集群
2.1.1 集群的概念
2.1.2 集群的种类与特点
2.2 Linux操作系统
2.2.1 Linux特点与主要组成
2.2.2 Linux目录结构
2.3 Linux集群搭建
2.3.1 安装VMware虚拟机
2.3.2 安装CentOS
2.3.3 集群的配置
2.4 Linux命令
2.5 本章小结
思考与练习
第2篇 大数据存储
第3章 分布式文件系统HDFS
3.1 Hadoop与HDFS概述
3.1.1 Hadoop
3.1.2 HDFS
3.2 HDFS系统架构
3.2.1 系统架构概览
3.2.2 组件功能
3.3 数据存储
3.3.1 数据分块
3.3.2 机架感知
3.3.3 存储策略
3.4 文件操作过程
3.4.1 读文件
3.4.2 写文件
3.5 YARN概述
3.5.1 YARN
3.5.2 工作流程
3.6 本章小结
思考与练习
第4章 HDFS的安装与基本应用
4.1 HDFS的安装与配置
4.1.1 安装
4.1.2 配置
4.2 用户配置
4.2.1 编辑环境变量
……
第3篇 大数据采集
第4篇 大数据计算
第5篇 大数据应用
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...