-
内容大纲
本书从大数据的概念和特征开始讲起,首先让读者对大数据有一个感性的认识;然后结合大数据平台的各个模块,详细介绍了大数据的存储、处理、分析、可视化等方面的原理和操作;最后介绍了大数据在各行业中的应用,让读者更加充分地感受到大数据技术的优势,以及大数据应用的价值。本书适合高等院校相关专业的学生使用,也适合参加大数据技术培训课程的人员使用,还可以作为从事ICT行业相关工作的人员和大数据技术爱好者的参考书。 -
作者介绍
-
目录
第1章 大数据概述
1.1 大数据的概念与价值
1.1.1 大数据的基本概念
1.1.2 大数据的来源
1.1.3 大数据的价值
1.1.4 挖掘企业大数据价值的方式
1.2 大数据的关键技术
1.2.1 大数据采集、预处理、存储与管理
1.2.2 大数据分析与挖掘
1.2.3 大数据可视化
1.3 大数据产业
1.3.1 数据提供
1.3.2 技术提供
1.3.3 服务提供
1.4 大数据应用场景
1.5 本章总结
练习题
第2章 Hadoop大数据处理平台
2.1 Hadoop平台概述
2.1.1 Hadoop起源及发展
2.1.2 Hadoop特性
2.1.3 Hadoop应用现状
2.1.4 Hadoop版本及相关平台
2.2 Hadoop生态系统
2.2.1 HDFS和HBase
2.2.2 MapReduce和YARN
2.2.3 Hive
2.2.4 Sqoop和Flume
2.2.5 ZooKeeper和Oozie
2.2.6 Kerberos和LDAP
2.2.7 Impala和Solr
2.2.8 Kafka
2.3 Hadoop安装部署
2.3.1 Hadoop规划部署
2.3.2 Hadoop的安装方式
2.4 华为FusionInsight HD安装部署
2.4.1 FusionInsight HD简介
2.4.2 FusionInsight HD集成设计
2.4.3 FusionInsight HD安装部署
2.4.4 FusionInsight HD重要参数配置
2.5 本章总结
练习题
第3章 HDFS
3.1 概述
3.1.1 DFS的概念与作用
3.1.2 HDFS概述
3.2 HDFS的相关概念
3.2.1 HDFS块
3.2.2 NameNode
3.2.3 Secondary NameNode
3.2.4 DataNode
3.3 HDFS体系架构与原理
3.3.1 HDFS体系架构
3.3.2 HDFS的高可用机制
3.3.3 HDFS的目录结构
3.3.4 HDFS的数据读写过程
3.4 HDFS接口及其在FusionInsight HD编程中的实践
3.4.1 HDFS常用的Shell命令
……
第4章 MapReduce和YARN
第5章 HBase
第6章 Hive
第7章 Sqoop和Loader
第8章 Flume
第9章 Spark
第10章 大数据流计算
第11章 数据可视化
第12章 大数据行业应用
术语表
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...