-
内容大纲
本书在培训机构的教学实践中历经8年锤炼而成,以简明清晰且易于理解的方式,全面覆盖Spark集群构建、Spark Core、Spark SQL、Spark实战案例以及面试问答等内容。为增强读者的学习体验,本书配套丰富的电子资源,包括示例源码、PPT教学课件、集群环境、教学视频以及作者微信群答疑服务。
本书精心编排为15章,内容包括Spark简介、Spark集群环境部署、Spark编程体验、RDD深度解读、RDD的Shuffle详解、Spark共享变量、Spark序列化和线程安全、Spark内存管理机制、Spark SQL简介、Spark SQL抽象编程详解、Spark SQL自定义函数、Spark SQL源码解读、Spark性能调优、Spark实战案例、Spark面试题。
本书不仅适合Spark初学者快速入门,也有助于大数据分析人员及大数据应用开发人员进一步提升技能。同时,本书也可以作为高等院校或高职高专院校Spark大数据技术课程的教材。 -
作者介绍
-
目录
第1章 Spark简介
1.1 Spark概念及其特点
1.2 Spark技术生态系统
1.3 Spark运行模式
1.4 Spark执行流程
1.5 Spark专有名词
1.6 本章小结
第2章 Spark集群环境部署
2.1 VM虚拟机安装
2.2 Ubuntu 22.04系统安装
2.3 Ubuntu 22.04网络配置
2.4 Ubuntu 22.04环境配置
2.5 ZooKeeper安装
2.6 Hadoop安装
2.6.1 下载并解压
2.6.2 配置系统环境变量
2.6.3 配置核心文件
2.6.4 分发Hadoop
2.6.5 启动和验证
2.7 Spark安装
2.7.1 下载和解压
2.7.2 配置系统环境变量
2.7.3 配置核心文件
2.7.4 分发Spark
2.7.5 Spark启动及UI界面查看
2.7.6 spark-shell启动验证
2.8 集群和代码下载
2.9 本章小结
第3章 Spark编程体验
3.1 Scala基础编程
3.1.1 基本语法
3.1.2 函数和方法
3.1.3 控制语句
3.1.4 函数式编程
3.1.5 类和对象
3.1.6 Scala异常处理
3.1.7 Trait(特征)
3.1.8 Scala文件I/O
3.1.9 Scala练习题
3.2 Spark创建项目
3.3 Spark程序编写与运行方法
3.4 本章小结
第4章 RDD深度解读
4.1 RDD的概念及特点
4.1.1 RDD的特点
4.1.2 RDD的算子分类
4.1.3 RDD创建方法
4.2 RDD的血缘和依赖
4.2.1 血缘与依赖的概念
4.2.2 Dependency依赖关系
4.3 RDD的Transformation算子
4.4 RDD的Action算子
4.5 RDD的特殊算子
4.5.1 cache和persist
4.5.2 checkpoint
4.6 RDD转换算子的惰性
4.6.1 Scala迭代器Iterator接口
4.6.2 Scala迭代器Lazy特性及原理
4.7 模拟Spark自定义RDD
4.8 Spark任务执行原理图解分析
……
第5章 RDD的Shuffle详解
第6章 Spark共享变量
第7章 Spark序列化和线程安全
第8章 Spark内存管理机制
第9章 Spark SQL简介
第10章 Spark SQL抽象编程详解
第11章 Spark SQL自定义函数
第12章 Spark SQL源码解读
第13章 Spark性能调优
第14章 Spark实战案例
第15章 Spark面试题
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
