欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Spark大数据开发与应用案例(视频教学版)/大数据技术丛书
      • 作者:段海涛//杨忠良//余辉|责编:夏毓彦
      • 出版社:清华大学
      • ISBN:9787302703280
      • 出版日期:2025/10/01
      • 页数:396
    • 售价:43.6
  • 内容大纲

        本书在培训机构的教学实践中历经8年锤炼而成,以简明清晰且易于理解的方式,全面覆盖Spark集群构建、Spark Core、Spark SQL、Spark实战案例以及面试问答等内容。为增强读者的学习体验,本书配套丰富的电子资源,包括示例源码、PPT教学课件、集群环境、教学视频以及作者微信群答疑服务。
        本书精心编排为15章,内容包括Spark简介、Spark集群环境部署、Spark编程体验、RDD深度解读、RDD的Shuffle详解、Spark共享变量、Spark序列化和线程安全、Spark内存管理机制、Spark SQL简介、Spark SQL抽象编程详解、Spark SQL自定义函数、Spark SQL源码解读、Spark性能调优、Spark实战案例、Spark面试题。
        本书不仅适合Spark初学者快速入门,也有助于大数据分析人员及大数据应用开发人员进一步提升技能。同时,本书也可以作为高等院校或高职高专院校Spark大数据技术课程的教材。
  • 作者介绍

  • 目录

    第1章  Spark简介
      1.1  Spark概念及其特点
      1.2  Spark技术生态系统
      1.3  Spark运行模式
      1.4  Spark执行流程
      1.5  Spark专有名词
      1.6  本章小结
    第2章  Spark集群环境部署
      2.1  VM虚拟机安装
      2.2  Ubuntu 22.04系统安装
      2.3  Ubuntu 22.04网络配置
      2.4  Ubuntu 22.04环境配置
      2.5  ZooKeeper安装
      2.6  Hadoop安装
        2.6.1  下载并解压
        2.6.2  配置系统环境变量
        2.6.3  配置核心文件
        2.6.4  分发Hadoop
        2.6.5  启动和验证
      2.7  Spark安装
        2.7.1  下载和解压
        2.7.2  配置系统环境变量
        2.7.3  配置核心文件
        2.7.4  分发Spark
        2.7.5  Spark启动及UI界面查看
        2.7.6  spark-shell启动验证
      2.8  集群和代码下载
      2.9  本章小结
    第3章  Spark编程体验
      3.1  Scala基础编程
        3.1.1  基本语法
        3.1.2  函数和方法
        3.1.3  控制语句
        3.1.4  函数式编程
        3.1.5  类和对象
        3.1.6  Scala异常处理
        3.1.7  Trait(特征)
        3.1.8  Scala文件I/O
        3.1.9  Scala练习题
      3.2  Spark创建项目
      3.3  Spark程序编写与运行方法
      3.4  本章小结
    第4章  RDD深度解读
      4.1  RDD的概念及特点
        4.1.1  RDD的特点
        4.1.2  RDD的算子分类
        4.1.3  RDD创建方法
      4.2  RDD的血缘和依赖
        4.2.1  血缘与依赖的概念
        4.2.2  Dependency依赖关系

      4.3  RDD的Transformation算子
      4.4  RDD的Action算子
      4.5  RDD的特殊算子
        4.5.1  cache和persist
        4.5.2  checkpoint
      4.6  RDD转换算子的惰性
        4.6.1  Scala迭代器Iterator接口
        4.6.2  Scala迭代器Lazy特性及原理
      4.7  模拟Spark自定义RDD
      4.8  Spark任务执行原理图解分析
      ……
    第5章  RDD的Shuffle详解
    第6章  Spark共享变量
    第7章  Spark序列化和线程安全
    第8章  Spark内存管理机制
    第9章  Spark SQL简介
    第10章  Spark SQL抽象编程详解
    第11章  Spark SQL自定义函数
    第12章  Spark SQL源码解读
    第13章  Spark性能调优
    第14章  Spark实战案例
    第15章  Spark面试题