欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Spark应用开发技术项目教程(Scala版高等学校大数据工程技术专业创新与实践系列教材)
      • 作者:编者:李静//赵庆|责编:苏东方
      • 出版社:清华大学
      • ISBN:9787302698111
      • 出版日期:2025/10/01
      • 页数:273
    • 售价:23.6
  • 内容大纲

        本书是一本针对Spark大数据分析平台的应用开发实践指南,旨在为读者提供一套完整的学习和实战路径,从而深入理解和掌握Spark的各个核心模块及其在实际项目中的应用。本书通过详细的项目导向学习方式,结合实际任务和案例分析,引导读者逐步掌握Spark应用开发的技术细节。
        本书共8个项目,涵盖Spark的各个重要组件,包括认识Spark、Scala语法应用、Spark Core数据分析、Spark SQL结构化数据处理、Spark流式数据处理、Spark结构化流式处理、Spark机器学习应用、社交软件运营数据分析,逐步提升读者的技术水平和应用能力。每个项目由多个任务组成,通过任务提出、任务分析、知识准备、任务实现、任务总结、巩固练习和任务拓展的模块化结构,帮助读者系统化地掌握Spark应用开发的技术框架和核心概念。
        本书适合作为高等学校本科数据科学与大数据技术专业教材,也适合作为高职本科、高职专科相关课程教材,还可以作为Spark开发初学者和中级开发人员的参考用书,帮助读者快速掌握Spark编程技术,提升在大数据分析和机器学习领域的实际能力。
  • 作者介绍

  • 目录

    项目1 认识Spark
      任务1 搭建Spark环境
        【任务提出】
        【任务分析】
        【知识准备】
          1.1 认识Spark
          1.1.1 Spark内置模块
          1.1.2 Spark运行模式
          1.2 Spark安装
        【任务实现】
        【任务总结】
        【巩固练习】
        【任务拓展】
      任务2 Spark程序运行
        【任务提出】
        【任务分析】
        【知识准备】
          1.3 Spark集群架构及运行原理
          1.4 Spark作业运行流程
          1.4.1 Spark本地模式
          1.4.2 Spark独立模式
          1.4.3 Spark-on-Yarn模式
          1.5 Spark RDD及核心原理
        【任务实现】
        【任务总结】
        【巩固练习】
        【任务拓展】
    项目2 Scala语法应用
      任务1 安装Scala
        【任务提出】
        【任务分析】
        【知识准备】
          2.1 了解Scala
          2.2 编程范式
        【任务实现】
        【任务总结】
        【巩固练习】
        【任务拓展】
      任务2 管理购物清单
        【任务提出】
        【任务分析】
        【知识准备】
          2.3 基本语法
          2.3.1 基本数据类型
          2.3.2 变量和常量
          2.3.3 运算符
          2.4 集合类型之数组
          2.5 程序结构控制
          2.5.1 判断结构
          2.5.2 循环结构

          2.6 函数
          2.6.1 匿名函数
          2.6.2 高阶函数
        【任务实现】
        【任务总结】
        【巩固练习】
        【任务拓展】
      任务3 分析图书馆借阅记录
        【任务提出】
        【任务分析】
        【知识准备】
          2.7 其他集合类型
          2.7.1 列表
          2.7.2 集合
      ……
    项目3 Spark Core数据分析
    项目4 Spark SQL结构化数据处理
    项目5 Spark流式数据处理
    项目6 Spark结构化流式处理
    项目7 Spark机器学习应用
    项目8 社交软件运营数据分析