欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Spark大数据分析与实战(第2版高等职业教育大数据技术专业系列教材)
      • 作者:编者:郑述招|责编:高樱
      • 出版社:西安电子科大
      • ISBN:9787560674858
      • 出版日期:2025/01/01
      • 页数:279
    • 售价:24
  • 内容大纲

        本书由教学与科研经验丰富的专任教师、企业资深工程师、全国职业技能大赛一等奖获得者共同编写。书中依据“项目引领、任务驱动”的思路,针对数据批量处理、流式处理、机器学习等Spark典型应用情境,设计了8个教学项目,涵盖Spark Core、Spark SQL、Spark Streaming、Structured Streaming、Spark Machine Learning等技术。其中每个项目细分为3~6个子任务,以保证技能提升的“平滑性”,契合初学者的认知规律。本书内容由浅入深,由实践到理论,再从理论回到实践,符合初学者的学习规律。同时,编者为了践行立德树人的时代担当,将思政元素有机融入项目教学,让读者在完成拓展项目的同时提升个人素养。
        本书配套了微课视频、PPT课件、程序代码、数据集、教案、教学日历、考试样题、课程标准(大纲)等全套教学资源,以利于教师的教学。为了最大限度降低学习门槛,本书还提供了基于Linux的Spark虚拟机环境,可免去读者配置环境的烦恼。
        本书可作为高等职业院校、应用型本科院校大数据相关课程的配套教材,也可作为Spark学习者的参考用书。
  • 作者介绍

  • 目录

    项目1  搭建Spark开发环境
      情境导入
      项目分解
      学习目标
      任务1.1  拥抱大数据时代
        任务分析
        知识储备
        1.1.1  大数据时代已然来临
        1.1.2  大数据来自哪里
        1.1.3  大数据的处理过程
        任务实施
      任务1.2  搭建Hadoop基础平台
        任务分析
        知识储备
        1.2.1  认识Hadoop生态圈
        1.2.2  Hadoop环境的搭建
        1.2.3  Hadoop平台初步体验
        任务实施
      任务1.3  部署Spark计算平台
        任务分析
        知识储备
        1.3.1  初识Spark
        1.3.2  Spark的运行过程
        1.3.3  Spark与Hadoop的比较
        1.3.4  Spark计算平台的部署
        1.3.5  本书配套虚拟机的使用
        任务实施
      项目小结
      知识检测
      素养与拓展
    项目2  编写Scala程序处理新能源汽车销售数据
      情境导入
      项目分解
      学习目标
      任务2.1  Scala的安装与体验
        任务分析
        知识储备
        2.1.1  Scala简介
        2.1.2  Scala的安装
        2.1.3  编写第一个Scala程序
        任务实施
      任务2.2  分析某电动汽车的市场地位
        任务分析
        知识储备
        2.2.1  数据类型与变量
        2.2.2  运算符
        2.2.3  if条件语句
        2.2.4  Scala中的函数
        任务实施
      任务2.3  统计某汽车品牌的销量

        任务分析
        知识储备
        2.3.1  数组的基本用法
        2.3.2  循环结构
        2.3.3  字符串的处理
        2.3.4  读取文件的内容
        任务实施
      任务2.4  计算某热门车型的月均销量
        任务分析
        知识储备
        2.4.1  元组
        2.4.2  列表List
        2.4.3  集合Set
        2.4.4  Map映射
        2.4.5  高阶函数
        任务实施
      任务2.5  计算各大品牌的市场占有率
        任务分析
      ……
    项目3  使用Spark RDD分析车辆违章记录
    项目4  IDEA开发环境下分析碳排放数据
    项目5  Spark SQL处理健康监测数据
    项目6  Spark Streaming处理用户行为数据
    项目7  基于Structured Streaming的智慧交通数据处理
    项目8  借助Spark ML预测森林植被种类
    参考文献