-
内容大纲
本书以项目任务为载体串联知识与技能,介绍基于Spark SQL技术的大数据分析方法,培养学习者使用Spark SQL技术解决实际数据分析问题的能力,主要内容有大数据分析概述、实践环境准备、学生信息处理分析、房产大数据分析与探索、电商大数据分析与探索、Zepplin数据可视化。在实现任务的过程中详细阐述了Scala语言基础、Spark SQL编程分析、Spark SQL数据分析与探索、数据可视化等知识。
本书适合作为高等职业院校计算机、大数据、人工智能及相关专业的教材或参考书,也可以作为数据分析人员的参考书。 -
作者介绍
-
目录
第1章 大数据分析概述
任务1.1 关于大数据分析
情境导入
学习目标和要求
1.1.1 什么是大数据分析
1.1.2 大数据分析工具
1.1.3 大数据分析可视化
任务1.2 认识SparkSQL
情境导入
学习目标和要求
1.2.1 SparkSQL的背景简介
1.2.2 SparkSQL的运行原理
脑图小结
章节练习
第2章 实践环境准备
任务2.1 Hadoop集群环境搭建
情境导入
学习目标和要求
2.1.1 环境准备
2.1.2 安装Hadoop
2.1.3 启动Hadoop集群
2.1.4 运行经典案例wordcount
任务2.2 Spark集群部署与使用
情境导入
学习目标和要求
2.2.1 安装Spark
2.2.2 启动Spark
2.2.3 Spark集群
任务2.3 安装Scala
情境导入
学习目标和要求
2.3.1 下载Scala安装包
2.3.2 Scala安装配置
脑图小结
章节练习
第3章 学生信息处理分析
任务3.1 班级基本情况分析
情境导入
学习目标和要求
3.1.1 学生所属班级和男女生数量
3.1.2 以班级为单位整理学生信息
任务3.2 学生基本情况分析
情境导入
学习目标和要求
3.2.1 学生特长情况分析
3.2.2 学生成绩情况分析
脑图小结
章节练习
第4章 房产大数据分析与探索
任务4.1 某房产公司销售人员业绩分析
情境导入
学习目标和要求
4.1.1 数据集处理
4.1.2 数据操作分析
任务4.2 某城市近年房产销售状况分析
情境导入
学习目标和要求
4.2.1 数据准备
4.2.2 数据探索与分析
4.2.3 总结分析
脑图小结
章节练习
第5章 电商大数据分析与探索
任务5.1 “女装电子商务评论”数据分析
情境导入
学习目标和要求
5.1.1 数据准备
5.1.2 数据清洗
5.1.3 数据转换
5.1.4 数据分析
5.1.5 数据输出
任务5.2 “在线销售订单”数据分析
情境导入
学习目标和要求
5.2.1 数据查询操作
5.2.2 数据分析探索
脑图小结
章节练习
第6章 Zeppelin数据可视化
任务6.1 Zeppelin安装与部署
情境导入
学习目标和要求
6.1.1 下载安装包
6.1.2 安装配置
6.1.3 运行Zeppelin
任务6.2 “女装电子商务评论”数据可视化
情境导入
学习目标和要求
6.2.1 加载数据注册视图
6.2.2 执行SQL数据可视化
任务6.3 “在线销售订单”数据可视化
情境导入
学习目标和要求
执行SparkSQL数据可视化
脑图小结
章节练习
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...