-
内容大纲
本书以电商网站中的用户行为数据作为数据源,系统地介绍了如何使用Spark生态系统进行大数据离线分析和实时分析的方法。全书共7章,分别讲解了项目需求、项目架构、项目实现流程、大数据集群环境搭建、热门品类Top10分析、各区域热门商品Top3分析、网站转化率统计、广告点击流实时统计和使用FineBI实现数据可视化。
本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。
本书适合作为高等教育本科和专科的数据科学与大数据技术及相关专业的教材,也适合数据分析、数据可视化等领域的从业者阅读。 -
作者介绍
-
目录
第1章 项目概述
1.1 项目需求和目标
1.2 预备知识
1.3 项目架构
1.4 开发环境和工具
1.5 项目开发流程
1.6 硬件要求
1.7 本章小结
第2章 搭建大数据集群环境
2.1 基础环境搭建
2.1.1 创建虚拟机
2.1.2 安装Linux操作系统
2.1.3 克隆虚拟机
2.1.4 配置虚拟机
2.2 安装JDK
2.3 部署ZooKeeper集群
2.4 部署Hadoop集群
2.5 部署Spark
2.6 部署HBase集群
2.7 部署Kafka集群
2.8 本章小结
第3章 热门品类Top10分析
3.1 数据集分析
3.2 实现思路分析
3.3 实现热门品类Top10分析
3.3.1 环境准备
3.3.2 实现Spark程序
3.3.3 数据持久化
3.4 运行Spark程序
3.5 本章小结
第4章 各区域热门商品Top3分析
4.1 实现思路分析
4.2 实现各区域热门商品Top3分析
4.2.1 实现Spark程序
4.2.2 数据持久化
4.3 运行Spark程序
4.4 本章小结
第5章 网站转化率统计
5.1 数据集分析
5.2 实现思路分析
5.3 实现网站转化率统计
5.3.1 生成用户行为数据
5.3.2 实现Spark程序
5.3.3 数据持久化
5.4 运行Spark程序
5.5 本章小结
第6章 广告点击流实时统计
6.1 数据集分析
6.2 实现思路分析
6.3 表设计
6.4 实现广告点击流实时统计
6.4.1 生成用户行为数据
6.4.2 实现Spark程序
6.4.3 数据持久化
6.5 运行Spark程序
6.6 本章小结
第7章 数据可视化
7.1 数据映射
7.1.1 部署Phoenix
7.1.2 建立映射
7.2 FineBI的安装与配置
7.3 实现数据可视化
7.3.1 新建数据集
7.3.2 实现热门品类Topl0的可视化
7.3.3 实现各区域热门商品Top3的可视化
7.3.4 实现网站转化率的可视化
7.3.5 实现广告点击流实时统计的可视化
7.4 本章小结
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
