-
内容大纲
本书按照大数据分析流程,以电商产品数据为例,由浅入深地讲解大数据分析的核心开发技术,以及大数据分析工具及其组件的作用和使用方法。本书内容系统、全面,可帮助读者快速掌握大数据分析技术。本书介绍了大数据分析的概念、应用场景、分析指标、分析工具、分析组件、分布式存储、分布式处理、数据离线分析、数据实时分析、数据挖掘,以及数据迁移等知识,并通过实际的操作案例,详细、直观地介绍了大数据分析的实现过程。
本书可作为高等职业院校大数据技术等专业的教材,也可作为大数据分析技术人员的参考书。 -
作者介绍
-
目录
项目1 初识电商产品数据的处理与分析
项目导言
项目导图
知识目标
技能目标
素养目标
任务1-1 电商产品数据背景及数据分析概述
任务描述
素质拓展
任务技能
技能点1 电商产品数据背景
技能点2 大数据分析概念
技能点3 大数据分析应用场景
技能点4 大数据分析指标
任务1-2 电商产品数据处理与分析项目准备
任务描述
素质拓展
任务技能
技能点1 大数据分析工具简介
技能点2 大数据分析组件
技能点3 大数据分析流程
技能点4 大数据分析企业级应用
任务实施
项目小结
课后习题
自我评价
项目2 电商产品数据分布式存储
项目导言
项目导图
知识目标
技能目标
素养目标
任务2-1 使用HDFS Shell管理电商产品数据
任务描述
素质拓展
任务技能
技能点1 什么是HDFS
技能点2 HDFS存储架构
技能点3 HDFS文件存取机制
技能点4 HDFS Shell基础命令
技能点5 HDFS Shell管理命令
任务实施
任务2-2 使用HDFS库管理电商产品数据
任务描述
素质拓展
任务技能
技能点1 HDFS库简介
技能点2 HDFS库方法
任务实施
项目小结
课后习题
自我评价
项目3 电商产品数据分布式处理
项目导言
项目导图
知识目标
技能目标
素养目标
任务3-1 使用正则表达式匹配电商产品数据
任务描述
素质拓展
任务技能
技能点1 MapReduce简介
技能点2 YARN简介
技能点3 正则表达式
任务实施
任务3-2 使用Hadoop Streaming处理电商产品数据
任务描述
素质拓展
任务技能
技能点1 Hadoop Streaming简介
技能点2 Hadoop Streaming的使用方法
任务实施
项目小结
课后习题
自我评价
项目4 电商产品数据离线分析
项目导言
项目导图
知识目标
技能目标
素养目标
任务4-1 使用Hive创建电商产品数据库
任务描述
素质拓展
任务技能
技能点1 Hive数据库操作
技能点2 Hive表操作
技能点3 Hive数据操作
任务实施
任务4-2 使用Hive对电商产品数据进行统计
任务描述
素质拓展
任务技能
技能点1 算术运算
技能点2 数据查询
任务实施
任务4-3 使用Spark创建基于电商产品数据的分布式数据容器
任务描述
素质拓展
任务技能
技能点1 Spark SQL简介
技能点2 DataFrame简介
技能点3 DataFrame创建
任务实施
任务4-4 使用Spark SQL完成电商产品数据分析
任务描述
素质拓展
任务技能
技能点1 数据查看
技能点2 数据过滤
技能点3 数据处理
技能点4 数据存储
任务实施
项目小结
课后习题
自我评价
项目5 电商产品数据实时分析
项目导言
项目导图
知识目标
技能目标
素养目标
任务5-1 创建数据流
任务描述
素质拓展
任务技能
技能点1 流式计算简介
技能点2 Spark Streaming简介
技能点3 DStream简介
技能点4 DStream的创建
任务实施
任务5-2 使用Spark Streaming对电商产品数据进行实时数据分析
任务描述
素质拓展
任务技能
技能点1 DStream转换操作
技能点2 DStream窗口操作
技能点3 DStream输出操作
技能点4 Spark Streaming启动与停止
任务实施
项目小结
课后习题
自我评价
项目6 电商产品数据挖掘
项目导言
项目导图
知识目标
技能目标
素养目标
任务6-1 处理电商产品数据
任务描述
素质拓展
任务技能
技能点1 Spark MLlib概述
技能点2 Spark MLlib数据类型
技能点3 特征提取与数据处理
任务实施
任务6-2 使用Spark MLlib对电商产品定价
任务描述
素质拓展
任务技能
技能点1 分类算法
技能点2 回归算法
技能点3 推荐算法
技能点4 算法评估
任务实施
项目小结
课后习题
自我评价
项目7 电商产品数据迁移
项目导言
项目导图
知识目标
技能目标
素养目标
任务7-1 根据电商产品数据统计结果创建数据表并查看
任务描述
素质拓展
任务技能
技能点1 Sqoop架构
技能点2 Sqoop连接器
技能点3 Sqoop配置数据库密码方式
技能点4 列出所有数据库
技能点5 列出数据库中的所有表
任务实施
任务7-2 使用Sqoop将Hive中电商产品数据统计结果导出
任务描述
素质拓展
任务技能
技能点1 Sqoop数据导入与导出
技能点2 其他常用命令
任务实施
项目小结
课后习题
自我评价
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
