-
内容大纲
本书通过8个项目,介绍了大数据常用技术。其中项目1主要介绍了大数据的理论框架。项目2、项目3分别介绍了虚拟化技术和Linux操作系统。项目4介绍了Hadoop分布式系统,包括搭建、运维、HDFS常用操作和MapReduce工作原理。项目5介绍了数据采集技术,包括网络爬虫、Flume数据采集和Kafka数据采集。项目6介绍了数据预处理技术,包括数据的清洗、转换、集成和规约。项目7介绍了数据仓库工具Hive,包括Hive部署、存储和分析。项目8介绍了数据可视化技术,包括Python的Matplotlib、Seaborn和Pyecharts库。本书通过具体的任务,引导读者逐步深入,最终掌握大数据采集、处理、分析与可视化的一系列技能。
本书可作为高校大数据相关课程的教材或教学参考书,也可以作为人工智能、大数据相关从业者的自学参考书。 -
作者介绍
-
目录
项目1 走进大数据世界
任务1.1 认识大数据
任务1.2 了解相关开发技术及环境
任务1.3 了解相关开发语言
项目2 虚拟化技术
任务2.1 深入探索虚拟化技术
任务2.2 安装和打开VMware Workstation
任务2.3 在VMware上安装和使用Linux虚拟机
任务2.4 学会使用远程连接工具
项目3 Linux操作系统应用
任务3.1 掌握Linux系统的基础命令
任务3.2 掌握Linux的进阶命令
项目4 Hadoop分布式系统
任务4.1 从0搭建Hadoop集群
任务4.2 学会Hadoop集群运维
任务4.3 掌握HDFS常用操作
任务4.4 理解分布式计算框架MapReduce
项目5 数据采集技术
任务5.1 掌握网络数据采集
任务5.2 掌握Flume数据采集
任务5.3 掌握Kafka数据采集
项目6 数据预处理技术
任务6.1 理解数据预处理技术
任务6.2 掌握数据清洗技术
任务6.3 掌握数据转换技术
任务6.4 掌握数据集成技术
任务6.5 掌握数据规约技术
项目7 数据仓库工具Hive
任务7.1 在Hadoop平台搭建Hive
任务7.2 学会Hive数据存储
任务7.3 学会Hive数据分析
项目8 数据可视化技术
任务8.1 掌握Matplotlib库
任务8.2 掌握Seaborn库
任务8.3 掌握Pyecharts库
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
