欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据技术应用(校企合作系列教材)
      • 作者:编者:陈品华//赵家贝//东苗|责编:滕飞
      • 出版社:上海交大
      • ISBN:9787313319593
      • 出版日期:2025/01/01
      • 页数:195
    • 售价:27.2
  • 内容大纲

        本书通过8个项目,介绍了大数据常用技术。其中项目1主要介绍了大数据的理论框架。项目2、项目3分别介绍了虚拟化技术和Linux操作系统。项目4介绍了Hadoop分布式系统,包括搭建、运维、HDFS常用操作和MapReduce工作原理。项目5介绍了数据采集技术,包括网络爬虫、Flume数据采集和Kafka数据采集。项目6介绍了数据预处理技术,包括数据的清洗、转换、集成和规约。项目7介绍了数据仓库工具Hive,包括Hive部署、存储和分析。项目8介绍了数据可视化技术,包括Python的Matplotlib、Seaborn和Pyecharts库。本书通过具体的任务,引导读者逐步深入,最终掌握大数据采集、处理、分析与可视化的一系列技能。
        本书可作为高校大数据相关课程的教材或教学参考书,也可以作为人工智能、大数据相关从业者的自学参考书。
  • 作者介绍

  • 目录

    项目1  走进大数据世界
      任务1.1  认识大数据
      任务1.2  了解相关开发技术及环境
      任务1.3  了解相关开发语言
    项目2  虚拟化技术
      任务2.1  深入探索虚拟化技术
      任务2.2  安装和打开VMware Workstation
      任务2.3  在VMware上安装和使用Linux虚拟机
      任务2.4  学会使用远程连接工具
    项目3  Linux操作系统应用
      任务3.1  掌握Linux系统的基础命令
      任务3.2  掌握Linux的进阶命令
    项目4  Hadoop分布式系统
      任务4.1  从0搭建Hadoop集群
      任务4.2  学会Hadoop集群运维
      任务4.3  掌握HDFS常用操作
      任务4.4  理解分布式计算框架MapReduce
    项目5  数据采集技术
      任务5.1  掌握网络数据采集
      任务5.2  掌握Flume数据采集
      任务5.3  掌握Kafka数据采集
    项目6  数据预处理技术
      任务6.1  理解数据预处理技术
      任务6.2  掌握数据清洗技术
      任务6.3  掌握数据转换技术
      任务6.4  掌握数据集成技术
      任务6.5  掌握数据规约技术
    项目7  数据仓库工具Hive
      任务7.1  在Hadoop平台搭建Hive
      任务7.2  学会Hive数据存储
      任务7.3  学会Hive数据分析
    项目8  数据可视化技术
      任务8.1  掌握Matplotlib库
      任务8.2  掌握Seaborn库
      任务8.3  掌握Pyecharts库
    参考文献