欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据技术原理与应用(从入门到实战)/大数据应用人才能力培养新形态系列
      • 作者:编者:蒋亚平|责编:刘博
      • 出版社:人民邮电
      • ISBN:9787115633859
      • 出版日期:2024/02/01
      • 页数:268
    • 售价:23.92
  • 内容大纲

        本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoop和Flume、数据分发工具Kafka、MapReduce计算框架与应用、基于内存的计算框架Spark、Spark的安装与应用、机器学习、基于Hive的交互式数据处理、数据同步工具与数据可视化和推荐算法与应用。本书在介绍Hadoop、HBase、Sqoop和Flume、MapReduce、Hive和Spark等相关章节时安排了入门级实验,且以电子资源的方式提供给学生,以便读者更好地学习和掌握大数据的关键技术。
        本书可以作为高等院校计算机类、信息管理与信息系统等相关专业的大数据课程教材,也可供从事大数据技术开发、研究和应用的研究人员和工程技术人员参考。
  • 作者介绍

  • 目录

    第1篇  大数据基础
      第1章  大数据概述
        1.1  大数据简介
          1.1.1  数据及大数据分类
          1.1.2  大数据的基本定义
        1.2  大数据的特性
          1.2.1  大数据时代
          1.2.2  大数据的“4V”特性
        1.3  大数据生态系统
          1.3.1  大数据主要平台
          1.3.2  大数据生态架构
        1.4  大数据的应用
          1.4.1  应用案例
          1.4.2  大数据应用的特点
        1.5  本章小结
        思考与练习
      第2章  Linux集群
        2.1  计算机集群
          2.1.1  集群的概念
          2.1.2  集群的种类与特点
        2.2  Linux操作系统
          2.2.1  Linux特点与主要组成
          2.2.2  Linux目录结构
        2.3  Linux集群搭建
          2.3.1  安装VMware虚拟机
          2.3.2  安装CentOS
          2.3.3  集群的配置
        2.4  Linux命令
        2.5  本章小结
        思考与练习
    第2篇  大数据存储
      第3章  分布式文件系统HDFS
        3.1  Hadoop与HDFS概述
          3.1.1  Hadoop
          3.1.2  HDFS
        3.2  HDFS系统架构
          3.2.1  系统架构概览
          3.2.2  组件功能
        3.3  数据存储
          3.3.1  数据分块
          3.3.2  机架感知
          3.3.3  存储策略
        3.4  文件操作过程
          3.4.1  读文件
          3.4.2  写文件
        3.5  YARN概述
          3.5.1  YARN
          3.5.2  工作流程
        3.6  本章小结
        思考与练习

      第4章  HDFS的安装与基本应用
        4.1  HDFS的安装与配置
          4.1.1  安装
          4.1.2  配置
        4.2  用户配置
          4.2.1  编辑环境变量
      ……
    第3篇  大数据采集
    第4篇  大数据计算
    第5篇  大数据应用