欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据计算系统(原理技术与应用)/数据科学与工程技术丛书
      • 作者:编者:王宏志//刘海龙//张立臣//石胜飞|责编:朱劼
      • 出版社:机械工业
      • ISBN:9787111733072
      • 出版日期:2023/10/01
      • 页数:320
    • 售价:31.6
  • 内容大纲

        本书兼顾深度和广度、应用和原理、研发和运维,系统介绍各类大数据计算系统。本书内容分为四个部分,包括大数据计算系统的基础知识、大数据计算系统的配置与编程方法、大数据计算系统的原理,以及大数据计算系统的监控、运维与调优。
        本书内容全面,体系清晰,可作为高校大数据及相关专业的课程教材,也可以作为从事大数据计算系统应用开发工作的技术人员的参考书。
  • 作者介绍

  • 目录

    前言
    第一部分  基础
      第1章  大数据计算系统概述
        1.1  大数据计算系统的定义
          1.1.1  大数据
          1.1.2  大数据计算
          1.1.3  大数据计算系统
        1.2  常见的大数据计算系统
          1.2.1  批处理计算框架Hadoop
          1.2.2  分布式计算框架Spark
          1.2.3  流计算系统Stom
          1.2.4  分布式图计算框架GraphX
          1.2.5  大数据计算系统的对比
        1.3  大数据计算系统的监控与运维概述
          1.3.1  概述
          1.3.2  监控与运维的范围
          1.3.3  大数据计算系统的监控与运维方法
          1.3.4  大数据计算系统的运维目标
        1.4  大数据计算系统的性能优化
          1.4.1  提升大数据计算系统性能的途径
          1.4.2  提升大数据计算系统性能的难度
          1.4.3  运维与性能优化的关系
        习题1
    第二部分  应用实现
      第2章  Hadoop的配置与编程
        2.1  批处理计算框架概述
          2.1.1  计算框架
          2.1.2  批处理
        2.2  Hadoop环境的配置与搭建
          2.2.1  环境配置前的准备
          2.2.2  Hadoop安装的预备知识
          2.2.3  本地/独立模式的配置
          2.2.4  伪分布式模式的配置
          2.2.5  全分布式模式的配置
        2.3  一个简单示例
          2.3.1  环境与数据的准备
          2.3.2  在IDEA下建立基于Maven的Hadoop项目
          2.3.3  编写WordCount程序
          2.3.4  Hadoop程序的运行过程与结果查看
        2.4  MapReduce编程
          2.4.1  MapReduce计算模型
          2.4.2  MapReduce程序的运行过程
          2.4.3  去重
        习题2
      第3章  HDFS及其应用
        3.1  HDFS概述
      ……
    第三部分  原理
    第四部分  监控、运维与调优