- 实时数据处理和分析指南
- - 作者：(印度)希尔皮·萨克塞纳//沙鲁巴·古普塔|责编:吴晋瑜|译者:吴志国//曾凤姝
  - 出版社：人民邮电
  - ISBN：9787115524867
  - 出版日期：2020/05/01
  - 页数：280
- 售价：31.6

内容大纲
    本书主要介绍实时大数据计算领域的相关技巧和经验，包括Flink、Spark和Storm等流处理框架技术。全书从搭建开发环境开始，逐步实现流处理，循序渐进地引导读者学习如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。
    本书内容分为6个部分，分别是“导言——熟悉实时分析”“搭建基础设施”“Storm实时计算”“使用Spark实现实时计算”“使用Flink实现实时分析”以及“综合应用”。
    在阅读本书之前，读者应具备基本的Java和Scala编程基础，还应熟悉Maven、Java和Eclipse的安装和配置流程。
作者介绍
目录
第一部分  导言——熟悉实时分析
  第1章  实时分析简介
    1.1  大数据的定义
    1.2  大数据的基础设施
    1.3  实时分析——神话与现实
    1.4  近实时解决方案——可用的架构
      1.4.1  NRT的Storm解决方案
      1.4.2  NRT的Spark解决方案
    1.5  Lambda架构——分析可能性
    1.6  物联网——想法与可能性
    1.7  云——考虑NRT和物联网
    1.8  小结
  第2章  实时应用的基本组件
    2.1  NRT系统及其构建模块
      2.1.1  数据采集
      2.1.2  流处理
      2.1.3  分析层—服务终端用户
    2.2  NRT的高级系统视图
    2.3  NRT的技术视图
      2.3.1  事件生产者
      2.3.2  数据收集
      2.3.3  代理
      2.3.4  转换和处理
      2.3.5  存储
    2.4  小结
第二部分  搭建基础设施
  第3章  了解和跟踪数据流
    3.1  了解数据流
    3.2  为数据提取安装基础设施
      3.2.1  Apache Kafka
      3.2.2  Apache NiFi
      3.2.3  Logstash
      3.2.4  Fluentd
      3.2.5  Flume
    3.3  将数据从源填到处理器—期望和注意事项
    3.4  比较与选择适合用例的最佳实践
    3.5  小试牛刀
    3.6  小结
  第4章  安装和配置Storm
    4.1  Storm概述
    4.2  Storm架构和组件
      4.2.1  特征
      4.2.2  组件
      4.2.3  流分组
    4.3  安装和配置Storm
      4.3.1  安装Zookeeper
      4.3.2  配置Apache Storm
    4.4  在Storm上实时处理任务
    4.5  小结
  第5章  配置Apache Spark和Flink

    5.1  安装并快速运行Spark
      5.1.1  源码构建
      5.1.2  下载Spark安装包
      5.1.3  运行示例
    5.2  安装并快速运行Flink
      5.2.1  使用源码构建Flink
      5.2.2  下载Flink
      5.2.3  运行示例
    5.3  安装并快速运行Apache Beam
      5.3.1  Beam模型
      5.3.2  运行示例
      5.3.3  MinimalWordCount示例
    5.4  Apache Beam中的平衡
    5.5  小结
第三部分  Storm实时计算
第四部分  使用Spark实现实时计算
第五部分  使用Flink实现实时分析
第六部分  综合应用

内容大纲

作者介绍

目录

同类热销排行榜

推荐书目