-
内容大纲
本书主要介绍实时大数据计算领域的相关技巧和经验,包括Flink、Spark和Storm等流处理框架技术。全书从搭建开发环境开始,逐步实现流处理,循序渐进地引导读者学习如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。
本书内容分为6个部分,分别是“导言——熟悉实时分析”“搭建基础设施”“Storm实时计算”“使用Spark实现实时计算”“使用Flink实现实时分析”以及“综合应用”。
在阅读本书之前,读者应具备基本的Java和Scala编程基础,还应熟悉Maven、Java和Eclipse的安装和配置流程。 -
作者介绍
-
目录
第一部分 导言——熟悉实时分析
第1章 实时分析简介
1.1 大数据的定义
1.2 大数据的基础设施
1.3 实时分析——神话与现实
1.4 近实时解决方案——可用的架构
1.4.1 NRT的Storm解决方案
1.4.2 NRT的Spark解决方案
1.5 Lambda架构——分析可能性
1.6 物联网——想法与可能性
1.7 云——考虑NRT和物联网
1.8 小结
第2章 实时应用的基本组件
2.1 NRT系统及其构建模块
2.1.1 数据采集
2.1.2 流处理
2.1.3 分析层—服务终端用户
2.2 NRT的高级系统视图
2.3 NRT的技术视图
2.3.1 事件生产者
2.3.2 数据收集
2.3.3 代理
2.3.4 转换和处理
2.3.5 存储
2.4 小结
第二部分 搭建基础设施
第3章 了解和跟踪数据流
3.1 了解数据流
3.2 为数据提取安装基础设施
3.2.1 Apache Kafka
3.2.2 Apache NiFi
3.2.3 Logstash
3.2.4 Fluentd
3.2.5 Flume
3.3 将数据从源填到处理器—期望和注意事项
3.4 比较与选择适合用例的最佳实践
3.5 小试牛刀
3.6 小结
第4章 安装和配置Storm
4.1 Storm概述
4.2 Storm架构和组件
4.2.1 特征
4.2.2 组件
4.2.3 流分组
4.3 安装和配置Storm
4.3.1 安装Zookeeper
4.3.2 配置Apache Storm
4.4 在Storm上实时处理任务
4.5 小结
第5章 配置Apache Spark和Flink
5.1 安装并快速运行Spark
5.1.1 源码构建
5.1.2 下载Spark安装包
5.1.3 运行示例
5.2 安装并快速运行Flink
5.2.1 使用源码构建Flink
5.2.2 下载Flink
5.2.3 运行示例
5.3 安装并快速运行Apache Beam
5.3.1 Beam模型
5.3.2 运行示例
5.3.3 MinimalWordCount示例
5.4 Apache Beam中的平衡
5.5 小结
第三部分 Storm实时计算
第四部分 使用Spark实现实时计算
第五部分 使用Flink实现实时分析
第六部分 综合应用
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
