欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据原理与技术/ICT认证系列丛书
      • 作者:编者:黄史浩|责编:张晓芬
      • 出版社:人民邮电
      • ISBN:9787115597366
      • 出版日期:2022/12/01
      • 页数:271
    • 售价:27.92
  • 内容大纲

        本书从大数据的概念和特征开始讲起,首先让读者对大数据有一个感性的认识;然后结合大数据平台的各个模块,详细介绍了大数据的存储、处理、分析、可视化等方面的原理和操作;最后介绍了大数据在各行业中的应用,让读者更加充分地感受到大数据技术的优势,以及大数据应用的价值。本书适合高等院校相关专业的学生使用,也适合参加大数据技术培训课程的人员使用,还可以作为从事ICT行业相关工作的人员和大数据技术爱好者的参考书。
  • 作者介绍

  • 目录

    第1章  大数据概述
      1.1  大数据的概念与价值
        1.1.1  大数据的基本概念
        1.1.2  大数据的来源
        1.1.3  大数据的价值
        1.1.4  挖掘企业大数据价值的方式
      1.2  大数据的关键技术
        1.2.1  大数据采集、预处理、存储与管理
        1.2.2  大数据分析与挖掘
        1.2.3  大数据可视化
      1.3  大数据产业
        1.3.1  数据提供
        1.3.2  技术提供
        1.3.3  服务提供
      1.4  大数据应用场景
      1.5  本章总结
      练习题
    第2章  Hadoop大数据处理平台
      2.1  Hadoop平台概述
        2.1.1  Hadoop起源及发展
        2.1.2  Hadoop特性
        2.1.3  Hadoop应用现状
        2.1.4  Hadoop版本及相关平台
      2.2  Hadoop生态系统
        2.2.1  HDFS和HBase
        2.2.2  MapReduce和YARN
        2.2.3  Hive
        2.2.4  Sqoop和Flume
        2.2.5  ZooKeeper和Oozie
        2.2.6  Kerberos和LDAP
        2.2.7  Impala和Solr
        2.2.8  Kafka
      2.3  Hadoop安装部署
        2.3.1  Hadoop规划部署
        2.3.2  Hadoop的安装方式
      2.4  华为FusionInsight HD安装部署
        2.4.1  FusionInsight HD简介
        2.4.2  FusionInsight HD集成设计
        2.4.3  FusionInsight HD安装部署
        2.4.4  FusionInsight HD重要参数配置
      2.5  本章总结
      练习题
    第3章  HDFS
      3.1  概述
        3.1.1  DFS的概念与作用
        3.1.2  HDFS概述
      3.2  HDFS的相关概念
        3.2.1  HDFS块
        3.2.2  NameNode
        3.2.3  Secondary NameNode

        3.2.4  DataNode
      3.3  HDFS体系架构与原理
        3.3.1  HDFS体系架构
        3.3.2  HDFS的高可用机制
        3.3.3  HDFS的目录结构
        3.3.4  HDFS的数据读写过程
      3.4  HDFS接口及其在FusionInsight HD编程中的实践
        3.4.1  HDFS常用的Shell命令
      ……
    第4章  MapReduce和YARN
    第5章  HBase
    第6章  Hive
    第7章  Sqoop和Loader
    第8章  Flume
    第9章  Spark
    第10章  大数据流计算
    第11章  数据可视化
    第12章  大数据行业应用
    术语表
    参考文献