欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据分析技术与应用(大数据技术微课版工业和信息化精品系列教材)
      • 作者:编者:宿佳宁//王林//于丽娜|责编:赵亮
      • 出版社:人民邮电
      • ISBN:9787115638540
      • 出版日期:2024/07/01
      • 页数:184
    • 售价:19.92
  • 内容大纲

        本书按照大数据分析流程,以电商产品数据为例,由浅入深地讲解大数据分析的核心开发技术,以及大数据分析工具及其组件的作用和使用方法。本书内容系统、全面,可帮助读者快速掌握大数据分析技术。本书介绍了大数据分析的概念、应用场景、分析指标、分析工具、分析组件、分布式存储、分布式处理、数据离线分析、数据实时分析、数据挖掘,以及数据迁移等知识,并通过实际的操作案例,详细、直观地介绍了大数据分析的实现过程。
        本书可作为高等职业院校大数据技术等专业的教材,也可作为大数据分析技术人员的参考书。
  • 作者介绍

  • 目录

    项目1  初识电商产品数据的处理与分析
      项目导言
      项目导图
      知识目标
      技能目标
      素养目标
      任务1-1  电商产品数据背景及数据分析概述
        任务描述
        素质拓展
        任务技能
          技能点1  电商产品数据背景
          技能点2  大数据分析概念
          技能点3  大数据分析应用场景
          技能点4  大数据分析指标
      任务1-2  电商产品数据处理与分析项目准备
        任务描述
        素质拓展
        任务技能
          技能点1  大数据分析工具简介
          技能点2  大数据分析组件
          技能点3  大数据分析流程
          技能点4  大数据分析企业级应用
        任务实施
      项目小结
      课后习题
      自我评价
    项目2  电商产品数据分布式存储
      项目导言
      项目导图
      知识目标
      技能目标
      素养目标
      任务2-1  使用HDFS Shell管理电商产品数据
        任务描述
        素质拓展
        任务技能
          技能点1  什么是HDFS
          技能点2  HDFS存储架构
          技能点3  HDFS文件存取机制
          技能点4  HDFS Shell基础命令
          技能点5  HDFS Shell管理命令
        任务实施
      任务2-2  使用HDFS库管理电商产品数据
        任务描述
        素质拓展
        任务技能
          技能点1  HDFS库简介
          技能点2  HDFS库方法
        任务实施
      项目小结

      课后习题
      自我评价
    项目3  电商产品数据分布式处理
      项目导言
      项目导图
      知识目标
      技能目标
      素养目标
      任务3-1  使用正则表达式匹配电商产品数据
        任务描述
        素质拓展
        任务技能
          技能点1  MapReduce简介
          技能点2  YARN简介
          技能点3  正则表达式
        任务实施
      任务3-2  使用Hadoop Streaming处理电商产品数据
        任务描述
        素质拓展
        任务技能
          技能点1  Hadoop Streaming简介
          技能点2  Hadoop Streaming的使用方法
        任务实施
      项目小结
      课后习题
      自我评价
    项目4  电商产品数据离线分析
      项目导言
      项目导图
      知识目标
      技能目标
      素养目标
      任务4-1  使用Hive创建电商产品数据库
        任务描述
        素质拓展
        任务技能
          技能点1  Hive数据库操作
          技能点2  Hive表操作
          技能点3  Hive数据操作
        任务实施
      任务4-2  使用Hive对电商产品数据进行统计
        任务描述
        素质拓展
        任务技能
          技能点1  算术运算
          技能点2  数据查询
        任务实施
      任务4-3  使用Spark创建基于电商产品数据的分布式数据容器
        任务描述
        素质拓展

        任务技能
          技能点1  Spark SQL简介
          技能点2  DataFrame简介
          技能点3  DataFrame创建
        任务实施
      任务4-4  使用Spark SQL完成电商产品数据分析
        任务描述
        素质拓展
        任务技能
          技能点1  数据查看
          技能点2  数据过滤
          技能点3  数据处理
          技能点4  数据存储
        任务实施
      项目小结
      课后习题
      自我评价
    项目5  电商产品数据实时分析
      项目导言
      项目导图
      知识目标
      技能目标
      素养目标
      任务5-1  创建数据流
        任务描述
        素质拓展
        任务技能
          技能点1  流式计算简介
          技能点2  Spark Streaming简介
          技能点3  DStream简介
          技能点4  DStream的创建
        任务实施
      任务5-2  使用Spark Streaming对电商产品数据进行实时数据分析
        任务描述
        素质拓展
        任务技能
          技能点1  DStream转换操作
          技能点2  DStream窗口操作
          技能点3  DStream输出操作
          技能点4  Spark Streaming启动与停止
        任务实施
      项目小结
      课后习题
      自我评价
    项目6  电商产品数据挖掘
      项目导言
      项目导图
      知识目标
      技能目标
      素养目标

      任务6-1  处理电商产品数据
        任务描述
        素质拓展
        任务技能
          技能点1  Spark MLlib概述
          技能点2  Spark MLlib数据类型
          技能点3  特征提取与数据处理
        任务实施
      任务6-2  使用Spark MLlib对电商产品定价
        任务描述
        素质拓展
        任务技能
          技能点1  分类算法
          技能点2  回归算法
          技能点3  推荐算法
          技能点4  算法评估
        任务实施
      项目小结
      课后习题
      自我评价
    项目7  电商产品数据迁移
      项目导言
      项目导图
      知识目标
      技能目标
      素养目标
      任务7-1  根据电商产品数据统计结果创建数据表并查看
        任务描述
        素质拓展
        任务技能
          技能点1  Sqoop架构
          技能点2  Sqoop连接器
          技能点3  Sqoop配置数据库密码方式
          技能点4  列出所有数据库
          技能点5  列出数据库中的所有表
        任务实施
      任务7-2  使用Sqoop将Hive中电商产品数据统计结果导出
        任务描述
        素质拓展
        任务技能
          技能点1  Sqoop数据导入与导出
          技能点2  其他常用命令
        任务实施
      项目小结
      课后习题
      自我评价