欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据分析处理(慕课版工业和信息化部十四五规划教材)
      • 作者:编者:郭永洪//贺萌|责编:刘佳
      • 出版社:人民邮电
      • ISBN:9787115628275
      • 出版日期:2024/02/01
      • 页数:274
    • 售价:27.92
  • 内容大纲

        本书采用理论知识与任务案例相结合的形式,系统地阐述大数据分析处理工作流程中的重要步骤介绍大数据分析处理过程中常用的第三方库。全书共13个单元,单元1介绍大数据分析的概念等内容;单元2和单元3介绍使用numpy与pandas实现科学计算与统计分析的相关知识;单元4~单元7介绍使用pandas实现数据预处理的方法;单元8介绍使用scikit-learn构建简单的机器学习模型的方法;单元9介绍使用matplotlib、seaborm等绘制图表的方法;单元10~单元13介绍4个大数据分析处理的综合案例。单元1~单元9中,每个单元都包含相关知识部分和任务实现部分,任务实现部分一般包含多个任务的具体实现过程,每个任务后都有课堂实践,通过完成实践操作,读者可以进一步巩固所学知识。
        本书既可作为高等院校大数据技术专业学生的教材,也可作为大数据技术爱好者的自学用书。
  • 作者介绍

  • 目录

    单元1  大数据分析概述
      学习目标
      相关知识
        1.大数据分析的概念
        2.大数据分析的产生与发展过程
        3.大数据分析的应用场景
        4.大数据分析流程
        5.传统的分析统计工具
        6.大数据处理编程语言
        7.大数据分析实用工具
      任务实现
        任务1.1  根据业务需求选择合适的大数据分析技术
          1.1.1  业务需求分析
          1.1.2  选择大数据分析技术
        任务1.2  使用pip和Pycharm完成Python库的管理
          1.2.1  了解Python常用库
          1.2.2  使用pip命令安装、卸载Python库
          1.2.3  使用Pycharm平台安装、卸载Python库
      素养拓展
      单元小结
      课后习题
    单元2  numpy科学计算基础
      学习目标
      相关知识
        1.numpy与ndarray对象
        2.创建ndarray数组的函数
        3.ndarray对象的数据类型
        4.数组的矢量化运算
        5.广播机制
        6.数组与标量的运算
        7.numpy通用函数
        8.numpy的统计与排序方法
        9.numpy的numpy.linalg模块
      任务实现
        任务2.1  保存考试成绩——创建一个数组
          2.1.1  使用函数创建数组
          2.1.2  掌握随机数模块的使用
        任务2.2  查看考试成绩数据类型——查看数组的数据类型
          2.2.1  查看数据类型
          2.2.2  实现数据类型转换
        任务2.3  对两门课成绩进行相加——实现数组运算
          2.3.1  实现矢量化运算
          2.3.2  实现数组广播
          2.3.3  实现数组与标量间的运算
        任务2.4  对考试成绩进行计算——使用numpy通用函数实现数组计算
          2.4.1  一元通用函数的使用
          2.4.2  二元通用函数的使用
        任务2.5  对考试成绩进行统计排序——利用numpy数组进行数据处理
          2.5.1  变换数组的形态
          2.5.2  实现数组统计

          2.5.3  实现数组排序
        任务2.6  对多门课成绩进行计算——使用numpy的线性代数模块处理矩阵
          2.6.1  计算对角线元素和
          2.6.2  实现矩阵乘法
      素养拓展
      单元小结
      课后习题
    单元3  Pandas统计分析基础
    单元4  数据加载与存储
    单元5  数据质量与数据清洗
    单元6  数据合并与转换
    单元7  数据分组与聚合
    单元8  Scikit-learn机器学习
    单元9  使用统计图表展示数据
    单元10  某地区电力公司用户付费行为预测
    单元11  《你好,旧时光》文本挖掘分析
    单元12  基于大数据可视化的城市通勤特征分析研究
    单元13  上市公司新闻情感与股票价格的关系