欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据基础与Python机器学习/大数据系列丛书
      • 作者:编者:高静//申志军//姜新华//陈俊杰|责编:张玥//战晓雷
      • 出版社:清华大学
      • ISBN:9787302602392
      • 出版日期:2022/05/01
      • 页数:333
    • 售价:27.92
  • 内容大纲

        本书全面介绍与大数据和人工智能相关的数据采集、数据存储、并行计算等技术体系,以及Python编程基础、数据处理分析和可视化、机器学习算法和深度学习模型的原理与应用。
        全书共分4部分:第1部分(第1章)为大数据基础,主要介绍与大数据应用相关的数据采集、数据存储、并行计算等技术体系;第2部分(第2章)为Python编程基础,主要介绍Python的基本语法,为读者学习后续的数据处理分析、可视化、机器学习算法和深度学习模型等内容提供基础知识;第3部分(第3、4章)为数据处理分析和可视化,主要介绍基于Pandas的数据处理分析方法和基于Matplotlib的数据可视化方法;第4部分(第5~9章)为机器学习和深度学习,其中,第5~8章主要介绍回归、聚类、分类等机器学习算法及应用,第9章主要介绍深度学习模型及建模应用。各章都有配套的思考题、自测习题和教学视频等资源。
        本书适合作为高等学校数据科学与大数据技术、计算机科学与技术、网络工程、软件工程、物联网工程等专业的大数据导论、Python编程技术、数据处理及可视化、Python数据科学导引以及机器学习等课程的教材,也可作为IT开发人员、非计算机专业师生和科研工作者的参考书。
  • 作者介绍

  • 目录

    第1章  数据与大数据导论
      1.1  大数据概述
        1.1.1  大数据的来源
        1.1.2  大数据的定义和特征
        1.1.3  数据结构类型
        1.1.4  数据分析流程
      1.2  大数据采集和预处理
        1.2.1  大数据采集设备
        1.2.2  大数据采集方法
        1.2.3  大数据预处理技术
      1.3  大数据的存储
        1.3.1  数据存储设备
        1.3.2  传统大数据存储
        1.3.3  数据中心与云存储
        1.3.4  大数据存储
        1.3.5  数据仓库
      1.4  云计算与大数据并行计算
        1.4.1  云计算与云计算平台
        1.4.2  MapReduce计算模型
        1.4.3  Hadoop
        1.4.4  Spark
      1.5  大数据分析
        1.5.1  大数据分析概念
        1.5.2  大数据分析方法
        1.5.3  机器学习与特征选择
        1.5.4  机器学习算法
        1.5.5  深度学习算法
      1.6  大数据可视化
        1.6.1  数据可视化概述
        1.6.2  数据可视化技术
        1.6.3  数据可视化工具
        1.6.4  数据可视化案例
      1.7  大数据应用及挑战
        1.7.1  大数据应用
        1.7.2  大数据带来的挑战
      思考题
    第2章  Python基础
      2.1  Python编程环境
        2.1.1  Anaconda概述
        2.1.2  Anaconda的安装
        2.1.3  Anaconda的包管理
        2.1.4  运行Python代码或程序
      2.2  变量和内置数据类型
        2.2.1  变量和变量赋值
        2.2.2  内置数据类型
        2.2.3  运算符
        2.2.4  注释和编码规范
      2.3  列表、元组和字典
        2.3.1  列表
        2.3.2  元组

        2.3.3  字典
      2.4  选择和循环
        2.4.1  选择结构
        2.4.2  for循环
        2.4.3  while循环
      2.5  函数和模块
        2.5.1  函数的定义和使用
        2.5.2  模块导入
      2.6  文件操作
        2.6.1  文件操作基础
        2.6.2  CSV文件操作
        2.6.3  JSON文件操作
    第3章  Pandas数据处理和分析
      3.1  Pandas基础
        3.1.1  Pandas简介
        3.1.2  Series
      ……
    第4章  Matplotlib数据可视化
    第5章  回归模型原理与应用
    第6章  聚类分析
    第7章  分类模型
    第8章  集成学习
    第9章  深度学习
    参考文献