欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 数据科学通识导论(普通高等院校新工科数据科学与大数据专业系列教材)
      • 作者:编者:臧劲松//刘丽霞|责编:贾星//王占清
      • 出版社:中国铁道
      • ISBN:9787113318543
      • 出版日期:2025/03/01
      • 页数:203
    • 售价:19.2
  • 内容大纲

        本书根据高等院校数据科学通识课程的教学需求编写,着重培养学生的数据意识、数据思维和数据能力,深入阐述了数据科学的核心理论与实践应用。全书共分9章,包括数据科学概论、Python与数据科学、数组的统计分析、数据清洗与统计、可视化数据挖掘、Web应用框架、文本数据处理、机器学习以及大数据技术。
        为确保读者能够轻松掌握数据分析技能,本书采用当前流行的Python语言,通过实际案例演示各个数据分析过程,力求内容深入浅出,既方便读者快速上手,还能帮助他们在实践中不断巩固和加深所学知识。
        本书适合作为高等院校理工科各专业平台课教材,也可作为各专业的数据科学通识课程教材,对于对数据科学有浓厚兴趣的读者,也是一本不可多得的参考书。
  • 作者介绍

  • 目录

    第1章  数据科学概论
      1.1  数据科学的定位
        1.1.1  数据和大数据
        1.1.2  数据科学理论基础
        1.1.3  数据科学家
      1.2  工具软件
        1.2.1  常用Python软件简介
        1.2.2  Jupyter Notebook软件
      1.3  数据处理流程
        1.3.1  传统的数据处理流程
        1.3.2  数据科学的数据处理流程
    拓展与练习
    第2章  Python与数据科学
      2.1  Python基础语法
        2.1.1  标识符与变量
        2.1.2  运算符和表达式
        2.1.3  程序流程控制
      2.2  Python内置数据类型
        2.2.1  数值类型
        2.2.2  组合类型
      2.3  函数
        2.3.1  函数的定义与调用
        2.3.2  参数传递
        2.3.3  匿名函数
      2.4  模块
        2.4.1  模块的导入和使用
        2.4.2  常用内置模块
      2.5  综合案例
    拓展与练习
    第3章  数组的统计分析
      3.1  创建数组对象
        3.1.1  创建一维数组
        3.1.2  创建二维数组
      3.2  属性和切片
        3.2.1  常用属性
        3.2.2  切片
      3.3  常用函数
        3.3.1  数学函数
        3.3.2  统计函数
      3.4  综合案例
    拓展与练习
    第4章  数据清洗与统计
      4.1  数据采集
        4.1.1  数据来源概述
        4.1.2  简单爬虫示例
      4.2  Pandas数据结构
        4.2.1  Series对象
        4.2.2  DataFrame数据
      4.3  数据导入——基于Pandas库
        4.3.1  读写CSV文件和TXT文件

        4.3.2  读写Excel文件
        4.3.3  读写JSON文件
      4.4  数据的清洗与预处理
        4.4.1  缺失值处理
        4.4.2  异常值检测与处理
        4.4.3  检测与处理重复数据
        4.4.4  数据转换
      4.5  数据的规整化
        4.5.1  数据排序与索引
        4.5.2  数据合并与连接
      4.6  数据的统计分析
        4.6.1  通用函数与运算
        4.6.2  统计函数
        4.6.3  相关性分析
      4.7  综合案例
    拓展与练习
    第5章  可视化数据挖掘
      5.1  数据可视化基础
        5.1.1  Pandas数据可视化
        5.1.2  Matplotlib绘图基础
      5.2  绘制常用图形
        5.2.1  认识基本图表类型
        5.2.2  常用图形绘制
      5.3  动态交互式图表
      5.4  综合案例
    拓展与练习
    第6章  Web应用框架
      6.1  Python的Web开发
        6.1.1  Web开发原理
        6.1.2  框架和步骤
      6.2  Flask框架
        6.2.1  基础应用
        6.2.2  项目配置文件
      6.3  Django框架
        6.3.1  环境准备
        6.3.2  基础应用
      6.4  综合案例
    拓展与练习
    第7章  文本数据处理
      7.1  文本处理概述
        7.1.1  文本处理的常见任务
        7.1.2  文本处理的基本步骤
      7.2  中文文本处理
        7.2.1  中文分词
        7.2.2  中文分词库Jieba
      7.3  综合案例
    拓展与练习
    第8章  机器学习
      8.1  机器学习概述
        8.1.1  机器学习与人工智能

        8.1.2  机器学习的分类
      8.2  回归模型
        8.2.1  原理与实现
        8.2.2  应用案例
      8.3  分类模型
        8.3.1  原理与实现
        8.3.2  应用案例
      8.4  聚类分析
        8.4.1  原理与实现
        8.4.2  应用案例
      8.5  强化学习
        8.5.1  原理与实现
        8.5.2  应用案例
    拓展与练习
    第9章  大数据技术
      9.1  大数据技术概述
        9.1.1  大数据的概念
        9.1.2  大数据的相关技术
        9.1.3  大数据服务平台
        9.1.4  大数据的计算模式
      9.2  Hadoop及其生态系统
        9.2.1  Hadoop概述
        9.2.2  Hadoop的核心组件
        9.2.3  Hadoop生态系统
      9.3  Spark及其生态系统
        9.3.1  Spark概述
        9.3.2  Spark生态系统
        9.3.3  Spark的部署和应用
        9.3.4  综合案例
    拓展与练习