欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 数据科学基础(新工科信息技术基础系列规划教材)
      • 作者:编者:杨志强//王睿智//肖杨//孙丽君//李湘梅等|责编:耿芳
      • 出版社:高等教育
      • ISBN:9787040586121
      • 出版日期:2022/07/01
      • 页数:335
    • 售价:19.2
  • 内容大纲

        本书是根据教育部高等学校大学计算机课程教学指导委员会编制的大学计算机基础课程教学基本要求编写的。
        本书以Python语言为工具,通过大量案例讲述了数据组织与科学计算、数据统计分析、数据可视化、网络爬虫与信息提取、人工智能与机器学习的基本流程和方法,既重视基本方法的介绍,又强调实际应用能力的培养。
        本书脉络清晰、实例丰富,可作为高等学校非计算机类专业学生学习数据科学的入门教材,也可作为数据科学技术爱好者和相关专业人员的自学参考书。
  • 作者介绍

  • 目录

    理论篇
      第1章  数据科学基础
        1.1  数据科学概述
          1.1.1  数据与大数据
          1.1.2  数据科学
          1.1.3  数据科学的发展历程
          1.1.4  数据科学的研究内容
          1.1.5  数据科学的知识体系
          1.1.6  数据科学的应用
        1.2  Python基础
          1.2.1  Python简介
          1.2.2  数据类型和运算符
          1.2.3  控制结构
          1.2.4  函数
        习题
      第2章  数据组织与科学计算
        2.1  数据组织
        2.2  矩阵的初始化与重组
          2.2.1  矩阵的初始化
          2.2.2  矩阵的重组
        2.3  矩阵运算
          2.3.1  矩阵的算术运算
          2.3.2  矩阵的点乘、转置与求逆
          2.3.3  矩阵的统计函数
          2.3.4  矩阵与向量的算术运算
        2.4  线性回归建模
          2.4.1  线性回归
          2.4.2  主成分回归
          2.4.3  模型验证策略
          2.4.4  应用案例
        习题
      第3章  数据统计分析
        3.1  引例
        3.2  Pandas数据结构与基本操作
          3.2.1  Pandas数据结构
          3.2.2  数据访问
          3.2.3  算术运算与数据对齐
          3.2.4  重建与更换索引
          3.2.5  其他常用操作
        3.3  数据的加载与保存
          3.3.1  处理CSV或TXT格式文件
          3.3.2  读取Excel文件
        3.4  数据预处理
          3.4.1  数据合并
          3.4.2  数据清洗
          3.4.3  数据转换
          3.4.4  数据排序
          3.4.5  案例——电影票房数据预处理
      3..5数据统计分析
          3.5.1  常用统计量

          3.5.2  常用统计方法
          3.5.3  分组与聚合
          3.5.4  数据透视表与交叉表
          3.5.5  相关分析
          3.5.6  案例——电影票房数据统计分析
        习题
      第4章  数据可视化
        4.1  图表绘制基础
          4.1.1  引例——绘制柱状图
          4.1.2  Matplotlib绘图基础
        4.2  Matplotlib绘制二维图表
          4.2.1  绘制线条
          4.2.2  绘制柱状图
          4.2.3  绘制饼图
          4.2.4  绘制散点图
          4.2.5  绘制直方图
          4.2.6  绘制箱形图
        4.3  Matplotlib绘制三维图表
          4.3.1  三维图表基础
          4.3.2  绘制三维图表
        4.4  Seaborn库
        4.5  综合应用
          4.5.1  综合案例1——空气质量分析
          4.5.2  综合案例2——绘制词云图
        习题
      第5章  网络爬虫与信息提取
        5.1  爬虫基本原理及数据获取
          5.1.1  引例——百度新闻
          5.1.2  爬虫基本流程
          5.1.3  数据获取
          5.1.4  网络爬虫引发的问题及限制
          5.1.5  应用案例
        5.2  信息解析
          5.2.1  引例——获取上海市天气信息
          5.2.2  BeautifulSoup库的基本知识
          5.2.3  BeautifulSoup的遍历方法
          5.2.4  基于BeautifulSoup库的HTML内容查找方法
          5.2.5  应用案例
        5.3  关键信息提取
          5.3.1  引例——提取微博信息
          5.3.2  正则表达式的构成
          5.3.3  正则表达式的使用
          5.3.4  应用案例
        习题
      第6章  人工智能与机器学习
        6.1  人工智能基础
          6.1.1  引例——苹果Siri
          6.1.2  机器学习的基础
          6.1.3  scikit-leam简介
        6.2  分类与回归

          6.2.1  引例——鸢尾花分类
          6.2.2  走近邻分类
          6.2.3  线性回归
          6.2.4  持向量机
          6.2.5  决策树
          6.2.6  随机森林
        6.3  聚类
          6.3.1  引例——客户分组
          6.3.2  聚类性能度量
          6.3.3  k均值聚类
        6.4  神经网络与深度学习
          6.4.1  感知机
          6.4.2  前馈神经网络
          6.4.3  深度学习简介
        习题
    实验篇
      实验1  Python基础
      实验2  数据组织与科学计算
      实验3  数据统计分析
      实验4  数据可视化
      实验5  网络爬虫与信息提取
      实验6  人工智能与机器学习
    参考文献