欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Python数据预处理
      • 作者:(印)罗伊·贾法里|责编:贾小红|译者:陈凯
      • 出版社:清华大学
      • ISBN:9787302649076
      • 出版日期:2023/11/01
      • 页数:496
    • 售价:63.6
  • 内容大纲

        本书详细阐述了与Python数据预处理相关的基本解决方案,主要包括NumPy和Pandas简介、Matplotlib简介、数据、数据库、数据可视化、预测、分类、聚类分析、数据清洗、数据融合与数据集成、数据归约、数据转换等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
        本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
  • 作者介绍

        罗伊·贾法里博士是美国加州雷德兰兹大学商业分析学助理教授。     Roy讲授和开发了涵盖数据清洗、决策、数据科学、机器学习和优化的大学水平课程。Roy的教学风格是崇尚动手实践,他相信最好的学习方式是边做边学。Roy采用主动学习的教学理念,读者在本书中将体验到这种主动学习方式。     Roy认为,只有使用最有效的工具、对数据分析目标有适当的理解、了解数据预处理步骤并能够比较各种方法时,才能成功进行数据预处理。这种理念塑造了本书的结构。
  • 目录

    第1篇  技术基础
      第1章  NumPy和Pandas简介
        1.1  技术要求
        1.2  Jupyter Notebook概述
        1.3  通过计算机编程进行数据分析的实质含义
        1.4  NumPy基本函数概述
          1.4.1  np.arange()函数
          1.4.2  np.zeros()和np.ones()函数
          1.4.3  示例——使用占位符来容纳分析
          1.4.4  np.linspace()函数
          1.4.5  示例——使用np.linspace()求解
        1.5  Pandas概述
        1.6  Pandas数据访问
          1.6.1  Pandas DataFrame访问
          1.6.2  访问DataFrame行
          1.6.3  访问DataFrame列
          1.6.4  访问DataFrame值
          1.6.5  访问Pandas Series
        1.7  切片
          1.7.1  对NumPy数组进行切片
          1.7.2  对Pandas DataFrame进行切片
          1.7.3  切片的实用示例
        1.8  用于过滤DataFrame的布尔掩码
          1.8.1  使用布尔掩码的分析示例1
          1.8.2  使用布尔掩码的分析示例2
        1.9  用于探索DataFrame的Pandas函数
          1.9.1  了解数据集的结构
          1.9.2  使用.shape属性
          1.9.3  使用.columns属性
          1.9.4  使用.info()函数
          1.9.5  了解数据集的值
          1.9.6  使用.describe()函数
          1.9.7  用于可视化数值列的直方图和箱线图
          1.9.8  使用.unique)函数
          1.9.9  使用.value_counts()函数
          1.9.10  用于可视化数值列的条形图
        1.10  应用Pandas函数
          1.10.1  将函数应用于Series
          1.10.2  应用函数——分析示例1
          1.10.3  应用Lambda函数
          1.10.4  对DataFrame应用函数
          1.10.5  应用函数——分析示例2
          1.10.6  Pandas groupby函数
          1.10.7  使用groupby的分析示例
          1.10.8  Pandas多级索引
          1.10.9  使用.unstack()函数
          1.10.10  使用.stack()函数
          1.10.11  多级访问
          1.10.12  Pandas .pivot()和.melt()函数
        1.11  小结

        1.12  练习
      第2章  Matplotlib简介
        2.1  技术要求
        2.2  在Matplotlib中绘图
          2.2.1  使用直方图或箱线图可视化数值特征
          2.2.2  使用折线图观察数据趋势
          2.2.3  使用散点图关联两个数值属性
        2.3  修改绘图的可视化效果
          2.3.1  将标题添加到可视化对象并将标签添加到轴
      ……
    第2篇  分析目标
    第3篇  预处理
    第4篇  案例研究