-
内容大纲
本书从Python数据分析与挖掘的基础知识入手,结合大量案例,系统地阐述了数据分析与挖掘的相关概念、基本原理和典型算法,带领读者逐步掌握数据分析与挖掘的关键知识,提高解决实际问题的能力。
本书主要内容包括绪论、Python编程基础、NumPy数值计算、Pandas数据分析、Python数据可视化、认识数据、数据预处理、回归分析、关联规则挖掘、分类、聚类、离群点检测以及文本和时序数据挖掘。
本书可作为高等院校数据科学与大数据技术、软件工程、计算机科学与技术、统计与应用等相关专业教材,也可作为Python数据分析与挖掘初学者和爱好者的参考书。 -
作者介绍
-
目录
第1章 绪论
1.1 数据分析与数据挖掘
1.1.1 数据分析
1.1.2 数据挖掘
1.1.3 数据分析与数据挖掘的联系
1.2 数据挖掘的主要任务
1.2.1 关联分析
1.2.2 数据的预测建模
1.2.3 聚类分析
1.2.4 离群点检测
1.3 数据挖掘的数据源
1.3.1 数据库数据
1.3.2 数据仓库
1.3.3 事务数据库
1.3.4 其他类型数据
1.4 数据挖掘使用的技术
1.4.1 统计学
1.4.2 机器学习
1.4.3 数据库系统与数据仓库
1.5 数据挖掘存在的主要问题
1.6 数据挖掘建模常用的工具
1.6.1 商用工具
1.6.2 开源工具
1.7 为何选用Python进行数据挖掘
1.8 Python数据挖掘常用的库
1.9 Jupyter Notebook的使用
1.10 小结
习题1
第2章 Python编程基础
2.1 Python语言的基本语法
2.1.1 基础数据类型
2.1.2 变量和赋值
2.1.3 运算符和表达式
2.1.4 字符串
2.1.5 流程控制
2.2 内置数据类型
2.2.1 列表
2.2.2 元组
2.2.3 字典
2.2.4 集合
2.3 函数
2.3.1 函数的定义
2.3.2 lambda函数
2.4 文件操作
2.4.1 文件处理过程
2.4.2 数据的读取方法
2.4.3 读取CSV文件
2.4.4 文件的写入与关闭
2.5 小结
习题2
本章实训
第3章 NumPy数值计算
3.1 NumPy多维数组
3.1.1 创建数组对象
3.1.2 ndarray对象的属性和数据转换
3.1.3 生成随机数
3.1.4 数组变换
3.2 数组的索引和切片
3.2.1 一维数组的索引
3.2.2 多维数组的索引
3.3 数组的运算
3.3.1 数组和标量间的运算
3.3.2 ufunc函数
3.3.3 条件逻辑运算
3.4 数组的读/写
3.4.1 读/写二进制文件
3.4.2 读/写文本文件
3.4.3 读取CSV文件
3.5 NumPy中的数据统计与分析
3.5.1 排序
3.5.2 重复数据与去重第1章 绪论
1.1 数据分析与数据挖掘
1.1.1 数据分析
1.1.2 数据挖掘
1.1.3 数据分析与数据挖掘的联系
1.2 数据挖掘的主要任务
1.2.1 关联分析
1.2.2 数据的预测建模
1.2.3 聚类分析
1.2.4 离群点检测
1.3 数据挖掘的数据源
1.3.1 数据库数据
1.3.2 数据仓库
1.3.3 事务数据库
1.3.4 其他类型数据
1.4 数据挖掘使用的技术
1.4.1 统计学
1.4.2 机器学习
1.4.3 数据库系统与数据仓库
1.5 数据挖掘存在的主要问题
1.6 数据挖掘建模常用的工具
1.6.1 商用工具
1.6.2 开源工具
1.7 为何选用Python进行数据挖掘
1.8 Python数据挖掘常用的库
1.9 Jupyter Notebook的使用
1.10 小结
习题1
第2章 Python编程基础
2.1 Python语言的基本语法
2.1.1 基础数据类型
2.1.2 变量和赋值
2.1.3 运算符和表达式
2.1.4 字符串
2.1.5 流程控制
2.2 内置数据类型
2.2.1 列表
2.2.2 元组
2.2.3 字典
2.2.4 集合
2.3 函数
2.3.1 函数的定义
2.3.2 lambda函数
2.4 文件操作
2.4.1 文件处理过程
2.4.2 数据的读取方法
2.4.3 读取CSV文件
2.4.4 文件的写入与关闭
2.5 小结
习题2
本章实训
第3章 NumPy数值计算
3.1 NumPy多维数组
3.1.1 创建数组对象
3.1.2 ndarray对象的属性和数据转换
3.1.3 生成随机数
3.1.4 数组变换
3.2 数组的索引和切片
3.2.1 一维数组的索引
3.2.2 多维数组的索引
3.3 数组的运算
3.3.1 数组和标量间的运算
3.3.2 ufunc函数
3.3.3 条件逻辑运算
3.4 数组的读/写
3.4.1 读/写二进制文件
3.4.2 读/写文本文件
3.4.3 读取CSV文件
3.5 NumPy中的数据统计与分析
3.5.1 排序
3.5.2 重复数据与去重
……
第4章 Pandas数据分析
第5章 Python数据可视化
第6章 认识数据
第7章 数据预处理
第8章 回归分析
第9章 关联规则挖掘
第10章 分类
第11章 聚类
第12章 离群点检测
第13章 文本和时序数据挖掘
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
