-
内容大纲
本书旨在成为读者进入数据科学领域的指南。全书共20章,涵盖了数据科学及其应用的各个方面,引入经典数据集将理论与实践相结合,采用Jupyter等工具,以Python语言由浅入深地介绍了数据科学及相关学科的基本概念、数据预处理、机器学习及时间序列等内容,并提供了不同的案例研究,以达到学以致用的效果。通过阅读本书,读者将获得成为一名数据科学家所需的基本知识和技能。
本书适合有Python或其他编程语言基础,并对数据科学感兴趣的人员阅读。 -
作者介绍
-
目录
第1章 数据科学基本概念
1.1 数据的概念
1.1.1 结构化数据
1.1.2 非结构化数据
1.1.3 半结构化数据
1.2 数据科学的定义
1.3 数据科学家的工作
1.4 数据科学应用实例
1.5 为何Python适合数据科学
1.6 小结
第2章 软件安装与配置
2.1 系统要求
2.2 下载Anaconda
2.3 在Windows系统上安装Anaconda
2.4 在Linux系统上安装Anaconda
2.5 如何在Anaconda中安装新的Python库
2.6 打开笔记本—Jupyter
2.7 了解笔记本
2.8 小结
第3章 列表与字典
3.1 什么是列表
3.2 如何创建列表
3.3 列表的不同操作
3.4 列表与数组的差异
3.5 什么是字典
3.6 如何创建字典
3.7 字典的相关操作
3.8 小结
第4章 函数与包
4.1 Python的Help()函数
4.2 如何导入Python包
4.3 如何创建并调用函数
4.4 在函数中传递参数
4.5 函数的默认参数
4.6 如何在函数中使用未知参数
4.7 函数的全局与本地变量
4.8 Lambda函数
4.9 了解Python中的main方法
4.10 小结
第5章 NumPy基本概念
5.1 导入NumPy包
5.2 为何NumPy数组优于列表
5.3 NumPy数组属性
5.4 创建NumPy数组
5.5 访问NumPy数组中的元素
5.6 NumPy数组的切片
5.7 数组连接
5.8 小结
第6章 Pandas和数据帧
6.1 导入Pandas
6.2 Pandas数据结构
6.3 .loc[]和.iloc[]
6.4 一些有用的数据帧函数
6.5 处理数据帧中的缺失值
6.6 小结
第7章 与数据库交互
7.1 SQLAlchemy
7.2 安装SQLAlchemy包
7.3 如何使用SQLAlchemy
7.4 SQLAlchemy引擎配置
7.5 在数据库中新建表
7.6 在表中插入数据
7.7 更新记录
7.8 如何合并表格
7.8.1 内连接
7.8.2 左连接
7.8.3 右连接
7.9 小结
第8章 数据科学中的统计思维
8.1 数据科学中的统计学
8.2 统计数据/变量的类型
8.3 平均数、中位数和众数
8.4 概率的基本概念
8.5 统计分布
8.6 Pearson相关系数
8.7 概率密度函数
8.8 真实案例
8.9 统计推断与假设检验
8.10 小结
第9章 如何在Python中导入数据
9.1 导入TXT数据
9.2 导入CSV数据
9.3 导入Excel数据
9.4 导入JSON数据
9.5 导入腌制数据
9.6 导入压缩数据
9.7 小结
第10章 清洗导入的数据
10.1 了解数据
10.2 分析缺失值
10.3 丢弃缺失值
10.4 自动填充缺失值
10.5 如何缩放和归一化数据
10.6 如何解析日期
10.7 如何应用字符编码
10.8 清洗不一致的数据
10.9 小结
第11章 数据可视化
11.1 条形图
11.2 折线图
11.3 直方图
11.4 散点图
11.5 堆积图
11.6 箱线图
11.7 小结
第12章 数据预处理
12.1 关于案例研究
12.2 导入数据集
12.3 探索性数据分析
12.4 数据清洗与预处理
12.5 特征工程
12.6 小结
第13章 监督式机器学习
13.1 常见的机器学习术语
13.2 机器学习导论
13.3 常用机器学习算法列述
13.4 监督式机器学习基础
13.5 解决分类机器学习问题
13.6 为何要进行训练/测试拆分和交叉验证
13.7 解决回归机器学习问题
13.8 如何调整机器学习模型
13.9 如何处理sklearn中的分类变量
13.10 处理缺失数据的高级技术
13.11 小结
第14章 无监督式机器学习
14.1 为何选择无监督式机器学习
14.2 无监督式机器学习技术
14.2.1 聚类
14.2.2 主成分分析
14.3 案例研究
14.4 验证无监督式机器学习
14.5 小结
第15章 处理时间序列数据
15.1 为何时间序列重要
15.2 如何处理日期和时间
15.3 转换时间序列数据
15.4 操作时间序列数据
15.5 比较时间序列的增长率
15.6 如何改变时间序列频率
15.7 小结
第16章 时间序列法
16.1 时间序列预测的定义
16.2 预测的基本步骤
16.3 时间序列预测的技术
16.3.1 自回归
16.3.2 移动平均
16.3.3 自回归移动平均
16.3.4 自回归积分移动平均
16.3.5 季节性自回归积分移动平均
16.3.6 季节性自回归积分移动平均与外生回归因子
16.3.7 向量自回归移动平均
16.3.8 Holt-Winters指数平滑
16.4 预测网页的未来流量
16.5 小结
第17章 案例研究1
第18章 案例研究2
第19章 案例研究3
第20章 案例研究4
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...