-
内容大纲
本书以Python 3.10.7为平台,以实际应用为背景,通过“概述+经典应用”的形式,深入浅出地介绍Python机器学习算法及应用的相关知识。全书共12章,主要内容包括在数据上的计算机学习能力、简单的机器学习分类算法、sklearn机器学习分类器、数据预处理、降维实现数据压缩、不同模型的集成学习、连续变量的回归分析、数据的聚类分析、从单层到多层的人工神经网络、使用深度卷积神经网络实现图像分类、使用循环神经网络实现序列建模、使用生成对抗网络合成新数据等。通过本书的学习,读者可领略到Python的简单、易学、易读、易维护等特点,同时感受到利用Python实现机器学习的普遍性与专业性。
本书可作为高等学校相关专业本科生和研究生的学习用书,也可作为相关专业科研人员、学者、工程技术人员的参考用书。 -
作者介绍
-
目录
第1章 在数据上的计算机学习能力
1.1 转换机器学习
1.1.1 转换机器学习简介
1.1.2 转换机器学习对比其他方法
1.1.3 转换机器学习的改进
1.1.4 转换机器学习的可解释性
1.1.5 转换机器学习对比深度神经网络
1.1.6 构建机器学习的生态系统
1.2 三种不同类型的机器学习
1.2.1 用监督学习预测未来
1.2.2 用强化学习解决交互问题
1.2.3 用无监督学习发现隐藏的结构
1.2.4 分类和回归术语
1.3 评估机器学习模型
1.3.1 简单的留出验证
1.3.2 K折验证
1.3.3 带有打乱数据的重复K折验证
1.4 数据预处理、特征工程和特征学习
1.4.1 神经网络的数据预处理
1.4.2 特征工程
1.5 过拟合和欠拟合
1.5.1 减小网络大小
1.5.2 添加权重正则化
1.5.3 添加dropout正则化
1.6 机器学习工作流程
1.6.1 收集数据集
1.6.2 选择衡量成功的指标
1.6.3 确定评估法
1.6.4 开发更好的模型
1.6.5 扩大模型规模
1.6.6 正则化与调节超参数
1.7 应用Python解决机器学习问题
1.7.1 使用Python的原因
1.7.2 Python的安装
1.7.3 Jupyter Notebook的安装与使用
1.7.4 使用pip安装第三方库
1.8 用于机器学习的软件包
1.8.1 NumPy软件包
1.8.2 SciPy软件包
1.8.3 Pandas软件包
第2章 简单的机器学习分类算法
2.1 机器学习的早期历史——人工神经网络
2.1.1 人工神经网络的定义
2.1.2 感知机学习规则
2.2 感知机分类鸢尾
2.3 自适应神经学习
2.4 大规模机器学习与随机梯度下降
2.4.1 梯度下降算法概述
2.4.2 批量梯度下降算法
2.4.3 随机梯度下降算法
2.4.4 小批量梯度下降算法
2.4.5 梯度下降算法的调优
第3章 sklearn机器学习分类器
3.1 分类器的选择
3.2 训练感知器
3.3 基于逻辑回归的分类概率建模
3.3.1 几个相关定义
3.3.2 逻辑代价函数的权重
3.3.3 正则化解决过拟合问题
3.4 支持向量机最大化分类间隔
3.4.1 超平面
3.4.2 函数间隔和几何间隔
3.4.3 间隔最大化
3.5 核SVM解决非线性分类问题
3.5.1 处理非线性不可分数据的核方法
3.5.2 核函数实现高维空间的分离超平面
3.6 决策树
3.6.1 何为决策树
3.6.2 决策树生成
3.6.3 决策树的剪枝
3.6.4 使用sklearn预测个人情况
3.7 K近邻算法
3.7.1 K近邻算法的原理
3.7.2 K近邻算法的实现
3.8 贝叶斯算法
3.8.1 贝叶斯算法的基本思想
3.8.2 贝叶斯算法的模型
3.8.3 用sklearn实现贝叶斯分类
第4章 数据预处理
4.1 数据清洗
4.1.1 缺失值处理
4.1.2 异常值分析
4.2 对某一列编码
4.3 划分训练集与测试集
4.3.1 伪随机数划分
4.3.2 交叉验证
4.4 数据特征缩放
4.4.1 特征标准化/方差缩放
4.4.2 特征归一化
4.5 特征选择
4.5.1 Filter
4.5.2 Wrapper
4.5.3 基于L1的正则化
第5章 降维实现数据压缩
5.1 数据降维
5.2 主成分降维
5.2.1 主成分分析步骤
5.2.2 PCA算法实现
5.2.3 降维映射PCA的实现与应用
5.3 线性判别分析监督数据压缩
5.3.1 线性判别分析基本思想
5.3.2 LDA公式推导
5.3.3 拉格朗日函数问题
5.3.4 LDA实现数据降维
5.3.5 基于sklearn的线性判别分析
5.4 非线性映射核主成分降维
5.4.1 核函数与核技巧
5.4.2 KPCA与PCA降维实现
第6章 不同模型的集成学习
6.1 集成学习
6.2 多投票机制组合分类器
6.3 Bagging算法
6.4 Boosting模型
6.4.1 Boosting的基本思路
6.4.2 AdaBoost算法
6.4.3 Gradient Boosting算法
6.5 Stacking模型
6.5.1 Stacking原理
6.5.2 Stacking模型实现
第7章 连续变量的回归分析
7.1 线性回归
7.1.1 简单线性回归
7.1.2 多元线性回归
7.1.3 相关矩阵查看关系
7.1.4 协方差与相关性
7.2 最小二乘线性回归
7.2.1 梯度下降法
7.2.2 通过sklearn估计回归模型的系数
7.3 使用RANSAC算法拟合健壮回归模型
7.4 线性回归模型性能的评估
7.4.1 线性回归算法的衡量标准
7.4.2 线性回归算法应用实例
7.5 利用正则化方法进行回归
7.5.1 岭回归
7.5.2 Lasso回归
7.5.3 弹性网络
7.6 将线性回归模型转换为多项式回归
7.7 用随机森林处理非线性关系
7.7.1 决策树
7.7.2 随机森林回归
第8章 数据的聚类分析
8.1 K-Means算法
8.1.1 K-Means算法原理
8.1.2 K-Means算法步骤
8.1.3 K-Means算法的缺陷
8.1.4 使用sklearn进行K-Means聚类
8.1.5 肘法与轮廓法
8.1.6 K-Means++算法
8.2 层次聚类
8.3 DBSCAN算法
8.3.1 DBSCAN算法相关概念
8.3.2 DBSCAN算法的优缺点
8.3.3 DBSCAN算法实现
第9章 从单层到多层的人工神经网络
9.1 人工神经网络建模复杂函数
9.1.1 单隐层神经网络概述
9.1.2 多层神经网络结构
9.1.3 前向传播激活神经网络
9.1.4 反向传播
9.2 识别手写数字
9.2.1 神经网络算法实现数字的识别
9.2.2 实现多层感知器
第10章 使用深度卷积神经网络实现图像分类
10.1 构建卷积神经网络
10.1.1 深度学习
10.1.2 CNN的原理
10.1.3 使用CNN实现手写体识别
10.2 使用LeNet-5实现图像分类
10.3 使用AlexNet实现图片分类
10.3.1 AlexNet结构分析
10.3.2 AlexNet的分类实现
10.4 VGG16的迁移学习实现
10.5 使用OpenCV实现人脸识别
10.5.1 人脸检测
10.5.2 车牌检测
10.5.3 目标检测
10.6 使用OpenCV实现网络迁移
第11章 使用循环神经网络实现序列建模
11.1 RNN
11.1.1 RNN的发展历史
11.1.2 什么是RNN
11.1.3 LSTM结构和GRU结构
11.1.4 序列模型实现
11.2 双向循环神经网络
11.3 Seq2Seq模型序列分析
11.3.1 Seq2Seq模型
11.3.2 如何训练Seq2Seq模型
11.3.3 利用Seq2Seq进行时间序列预测
第12章 使用生成对抗网络合成新数据
12.1 GAN原理
12.2 GAN应用
12.3 强化学习
12.3.1 强化学习的方式
12.3.2 强化学习系统与特点
12.3.3 GAN损失函数
12.3.4 马尔可夫决策
12.3.5 Q-learning算法
12.3.6 策略梯度
12.3.7 强化学习的经典应用
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...