-
内容大纲
本书是清华大学自动化系国家精品课程“模式识别基础”和“模式识别与机器学习”的配套教材,是在第1~4版(分别于1988年、2000年、2010年和2021年由清华大学出版社出版发行)的基础上重写而成的。与第3版和第4版相比,第5版一方面针对教学和自学需求进行了进一步浓缩和提炼,另一方面增加了对于包括大语言模型在内的人工智能与机器学习最新发展的基本原理的介绍,从而更好地保持了模式识别学科核心内容的系统性与人工智能最新进展之间的平衡,使读者能在有限学时内更好地掌握模式识别与机器学习学科的核心原理及发展脉络。
本书可以作为高等院校信息类、智能类、数据科学类专业的研究生和高年级本科生学习模式识别与机器学习的教材,也可以供各行业学习和应用机器学习与模式识别的研究者、学生和工程技术人员参考。 -
作者介绍
-
目录
第1章 概论
1.1 智能、识别、学习
1.2 模式识别的基本任务和系统典型构成
1.3 本书主要内容与推荐用法
第2章 统计决策方法
2.1 引言:一个简单的例子
2.2 最小错误率贝叶斯决策
2.3 最小风险贝叶斯决策
2.4 两类错误率、Neyman-Pearson决策与ROC曲线
2.5 正态分布时的统计决策
2.5.1 正态分布及其性质回顾
2.5.2 正态分布概率模型下的最小错误率贝叶斯决策
2.6 错误率的计算
2.6.1 正态分布且各类协方差矩阵相等情况下错误率的计算
2.6.2 高维独立随机变量时错误率的估计
2.7 错误率的实验估计
2.7.1 训练错误率
2.7.2 测试错误率
2.7.3 交叉验证
2.7.4 真实场景下需要考虑的更多问题
2.8 离散时间序列样本的统计决策
2.8.1 基因组序列的例子
2.8.2 马尔可夫模型及在马尔可夫模型下的贝叶斯决策
2.8.3 隐马尔可夫模型简介
2.9 贝叶斯网络简介与朴素贝叶斯分类器
2.9.1 贝叶斯网络的基本概念
2.9.2 贝叶斯网络模型的学习
2.9.3 朴素贝叶斯分类器
2.10 讨论
第3章 概率密度函数的估计
3.1 引言
3.2 最大似然估计
3.2.1 最大似然估计的基本原理
3.2.2 最大似然估计的求解
3.2.3 正态分布下的最大似然估计
3.3 贝叶斯估计与贝叶斯学习
3.3.1 贝叶斯估计
3.3.2 贝叶斯学习
3.3.3 正态分布时的贝叶斯估计
3.3.4 其他分布的情况
3.4 概率密度估计的非参数方法
3.4.1 非参数估计的基本原理与直方图方法
3.4.2 k_N近邻估计方法
3.4.3 Parzen窗法
3.5 讨论
第4章 线性学习机器与线性分类器
4.1 引言
4.2 线性回归
4.3 线性判别函数的基本概念
4.4 Fisher线性判别分析
4.5 感知器
4.6 最小平方误差判别
4.7 罗杰斯特回归
4.8 最优分类超平面与线性支持向量机
4.8.1 最优分类超平面
4.8.2 大间隔与推广能力
4.8.3 线性不可分情况
4.9 多类线性分类器
4.9.1 多个两类分类器的组合
4.9.2 多类线性判别函数
4.9.3 多类罗杰斯特回归与软最大
4.10 讨论
第5章 典型的非线性分类器
5.1 引言
5.2 分段线性判别函数
5.2.1 分段线性距离分类器
5.2.2 一般的分段线性判别函数
5.3 二次判别函数
5.4 多层感知器神经网络
5.4.1 神经元与感知器
5.4.2 用多个感知器实现非线性分类
5.4.3 反向传播算法
5.4.4 多层感知器网络用于模式识别
5.4.5 神经网络结构的选择
5.4.6 前馈神经网络与传统模式识别方法的关系
5.4.7 人工神经网络的一般知识
5.5 支持向量机
5.5.1 广义线性判别函数
5.5.2 核函数变换与支持向量机
5.5.3 支持向量机早期应用举例
5.5.4 支持向量机的实现算法
5.5.5 多类支持向量机
5.5.6 用于函数拟合的支持向量机——支持向量回归
5.6 核函数机器
5.6.1 大间隔机器与核函数机器
5.6.2 核Fisher判别
5.6.3 中心支持向量机
5.7 统计学习理论与正则化理论简介
5.7.1 统计学习理论简介
5.7.2 关于VC维与推广性界的核心结论
5.7.3 不适定问题和正则化方法简介
5.8 讨论
第6章 非参数学习机器与集成学习
6.1 引言
6.2 近邻法
6.2.1 最近邻法
6.2.2 k-近邻法
6.2.3 近邻法的快速算法
6.2.4 剪辑近邻法
6.2.5 压缩近邻法
6.3 决策树与随机森林
6.3.1 非数值特征的量化
6.3.2 决策树
6.3.3 过学习与决策树的剪枝
6.3.4 随机森林
6.4 Boosting集成学习
6.4.1 集成学习的基本思想与AdaBoost方法
6.4.2 XGBoost方法
6.5 讨论
第7章 特征选择
7.1 引言
7.2 用于分类的特征评价准则
7.2.1 基于类内类间距离的可分性判据
7.2.2 基于概率分布的可分性判据
7.2.3 基于熵的可分性判据
7.2.4 利用统计检验作为可分性判据
7.3 特征选择的最优算法
7.4 特征选择的次优算法
7.5 遗传算法
7.6 包裹法:以分类性能为准则的特征选择方法
7.7 讨论
第8章 特征提取与降维表示
8.1 引言
8.2 基于类别可分性判据的特征提取
8.3 主成分分析
8.4 Karhunen-Loève变换
8.4.1 K-L变换
8.4.2 用于监督模式识别的K-L变换
8.5 用“本征脸”作为人脸识别的特征
8.6 高维数据的低维可视化
8.7 多维尺度(MDS)法
8.7.1 MDS的概念
8.7.2 古典尺度法
8.7.3 度量型MDS
8.7.4 非度量型MDS
8.7.5 MDS在模式识别中的应用举例
8.8 非线性特征变换方法简介
8.8.1 核主成分分析(KPCA)
8.8.2 IsoMap方法和LLE方法
8.9 t-SNE降维可视化方法
8.10 特征提取与选择对分类器性能估计的影响
8.11 讨论
第9章 非监督学习与聚类
9.1 引言
9.2 基于模型的聚类方法
9.3 混合模型的估计
9.3.1 混合密度的最大似然估计
9.3.2 混合正态分布的参数估计
9.4 动态聚类算法
9.4.1 C均值算法(K均值算法)
9.4.2 ISODATA方法
9.4.3 基于核的动态聚类算法
9.5 模糊聚类方法
9.5.1 模糊集的基本知识
9.5.2 模糊C均值算法
9.5.3 改进的模糊C均值算法
9.6 分级聚类方法
9.7 自组织映射(SOM)神经网络
9.7.1 SOM网络结构
9.7.2 SOM学习算法和自组织特性
9.7.3 SOM网络用于模式识别
9.8 一致聚类方法
9.9 聚类结果的评价
9.9.1 聚类质量的自身评价
9.9.2 不同聚类结果的比较
9.10 讨论
第10章 深度学习与大模型简介
10.1 引言
10.2 多层感知器神经网络回顾
10.3 卷积神经网络(CNN)
10.3.1 卷积神经网络的基本构成
10.3.2 深度卷积神经网络
10.4 Hopfield网络与玻尔兹曼机
10.4.1 Hopfield网络
10.4.2 玻尔兹曼机与限制性玻尔兹曼机(RBM)
10.5 循环神经网络(RNN)与长短时记忆模型(LSTM)
10.5.1 循环神经网络(RNN)
10.5.2 长短时记忆模型(LSTM)
10.6 自编码器与生成模型
10.6.1 深度自编码器
10.6.2 变分自编码器(VAE)
10.6.3 生成对抗网络(GAN)
10.6.4 扩散模型简介
10.7 大语言模型简介
10.7.1 概率语言模型和词向量表示
10.7.2 注意力机制与Transformer
10.7.3 大语言模型概述
10.8 讨论
第11章 结语:模式识别、机器学习与人工智能
11.1 模式识别
11.2 机器学习
11.3 多元分析
11.4 人工智能
11.5 展望
参考文献
术语表
后记
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
