-
-
- 深度学习(新一代信息技术人工智能与机器人战略性新兴领域十四五高等教育系列教材)
-
- 作者:编者:李侃//孙新|责编:吉玲//刘丽敏
- 出版社:机械工业
- ISBN:9787111771616
-
售价:23.6
-
内容大纲
本书是一本体系完整、算法和案例丰富的人工智能类教材。本书系统地讲解深度学习的理论与方法,主要内容包括绪论、深度学习基础、卷积神经网络、循环神经网络、深度序列模型、深度生成网络、图神经网络、注意力机制、深度强化学习、深度迁移学习、无监督深度学习。本书通过丰富的实例讲解方法的应用;强调深度学习的系统性、方法的时效性,同时针对深度学习快速发展的特点,讲解深度学习的最新技术,本书配备了实例的数字化资源,供学习者下载。
本书既可以作为国内各高等学校、科研院所本科生、研究生的教材,也可以供国内外从事深度学习的研究人员和工程人员使用。
-
作者介绍
-
目录
序
前言
第1章 绪论
1.1 深度学习简介
1.2 深度学习的发展历史
1.2.1 深度学习技术的发展历史
1.2.2 深度学习产业应用的变迁史
1.3 深度学习的分类
1.3.1 任务类型
1.3.2 模型类型
1.4 度量指标
1.4.1 回归任务指标
1.4.2 分类任务指标
1.4.3 生成任务指标
本章小结
思考题与习题
参考文献
第2章 深度学习基础
2.1 线性代数
2.1.1 标量和向量
2.1.2 矩阵和张量
2.1.3 矩阵计算
2.1.4 范数
2.2 微积分
2.2.1 导数和微分
2.2.2 偏导数和梯度
2.2.3 链式法则
2.3 概率论
2.3.1 概率分布
2.3.2 期望和方差
2.3.3 条件概率和联合概率
2.3.4 全概率公式与贝叶斯定理
2.3.5 边缘概率分布
2.4 距离与相似度计算
2.4.1 常见的距离计算
2.4.2 常见的相似度计算
2.5 激活函数
2.6 感知机与多层感知机
2.6.1 感知机
2.6.2 多层感知机
2.7 反向传播算法
本章小结
思考题与习题
参考文献
第3章 卷积神经网络
3.1 简介
3.1.1 基本概念
3.1.2 发展历程
3.2 基础模块
3.2.1 端到端架构
3.2.2 输入层
3.2.3 卷积层
3.2.4 池化层
3.2.5 激活层
3.2.6 全连接层
3.2.7 目标函数
3.3 典型卷积神经网络
3.3.1 LeNet-5
3.3.2 AlexNet
3.3.3 VGGNet
3.3.4 GoogLeNet
3.3.5 ResNet
3.3.6 R-CNN系列
3.3.7 YOLO系列
3.3.8 MobileNet
3.3.9 Conformer
3.4 各种卷积
3.4.12 D卷积
3.4.23 D卷积
3.4.31 ×1卷积
3.4.4 空间可分离卷积
3.4.5 深度可分离卷积
3.4.6 分组卷积
3.4.7 扩张卷积
3.5 卷积神经网络实例
3.5.1 实例背景
3.5.2 数据准备
3.5.3 模型构建与训练
3.5.4 模型评估与调整
本章小结
思考题与习题
参考文献
第4章 循环神经网络
4.1 循环神经网络的结构
4.2 循环神经网络的训练
4.2.1 损失函数
4.2.2 时间反向传播算法
4.2.3 梯度消失与梯度爆炸
4.3 双向循环神经网络与深度循环神经网络
4.4 长短期记忆网络
4.4.1 LSTM记忆单元
4.4.2 LSTM记忆方式
4.5 门控循环单元
4.6 递归神经网络
4.7 双向长短期记忆网络与双向门控循环单元
4.8 应用实例
4.8.1 实例背景
4.8.2 基本流程
本章小结
思考题与习题
参考文献
第5章 深度序列模型
5.1 深度序列模型概述
5.1.1 深度序列模型结构
5.1.2 序列生成模型解决的问题
5.2 编码器-解码器架构
5.3 序列到序列模型
5.4 融入注意力机制的序列到序列模型
5.5 Transformer架构
5.5.1 Transformer的输入
5.5.2 Transformer编码器
5.5.3 Transformer解码器
5.6 Transformer变体
5.6.1 Transformer的模块变体
5.6.2 Transformer的应用变体
5.7 深度序列模型实例
5.7.1 实例背景
5.7.2 数据准备
5.7.3 模型构建
5.7.4 模型训练与应用
本章小结
思考题与习题
参考文献
第6章 深度生成网络
6.1 深度生成模型简介
6.2 基于玻尔兹曼机的方法
6.2.1 受限玻尔兹曼机
6.2.2 深度置信网络
6.2.3 深度玻尔兹曼机
6.3 基于变分自动编码器的方法
6.3.1 VAE模型的基本原理
6.3.2 几种重要的VAE结构
6.4 基于生成对抗网络的方法
6.4.1 生成对抗网络的基本原理
6.4.2 生成对抗网络的稳定性研究
6.4.3 生成对抗网络的结构发展
6.5 基于流模型的方法
6.5.1 流模型的基本原理
6.5.2 常规流
6.5.3 流模型的衍生结构
6.6 基于扩散模型的方法
6.6.1 扩散模型的基本原理
6.6.2 条件扩散模型的技术方案
6.7 基于自回归网络的方法
6.7.1 自回归网络的基本原理
6.7.2 自回归网络的衍生结构
6.8 大语言模型
6.8.1 模型架构
6.8.2 常用大模型
6.8.3 预训练大语言模型的优化技巧
6.9 深度生成模型实例
本章小结
思考题与习题
参考文献
第7章 图神经网络
7.1 图神经网络概述
7.1.1 图神经网络的发展起源
7.1.2 图神经网络的设计
7.1.3 图神经网络计算模块
7.2 图卷积神经网络
7.2.1 基于谱的方法
7.2.2 基于空间的方法
7.3 图循环网络
7.3.1 基于门控循环单元的方法
7.3.2 基于长短期记忆网络的方法
7.4 图注意力网络
7.4.1 基于自注意力的方法
7.4.2 基于层注意力的方法
7.5 图神经网络实例
7.5.1 实例背景
7.5.2 数据准备
7.5.3 模型构建与训练
本章小结
思考题与习题
参考文献
第8章 注意力机制
8.1 注意力机制简介
8.1.1 基本概念
8.1.2 发展历程
8.2 注意力模型基本架构
8.3 注意力机制分类
8.3.1 一般模式注意力
8.3.2 键值对模式注意力
8.3.3 多头注意力
8.4 注意力模型
8.4.1 通道&空间注意力
8.4.2 混合注意力
8.4.3 自注意力
8.4.4 类别注意力
8.4.5 时间注意力
8.4.6 频率注意力
8.4.7 全局注意力
8.5 注意力机制实例
8.5.1 实例背景
8.5.2 数据准备
8.5.3 模型构建与训练
8.5.4 模型评估与调整
8.5.5 实例运行结果
本章小结
思考题与习题
参考文献
第9章 深度强化学习
9.1 强化学习基本概念
9.1.1 强化学习基础框架
9.1.2 强化学习关键要素
9.1.3 马尔可夫决策过程
9.2 深度价值学习
9.2.1 DQN
9.2.2 TD算法
9.2.3 噪声DQN
9.3 深度策略学习
9.3.1 策略梯度
9.3.2 策略梯度理论证明
9.3.3 REINFORCE算法
9.3.4 Actor-Critic学习
9.3.5 带基线的策略梯度方法
9.4 模仿学习
9.4.1 模仿学习基础
9.4.2 逆强化学习
9.5 基于人类反馈的强化学习
9.6 深度强化学习实例
9.6.1 实例背景
9.6.2 环境准备
9.6.3 模型构建
9.6.4 模型训练
本章小结
思考题与习题
参考文献
第10章 深度迁移学习
10.1 迁移学习
10.1.1 深度迁移学习简介
10.1.2 深度迁移学习分类
10.2 基于微调的方法
10.3 基于冻结CNN层的方法
10.4 渐进式学习方法
10.5 基于对抗思想的方法
10.6 相关数据集
10.7 深度迁移学习实例
10.7.1 背景
10.7.2 数据准备
10.7.3 模型构建与训练
本章小结
思考题与习题
参考文献
第11章 无监督深度学习
11.1 概述
11.2 基于掩码的任务
11.3 基于语言模型的任务
11.4 基于时序的任务
11.5 基于对比学习的任务
11.6 经典无监督深度学习模型
11.6.1 掩码自动编码器
11.6.2 BERT模型
11.6.3 GPT模型
11.6.4 BEiT模型
11.6.5 SimCLR模型
11.7 无监督深度学习实例
11.7.1 数据准备
11.7.2 模型构建
11.7.3 模型训练
本章小结
思考题与习题
参考文献