-
内容大纲
本书是神经网络课程的入门教材,用通俗易懂的语言讲解神经网络的相关知识。本书共6章,第1章对神经网络领域进行概述,包括其历史和应用;第2章深入探讨神经元的数学模型,包括其输入、权值、偏置和激活函数;第3章介绍感知机的概念,讨论感知机的结构,并解释如何用它来解决简单的分类问题;第4章介绍多层感知机的概念,讲述如何使用前馈传播和反向传播,同时详细介绍了反向传播中用到的链式法则;第5章涵盖训练神经网络时使用的各种参数和算子;第6章介绍神经网络的分布式学习、压缩和解释,其中分布式学习涵盖使用多台计算机或设备在大型数据集上训练神经网络的内容。 -
作者介绍
申富饶,计算机软件新技术全国重点实验室(南京大学)、南京大学人工智能学院教授、博士生导师。主要研究方向包括神经网络、数据分析、机器人智能等,在国内外发表学术论文120余篇。 -
目录
前言
主要符号表
第1章 绪论
1.1 神经网络简介
1.1.1 神经网络的定义
1.1.2 神经网络的工作过程
1.2 神经网络的应用
1.3 神经网络的研究目标
1.4 神经网络的发展历史
1.4.1 历史大事件概述
1.4.2 神经网络领域的重要人物及团队
1.4.3 神经网络领域的重要期刊
1.5 神经网络的研究现状
1.6 神经网络的研究方法
1.7 小结
练习
第2章 神经元
2.1 神经元模型
2.1.1 生物神经元
2.1.2 人工神经元
2.2 神经元的组成成分
2.2.1 神经元的激发
2.2.2 神经元的整合
2.3 感知机神经元
2.3.1 感知机神经元模型
2.3.2 感知机神经元的学习
2.3.3 感知机神经元的学习规则
2.3.4 神经元模型的特性
2.4 神经元的应用
2.4.1 单元线性回归
2.4.2 多元线性回归
2.4.3 双输入–单输出的线性分类
2.4.4 单个神经元的局限
2.5 小结
练习
第3章 单层感知机
3.1 神经元的连接
3.1.1 神经元的连接概述
3.1.2 神经网络的扩展
3.1.3 其他连接方式
3.2 单层感知机
3.2.1 单层感知机的结构和数学表达
3.2.2 最小均方算法
3.2.3 最小均方算法的优势与缺陷
3.2.4 将最小均方算法用于感知机
3.2.5 感知机收敛定理
3.3 单层感知机的应用
3.3.1 用感知机分析健康及收入状况
3.3.2 用感知机求解线性二分类问题
3.3.3 多输入–多输出的线性三分类问题
3.4 小结
练习
第4章 多层感知机
4.1 引入隐藏层的必要性
4.1.1 单层感知机的局限
4.1.2 单隐藏层神经网络
4.1.3 单隐藏层神经网络的数学表示
4.1.4 多隐藏层
4.2 多层感知机的基本概念
4.2.1 多层感知机的数学表示
4.2.2 多层感知机的运行
4.2.3 示例:异或问题
4.2.4 示例:双月模型
4.3 多层感知机的学习
4.3.1 基本原理
4.3.2 感知机学习与逼近方法的数学分析
4.3.3 梯度下降法
4.3.4 反向传播算法
4.3.5 反向传播算法分析
4.3.6 反向传播算法改进
4.4 多层感知机的深入分析
4.4.1 通用近似定理
4.4.2 网络结构超参数选择
4.4.3 神经元排列方式的影响
4.5 多层感知机的应用
4.5.1 环数据集分类任务
4.5.2 手写数字分类任务
4.5.3 Fashion-MNIST分类任务
4.5.4 函数拟合任务
4.5.5 曲面拟合任务
4.6 小结
练习
第5章 神经网络模型优化
5.1 学习率
5.1.1 学习率的影响
5.1.2 常见的学习率选择方法
5.2 损失函数
5.2.1 回归损失函数
5.2.2 分类损失函数
5.3 正则化
5.3.1 泛化能力
5.3.2 常见的正则化方法
5.4 归一化
5.4.1 简单的归一化方法
5.4.2 神经网络中的归一化方法
5.5 参数初始化
5.5.1 全0初始化
5.5.2 常见的权值矩阵初始化方法
5.5.3 常见的偏置矩阵初始化方法
5.5.4 初始化参数对训练的优化程度
5.6 网络预训练
5.6.1 无监督预训练
5.6.2 有监督预训练
5.7 TREC分类任务
5.7.1 任务介绍
5.7.2 解决方案
5.7.3 实验结果
5.7.4 模型优化
5.8 小结
练习
第6章 神经网络的分布式学习、压缩和解释
6.1 神经网络分布式学习
6.1.1 分布式学习简介
6.1.2 常用的分布式划分方法
6.1.3 常用的通信机制
6.1.4 常用的模型聚合方法
6.1.5 使用PyTorch进行分布式学习
6.2 神经网络压缩
6.2.1 神经网络压缩的意义和定义
6.2.2 神经网络压缩方法
6.2.3 神经网络剪枝
6.3 神经网络可解释性
6.3.1 神经网络可解释性简介
6.3.2 神经网络可解释性方法分类
6.3.3 神经网络可解释性方法评估
6.3.4 神经网络可解释性研究展望
6.3.5 使用PyTorch进行可解释性分析
6.4 小结
练习
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...