-
内容大纲
本书详细介绍YOLO目标检测核心技术与前沿进展,涵盖基础概念、主流算法框架及其实际应用场景。本书分为3部分,共10章。基础理论部分(第1~3章):介绍目标检测的核心概念、评估指标与公开数据集,常用的深度学习框架及其目标检测开发环境的搭建与使用,以及卷积神经网络(CNN)的核心原理与经典架构。技术实现部分(第4~8章):重点介绍YOLO目标检测框架的技术演进,从YOLOv1到YOLOv11,涵盖特征提取、特征融合、Anchor机制、损失函数优化、多维注意力机制等关键技术,并结合实际案例介绍YOLOv11的小目标检测实现过程。实战应用部分(第9、10章):以交通场景中的目标检测为例,介绍YOLOv11在实际项目中的应用,以及开放世界目标检测技术YOLO-UniOW框架在动态开放环境下的表现。
本书内容系统且案例丰富,适合计算机专业的学生、目标检测领域的初学者,以及希望深入掌握目标检测最新进展的科研人员与工程师使用。 -
作者介绍
凌峰,博士,就职于985高校,长期从事机器学习、人工智能、计算机视觉及大语言模型方向的研发与教学工作。专注于模型优化、训练加速与数据驱动算法设计,具备扎实的理论基础与丰富的实践经验,主持及参与多项相关科研项目,致力于推动大模型及多模态技术在教学与产业中的落地应用。 -
目录
第1部分 基础理论
第1章 目标检测概述
1.1 目标检测的基础概念
1.1.1 目标检测的定义与任务
1.1.2 目标检测的评估指标
1.1.3 目标检测方法的分类
1.1.4 目标检测方法的发展历程
1.2 目标检测的实际应用
1.2.1 人脸识别的进展与挑战
1.2.2 智慧交通中的目标检测应用
1.2.3 工业自动化检测的趋势
1.3 公开数据集与标准评测
1.3.1 PASCALVOC数据集
1.3.2 MSCOCO数据集
1.3.3 Visdrone数据集
1.4 本章小结
1.5 思考题
第2章 常用的深度学习框架
2.1 深度学习框架概述
2.1.1 Theano与TensorFlow
2.1.2 PyTorch
2.1.3 MXNet与Keras
2.2 搭建目标检测开发环境
2.2.1 使用Anaconda与Conda管理环境
2.2.2 配置PyTorch与TensorFlow
2.2.3 处理GPU与多GPU训练环境
2.3 数据处理与NumPy
2.3.1 创建与操作数组
2.3.2 矩阵运算与广播
2.3.3 数据增强与转换
2.4 本章小结
2.5 思考题
第3章 卷积神经网络
3.1 CNN的基础结构与原理
3.1.1 卷积层与池化层
3.1.2 激活函数与批量归一化
3.1.3 Dropout与正则化
3.2 经典卷积神经网络架构
3.2.1 LeNet与AlexNet
3.2.2 VGGNet与GoogLeNet
3.2.3 ResNet与DenseNet
3.3 高效卷积网络与自适应特征融合
3.3.1 Depthwise卷积与轻量化设计
3.3.2 特征金字塔网络
3.3.3 高效卷积网络的实践应用
3.4 本章小结
3.5 思考题
第2部分 技术实现
第4章 目标检测的前处理与数据增强
4.1 数据增强技术概述
4.1.1 图像裁剪与缩放
4.1.2 随机翻转与旋转
4.1.3 亮度与对比度的随机变化
4.2 数据的标准化与格式化
4.2.1 数据集的创建与预处理
4.2.2 VOC与COCO格式的转换
4.3 数据增强的新技术
4.3.1 图像混合技术:CutMix与MixUp
4.3.2 GAN生成的图像增强
4.3.3 自监督学习在数据增强中的应用
4.4 本章小结
4.5 思考题
第5章 YOLO架构初步演化与具体实现
5.1 YOLOv1的基本结构与工作原理
5.1.1 目标检测的回归问题
5.1.2 YOLOv1的优势与局限
5.2 YOLOv2与新技术的加入
5.2.1 批归一化与高分辨率特征图
5.2.2 先验框与多尺度训练
5.3 YOLOv3与性能优化
5.3.1 特征融合与多尺度检测
5.3.2 改进的损失函数
5.4 YOLOv4的创新与应用
5.4.1 结合CSPNet与PANet
5.4.2 高效训练策略
5.5 YOLOv5与YOLOv6的现代化设计
5.5.1 模块化设计与性能优化
5.5.2 YOLOv5在移动端的应用
5.6 初步实战:基于YOLOv5的目标检测框架实现
5.6.1 环境配置与框架搭建
5.6.2 模型训练结果分析及评价指标解析
5.6.3 加入CBAM模块的目标检测改进
5.6.4 基于Transformer的多头注意力机制改进
5.7 本章小结
5.8 思考题
第6章 YOLOv7至YOLOv11的一些改进
6.1 YOLOv7的特性与技术创新详解
6.1.1 新的主干网络与特征提取模块
6.1.2 对抗性训练与自监督学习
6.2 YOLOv8与YOLOv10创新技术点详解
6.2.1 多尺度特征融合与自适应池化
6.2.2 YOLOv8的轻量化与实时检测
6.3 YOLOv11:高效目标检测
6.3.1 YOLOv11的全新架构与自适应模块
6.3.2 在大规模数据集上的表现
6.3.3 YOLOv11的移动端推理优化
6.4 本章小结
6.5 思考题
第7章 目标检测改进方法与最新技术
7.1 RetinaNet简介
7.1.1 RetinaNet的网络架构
7.1.2 如何解决类别不平衡问题
7.2 改进的多维度注意力机制
7.2.1 多维度注意力机制的基本概念
7.2.2 多维注意力模块的实现
7.3 弱化的非极大值抑制算法
7.3.1 NMS的改进方法
7.3.2 弱化NMS的优势
7.4 RetinaNet的损失函数与训练策略
7.4.1 FocalLoss的原理与实现
7.4.2 焦点损失在密集目标检测中的应用
7.4.3 自适应学习率策略
7.5 基于LSTM的视频目标检测
7.5.1 LSTM的基本概念
7.5.2 LSTM网络与视频目标检测
7.5.3 记忆引导网络
7.5.4 交叉检测原理
7.5.5 交叉检测框架的应用
7.5.6 LSTM网络的训练与优化
7.6 对抗样本与模型健壮性
7.6.1 对抗样本的生成与防御
7.6.2 模型健壮性的提升方法
7.7 本章小结
7.8 思考题
第8章 DETR:Transformer在目标检测中的应用
8.1 DETR架构与Transformer的结合
8.1.1 DETR的主干网络
8.1.2 基于Transformer的YOLO框架改进
8.2 DETR的实现与训练
8.2.1 数据预处理与样本匹配
8.2.2 以YOLOv11为例:损失函数与优化
8.3 本章小结
8.4 思考题
第3部分 实战应用
第9章 基于YOLOv11架构的密集小目标检测实战
9.1 小目标检测的挑战与YOLOv11的优化策略
9.1.1 小目标检测的技术难点
9.1.2 YOLOv11的Anchor机制与特征融合
9.1.3 自适应损失函数与小目标优化
9.2 YOLOv11的训练流程与技术实现
9.2.1 数据预处理与小目标数据构建
9.2.2 YOLOv11的训练流程与超参数调优
9.2.3 使用PyTorch训练YOLOv11模型
9.2.4 YOLOv11源码文件结构及各文件的作用
9.3 后处理与优化:精确检测小目标
9.3.1 YOLOv11的后处理流程
9.3.2 自定义NMS算法与小目标优化
9.4 YOLOv11在小目标检测中的实战案例
9.4.1 基于YOLOv11的交通目标与行人检测
9.4.2 模型评估与性能优化
9.4.3 实战项目中的调优与结果分析
9.5 本章小结
9.6 思考题
第10章 领域前沿:开放世界目标检测技术
10.1 开放世界目标检测OWOD的核心问题
10.1.1 闭集目标检测的局限性
10.1.2 OWOD的核心问题
10.2 YOLO-UniOW开放世界框架
10.2.1 YOLO-UniOW开放世界框架简介
10.2.2 自适应决策学习
10.2.3 通配符学习的原理
10.2.4 无须增量学习的动态适配机制
10.3 YOLO-UniOW的性能评估与应用实践
10.3.1 多数据集实验分析
10.3.2 实际应用场景中的表现
10.3.3 与现有框架的对比与未来发展
10.4 本章小结
10.5 思考题
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
