-
内容大纲
无论你是计算机视觉领域的新手,还是希望在该领域进一步发展,本书都将引领你扎实掌握神经网络和PyTorch的基础知识,并教会你如何将这些知识巧妙应用于现实世界的复杂任务,实现前沿架构的落地实践。
本书紧跟技术前沿,全面更新并深度解析了当下热门的多模态模型,如CLIP和Stable Diffusion,同时精心配备了大量实际案例,让你在理论与实践的交融中快速提升技能。
本书详细阐述了图像处理、精准调整超参数以及将模型成功投入生产环境的一系列最佳实践。随着学习的逐步深入,你将亲身体验并实现面部关键点识别、多目标精准检测、图像精细分割以及人体姿态检测等丰富多样的计算机视觉用例。在探索不同生成对抗网络架构的奇妙旅程中,你将为图像生成领域筑牢坚实的技术根基。此外,你还将熟练运用基于Transformer的先进架构(如ViT、TrOCR、BLIP2和LayoutLM等)轻松执行各类实际任务,并从零开始构建扩散模型。借助基础模型的强大功能,你将轻松实现零样本目标检测与图像分割等高难度任务,最终掌握模型部署到生产环境的最佳实践。
学完本书,你将能够熟练运用现代神经网络架构,从容应对现实世界中纷繁复杂的计算机视觉挑战。
通过阅读本书,你将能够:
熟练掌握计算机视觉领域中各类基于Transformer的架构、CLIP模型、Segment-Anything(任意分割)模型与Stable Diffusion模型,并测试它们在图像修复、姿态迁移等场景的应用。
把计算机视觉与自然语言处理相结合,实现光学字符识别、文档图像键值提取、视觉问答以及生成式人工智能任务。
实现多目标检测与分割功能。
利用基础模型,在无须训练任何数据点的情况下完成目标检测与分割任务。
掌握模型部署到生产环境的最佳实践。 -
作者介绍
-
目录
译者序
前言
作者简介
审校者简介
第一部分 基于计算机视觉的深度学习基础
第1章 人工神经网络基础
1.1 对比人工智能与传统机器学习
1.2 学习人工神经网络的构建块
1.3 实现前向传播
1.3.1 计算隐藏层的单元值
1.3.2 应用激活函数
1.3.3 计算输出层的值
1.3.4 计算损失值
1.3.5 编码实现前向传播
1.4 实现反向传播
1.4.1 编码实现梯度下降
1.4.2 利用链式法则实现反向传播
1.4.3 将前向传播与反向传播相结合
1.5 了解学习率的影响
1.5.3 学习率为1
1.6 神经网络训练过程概述
1.7 本章小结
1.8 习题
第2章 PyTorch基础
2.1 安装PyTorch
2.2 PyTorch张量
2.2.1 初始化张量
2.2.2 张量运算
2.2.3 张量对象的自动梯度
2.2.4 PyTorch张量相对于NumPy数组的优势
2.3 使用PyTorch构建神经网络
2.3.1 数据集、数据加载器与批处理大小
2.3.2 根据新的数据点进行预测
2.3.3 实现自定义损失函数
2.3.4 获取神经网络中间层的值
2.4 使用顺序方法构建神经网络
2.5 保存并加载PyTorch模型
2.5.1 使用state_dict
2.5.2 保存
2.5.3 加载
2.6 本章小结
2.7 习题
第3章 使用PyTorch构建深度神经网络
3.1 图像表示
……
第二部分 物体分类与检测
第三部分 图像处理
第四部分 计算机视觉与其他技术的融合
附录
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
