- PyTorch计算机视觉实战(目标检测图像处理与大模型原书第2版)/智能系统与技术丛书
- - 作者：(印)V·基肖尔·阿耶德瓦拉//耶什万斯·雷迪|责编:王春华//冯润峰|译者:刘冰//杨勇
  - 出版社：机械工业
  - ISBN：9787111794905
  - 出版日期：2026/01/01
  - 页数：569
- 售价：63.6

内容大纲
    无论你是计算机视觉领域的新手，还是希望在该领域进一步发展，本书都将引领你扎实掌握神经网络和PyTorch的基础知识，并教会你如何将这些知识巧妙应用于现实世界的复杂任务，实现前沿架构的落地实践。
    本书紧跟技术前沿，全面更新并深度解析了当下热门的多模态模型，如CLIP和Stable Diffusion，同时精心配备了大量实际案例，让你在理论与实践的交融中快速提升技能。
    本书详细阐述了图像处理、精准调整超参数以及将模型成功投入生产环境的一系列最佳实践。随着学习的逐步深入，你将亲身体验并实现面部关键点识别、多目标精准检测、图像精细分割以及人体姿态检测等丰富多样的计算机视觉用例。在探索不同生成对抗网络架构的奇妙旅程中，你将为图像生成领域筑牢坚实的技术根基。此外，你还将熟练运用基于Transformer的先进架构（如ViT、TrOCR、BLIP2和LayoutLM等）轻松执行各类实际任务，并从零开始构建扩散模型。借助基础模型的强大功能，你将轻松实现零样本目标检测与图像分割等高难度任务，最终掌握模型部署到生产环境的最佳实践。
    学完本书，你将能够熟练运用现代神经网络架构，从容应对现实世界中纷繁复杂的计算机视觉挑战。
    通过阅读本书，你将能够：
    熟练掌握计算机视觉领域中各类基于Transformer的架构、CLIP模型、Segment-Anything（任意分割）模型与Stable Diffusion模型，并测试它们在图像修复、姿态迁移等场景的应用。
    把计算机视觉与自然语言处理相结合，实现光学字符识别、文档图像键值提取、视觉问答以及生成式人工智能任务。
    实现多目标检测与分割功能。
    利用基础模型，在无须训练任何数据点的情况下完成目标检测与分割任务。
    掌握模型部署到生产环境的最佳实践。
作者介绍
目录
译者序
前言
作者简介
审校者简介
第一部分  基于计算机视觉的深度学习基础
  第1章  人工神经网络基础
    1.1  对比人工智能与传统机器学习
    1.2  学习人工神经网络的构建块
    1.3  实现前向传播
      1.3.1  计算隐藏层的单元值
      1.3.2  应用激活函数
      1.3.3  计算输出层的值
      1.3.4  计算损失值
      1.3.5  编码实现前向传播
    1.4  实现反向传播
      1.4.1  编码实现梯度下降
      1.4.2  利用链式法则实现反向传播
      1.4.3  将前向传播与反向传播相结合
    1.5  了解学习率的影响
      1.5.3  学习率为1
    1.6  神经网络训练过程概述
    1.7  本章小结
    1.8  习题
  第2章  PyTorch基础
    2.1  安装PyTorch
    2.2  PyTorch张量
      2.2.1  初始化张量
      2.2.2  张量运算
      2.2.3  张量对象的自动梯度
      2.2.4  PyTorch张量相对于NumPy数组的优势
    2.3  使用PyTorch构建神经网络
      2.3.1  数据集、数据加载器与批处理大小
      2.3.2  根据新的数据点进行预测
      2.3.3  实现自定义损失函数
      2.3.4  获取神经网络中间层的值
    2.4  使用顺序方法构建神经网络
    2.5  保存并加载PyTorch模型
      2.5.1  使用state_dict
      2.5.2  保存
      2.5.3  加载
    2.6  本章小结
    2.7  习题
  第3章  使用PyTorch构建深度神经网络
    3.1  图像表示
  ……
第二部分  物体分类与检测
第三部分  图像处理
第四部分  计算机视觉与其他技术的融合
附录

内容大纲

作者介绍

目录

同类热销排行榜

推荐书目