欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 计算机视觉导论(从传统方法到智能技术)
      • 作者:谢源//高岩//全红艳|责编:佘洁
      • 出版社:人民邮电
      • ISBN:9787115663177
      • 出版日期:2025/10/01
      • 页数:316
    • 售价:47.92
  • 内容大纲

        本书系统整合了计算机视觉领域的经典算法与现代智能视觉技术,全面介绍了该领域的核心理论与方法体系。本书内容丰富,涵盖了以下主要知识点:计算机视觉基本概念及技术基础、人类视觉感知与图像特征多层表达、图像特征与图像对齐、二值图像分析、区域分割、纹理特征分析、相机成像模型和标定技术、光流计算、三维重建、传统目标检测与识别算法、传统目标跟踪算法、智能目标识别与跟踪、三维点云特征及理解、视觉语言模型等。
        本书适合作为计算机科学与技术、软件工程及电子类专业本科生、研究生的教材或教学参考书,也可供从事计算机视觉应用与研究的开发人员和科研人员使用。对于计算机视觉先行课程知识欠缺的读者,本书提供了循序渐进、易于理解的学习路径,帮助他们系统掌握计算机视觉算法原理和关键技术。
  • 作者介绍

  • 目录

    第1章  计算机视觉基础
      1.1  概述
        1.1.1  计算机视觉概念
        1.1.2  计算机视觉的发展历史及应用
        1.1.3  与其他学科之间的关系
        1.1.4  计算机视觉算法流程
      1.2  数字图像基础
        1.2.1  数字图像基本概念
        1.2.2  数字图像质量影响因素
        1.2.3  数字图像基本运算
        1.2.4  数字图像的空域处理
        1.2.5  图像滤波处理
      1.3  机器学习与人工智能技术
        1.3.1  人工智能技术的发展
        1.3.2  机器学习概念及常用算法
        1.3.3  机器学习与深度学习
        1.3.4  深度学习技术的发展
        1.3.5  神经元与人工神经网络
        1.3.6  神经网络结构
        1.3.7  卷积神经网络
      1.4  计算机视觉编程基础
        1.4.1  Python语言简介
        1.4.2  图像处理的软件包
        1.4.3  深度学习编程框架
        1.4.4  深度学习编程实例
      习题
    第2章  人类视觉感知与图像特征多层表达
      2.1  人眼结构与视觉特性
        2.1.1  人眼结构
        2.1.2  人眼视觉特性
        2.1.3  人类视觉感知
        2.1.4  颜色感知与色彩空间
        2.1.5  视觉感知特征及作用
      2.2  图像的多层次表达
        2.2.1  图像金字塔与人类的感知
        2.2.2  图像金字塔技术的作用
      2.3  滤波器
        2.3.1  滤波器概念
        2.3.2  空域滤波器
        2.3.3  频域滤波处理
        2.3.4  图像滤波与金字塔生成
      2.4  深度学习的多层特征
        2.4.1  图像的卷积运算
        2.4.2  卷积神经网络及多层特征
      习题
    第3章  图像特征与图像对齐
      3.1  图像特征及常见类型
      3.2  点特征
      3.3  边缘特征
      3.4  区域特征

      3.5  多视图及特征对应
      3.6  特征匹配技术
      3.7  图像对齐技术基础
      3.8  全局图像对齐
        3.8.1  基于几何变换的对齐
        3.8.2  基于投影变换的对齐
      3.9  智能图像对齐
        3.9.1  块对齐算法
        3.9.2  最优匹配点的智能图像对齐算法
        3.9.3  智能几何变换对齐
        3.9.4  智能关键点匹配算法
      习题
    第4章  二值图像分析
      4.1  二值图像概念
      4.2  二值图像的创建
      4.3  连通性及连通成分标记
      4.4  区域的边界
      4.5  图像骨架化
      4.6  数学形态学处理方法
        4.6.1  数学形态学基本运算
        4.6.2  数学形态学处理算法
      4.7  二值图像的应用实例
      习题
    第5章  区域分割
      5.1  区域分割概念
      5.2  传统图像分割
        5.2.1  阈值分割法
        5.2.2  基于区域的分割技术
        5.2.3  基于轮廓的分割技术
      5.3  图像语义概念
      5.4  语义分割技术发展及CNN基础
      5.5  基于深度学习的语义分割
        5.5.1  基于FCN的语义分割技术
        5.5.2  其他语义分割网络
        5.5.3  基于注意力机制的语义分割
      5.6  基于区域的智能分割算法
      习题
    第6章  纹理特征分析
      6.1  纹理的定义及分类
      6.2  纹理特征分析的常用方法
      6.3  基于纹理的分类与识别
      6.4  图像修复
      6.5  图像风格化处理
      习题
    第7章  相机成像模型和标定技术
      7.1  从3D到2D的成像
      7.2  相机成像模型
      7.3  摄像机标定技术基础
      7.4  对极几何与摄像机自标定
      7.5  智能成像模型学习方法

      习题
    第8章  光流计算
      8.1  光流概念
      8.2  光流估计的用途
      8.3  运动场与光流的关系
      8.4  光流估计方法
      8.5  基于深度学习的光流估计
      8.6  基于光流的智能表情分析实例
      习题
    第9章  三维重建
      9.1  三维重建基础
      9.2  三维场景表达方法
        9.2.1  立体表面表达
        9.2.2  空间点云表达
        9.2.3  体表达
        9.2.4  体素表达
        9.2.5  深度映像表达
      9.3  三维形状重建
        9.3.1  基于明暗恢复形状
        9.3.2  基于纹理恢复形状
      9.4  主动视觉与被动视觉重建
        9.4.1  主动视觉重建
        9.4.2  被动视觉重建
      9.5  智能三维重建算法
        9.5.1  单幅图像重建技术
        9.5.2  神经辐射场重建
        9.5.3  DeepSDF重建
      习题
    第10章  传统目标检测与识别算法
      10.1  目标识别概念
      10.2  目标识别算法分类
      10.3  目标识别算法流程
      10.4  滑动窗口目标检测算法
      10.5  目标识别词袋算法
      10.6  基于AdaBoost的人脸检测算法
      习题
    第11章  传统目标跟踪算法
      11.1  目标跟踪概念
      11.2  目标跟踪技术难点
      11.3  运动目标检测与跟踪
      11.4  传统跟踪算法基础
      11.5  典型目标跟踪算法
        11.5.1  核跟踪算法基础
        11.5.2  均值漂移算法
      11.6  卡尔曼滤波器跟踪算法
      11.7  相关滤波运动跟踪算法
      习题
    第12章  智能目标识别与跟踪
      12.1  智能目标识别算法基础
      12.2  R-CNN算法

      12.3  SPP-Net算法
      12.4  Fast R-CNN算法
      12.5  Faster R-CNN算法
      12.6  YOLOv1算法
      12.7  SSD算法
      12.8  YOLOv2算法
      12.9  YOLOv3算法
      12.10  基于YOLO的其他跟踪算法
      习题
    第13章  三维点云特征及理解
      13.1  点云滤波处理与表达
        13.1.1  点云滤波基础
        13.1.2  点云关键点提取与描述
        13.1.3  点云体素化与稀疏化表达
      13.2  点云特征描述方法
        13.2.1  点云特征描述子
        13.2.2  特征描述的算法实例
      13.3  智能点云运算算法实例
        13.3.1  智能点云运算技术的发展
        13.3.2  PointNet算法
        13.3.3  PointNet++算法
        13.3.4  PointConv算法
      13.4  三维点云语义理解
      13.5  三维点云目标分类
      习题
    第14章  视觉语言模型
      14.1  语言模型技术基础
        14.1.1  语言模型的词嵌入
        14.1.2  预训练语言模型
        14.1.3  大语言模型技术及发展
      14.2  视觉语言模型基础
      14.3  端到端的视觉语言模型
        14.3.1  CLIP模型
        14.3.2  ALBEF模型
        14.3.3  VLMo
        14.3.4  BLIP模型
        14.3.5  CoCa模型
        14.3.6  BEiT-3模型
      14.4  基于预训练的视觉语言模型
        14.4.1  BLIP-2模型
        14.4.2  InstructBLIP模型
        14.4.3  MiniGPT-4模型
        14.4.4  LLaVA模型
        14.4.5  VisualGLM-6B模型
        14.4.6  CogVLM模型
        14.4.7  MiniGPT-5模型
        14.4.8  GPT-4V模型
      14.5  稳定扩散模型
        14.5.1  扩散模型
        14.5.2  去噪扩散概率模型

        14.5.3  LDM
        14.5.4  SDM
      习题