欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • OpenCV深度学习应用与性能优化实践/智能系统与技术丛书
      • 作者:吴至文//郭叶军//宗炜//李鹏//赵娟|责编:高婧雅
      • 出版社:机械工业
      • ISBN:9787111656463
      • 出版日期:2020/06/01
      • 页数:281
    • 售价:35.6
  • 内容大纲

        Intel音视频团队与阿里巴巴图像处理专家联合撰写,知名专家联袂推荐,深入解析OpenCV DNN模块、基于GPU/CPU的加速实现、性能优化技巧与可视化工具,以及人脸活体检测(完整案例)与主流识别项目解析。
        第1~2章介绍了OpenCV编译与运行,深度学习模块(Open DNN)的架构与实现原理,以及深度学习的数学基础与如何快速上手。
        第3~5章主要介绍了OpenCV的GPU加速原理,涵盖必要的并行计算知识、InteI GPU硬件结构,以及OpenCL和Vulkarl加速实现,是性能优化工作的核心。
        第6章介绍了CPU的硬件知识,以及深度学习模块的CPU加速方法,重点讲解了指令集SIMD加速,讨论了Halide后端加速、OpenVINO(Intel推理引擎)加速。
        第7章介绍了常用的深度神经网络可视化工具——TensorBoard(适用于TensorFlow网络格式),Netscope(适用于Caffe网络格式),针对Intel硬件平台的性能调优工具VTune,以及高阶程序优化的思路和方法。
        第8~9章重点讲解实践细节,包括用深度学习方法处理计算机视觉的基本问题,以及一个完整的人脸活体检测项目与主流识别项目解析。
  • 作者介绍

  • 目录

    序一
    序二
    序三
    序四
    前言
    第1章  OpenCV和深度学习
      1.1  OpenCV处理流程
        1.1.1  OpenCV库
        1.1.2  OpenCV深度学习应用的典型流程
      1.2  机器学习的数学视角
        1.2.1  机器学习和非机器学习
        1.2.2  从人工神经网络到深度学习
        1.2.3  破除神秘——神经网络是如何训练的
      1.3  OpenCV深度学习模块
        1.3.1  主要特性
        1.3.2  OpenCV DNN图像分类举例(Python)
      1.4  本章小结
    第2章  OpenCV深度学习模块解析
      2.1  深度学习模块分层架构总览
      2.2  语言绑定和测试层
        2.2.1  深度学习模块的Python语言绑定
        2.2.2  深度学习模块的正确性测试和性能测试
      2.3  API层
        2.3.1  Layer类及如何定制一个新的层类型
        2.3.2  Net类
        2.3.3  常用函数
      2.4  DNN引擎层
        2.4.1  模型导入
        2.4.2  推理引擎数据对象管理
        2.4.3  推理引擎重点层解释
        2.4.4  层的合并优化
      2.5  引擎加速层
        2.5.1  深度学习模块支持的运算目标设备
        2.5.2  深度学习模块支持的加速后端
        2.5.3  加速方式的选择
      2.6  本章小结
    第3章  并行计算与GPU架构
      3.1  并行计算浅谈
      3.2  Intel GPU架构及其在并行计算中的应用
        3.2.1  Intel GPU的计算架构
        3.2.2  两种不同的SIMD使用思路——AOS和SOA
        3.2.3  cl_intel_subgroups在Intel GPU上的参考实现
      3.3  本章小结
    第4章  基于Vulkan的加速实现
      4.1  初识Vulkan
      4.2  使用Vulkan加速
      4.3  Vulkan后端加速过程解析
        4.3.1  数据对象初始化
        4.3.2  后端运算节点初始化
        4.3.3  调用后端运算节点进行前向运算

        4.3.4  Vulkan后端库
      4.4  本章小结
    第5章  基于OpenCL的加速实现
      5.1  OpenCL简介
      5.2  如何使用OpenCL加速
      5.3  OpenCL加速详解
        5.3.1  0penCL API封装
        5.3.2  DNN模块的卷积层实现详解
        5.3.3  oc14dnn库的卷积运算类详解
        5.3.4  卷积核函数auto-tuning机制解析
      5.4  本章小结
    第6章  CPU及第三方库加速的实现
      6.1  原生CPU加速实现
        6.1.1  基于多线程技术的加速
        6.1.2  基于并行指令的加速
      6.2  Halide后端的实现
        6.2.1  Halide介绍
        6.2.2  如何启用Halide
        6.2.3  Halide后端的实现原理
      6.3  Intel推理引擎后端的实现
        6.3.1  Intel推理引擎介绍
        6.3.2  如何启用推理引擎后端
        6.3.3  Intel推理引擎后端的实现原理
      6.4  本章小结
    第7章  可视化工具与性能优化
      7.1  Netscope:基于Web的Caffe网络可视化工具
      7.2  TensorBoarld:助力TensorFlow程序的理解和调试
        7.2.1  图的可视化
        7.2.2  数据的可视化
        7.2.3  调试的可视化
      7.3  VTune: Intel平台的性能调优利器
        7.3.1  系统性能查看工具
        7.3.2  Intel VTune功能介绍
        7.3.3  VTune程序性能优化实例
      7.4  程序优化流程总结和建议
      7.5  本章小结
    第8章  支付级人脸识别项目开发实战
      8.1  活体检测的概念与方法
        8.2支付级人脸识别项目流程
      8.3  基于OpenCV的支付级人脸识别项目具体实现
        8.3.1  数据准备
        8.3.2  活体检测模型训练
        8.3.3  支付级人脸识别系统实现
      8.4  本章小结
    第9章  深度学习模块不同场景下的应用实践
      9.1  图像分类
        9.1.1  图像分类经典网络结构
        9.1.2  GoogLeNet
        9.1.3  图像分类程序源码分析
        9.1.4  图像分类程序运行结果

      9.2  目标检测
        9.2.1  SSD算法解析
        9.2.2  目标检测程序源码分析
        9.2.3  目标检测程序运行结果
      9.3  语义分割
        9.3.1  FCN模型
        9.3.2  语义分割程序源码分析
        9.3.3  语义分割程序运行结果
      9.4  视觉风格变换
        9.4.1  视觉风格变换模型
        9.4.2  视觉风格变换程序源码分析
        9.4.3  视觉风格变换程序运行结果
      9.5  本章小结
    附录A  OpenCV的编译安装及patch开发流程
    附录B  intel_gpu_frequency工具的安装和使用