欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 基于RAG的大模型应用开发(问答系统多模态系统与Agent开发实践)
      • 作者:编者:宿永杰|责编:王中英
      • 出版社:清华大学
      • ISBN:9787302709282
      • 出版日期:2026/02/01
      • 页数:241
    • 售价:31.92
  • 内容大纲

        本书系统介绍RAG(检索增强生成)的核心原理与开发实践。本书理论与实践相结合,从基础知识开始讲解,逐步深入探讨RAG的优化技术,最后结合3个典型项目实战案例,重点介绍如何构建基于RAG的智能问答系统、多模态系统和Agent系统。通过学习本书内容,读者不仅能够系统掌握RAG的理论知识,而且能够深入理解其在实际应用中的开发与优化方法,从而高效构建基于RAG的大模型应用系统。
        本书共分为9章,涵盖的主要内容有RAG基础概述、RAG核心知识、RAG架构、RAG优化、RAG评估、Dify入门与应用实践、基于RAG构建智能问答系统、基于RAG构建多模态系统、基于RAG构建Agent系统。
        本书内容丰富,语言通俗易懂,案例典型,适合零基础RAG入门者系统学习,也适合进阶开发者深入研究与实践RAG的优化时参考。另外,本书对大模型应用开发感兴趣的程序员、AI从业者及其他开发者也具有很高的参考价值。
  • 作者介绍

        宿永杰     拥有近10年的技术研发经验,专注于人工智能(AI)技术架构与研发,研究方向涵盖大数据处理、AI应用架构及智能系统开发。目前从事智能座舱语音对话系统的架构设计与研发工作。     热衷于技术分享,长期活跃于技术社区,是CSDN博客专家,全网粉丝量超15万。     公众号 “AI研习社”。
  • 目录

    第1章  RAG基础概述
      1.1  RAG的概念
        1.1.1  RAG的起源
        1.1.2  RAG的基本原理
        1.1.3  RAG的工作流程
        1.1.4  RAG与模型微调的区别
      1.2  RAG的优缺点
        1.2.1  RAG的优点
        1.2.2  RAG的缺点
      1.3  RAG的应用场景
        1.3.1  问答系统
        1.3.2  内容生成
        1.3.3  优化搜索引擎
        1.3.4  Agent工具
      1.4  RAG的发展与面临的挑战
        1.4.1  向量化信息丢失
        1.4.2  语义搜索不准确
        1.4.3  长上下文大语言模型面临的挑战
        1.4.4  隐私和安全问题
        1.4.5  多模态对齐与融合
      1.5  小结
    第2章  RAG核心知识
      2.1  文档解析
        2.1.1  加载目录
        2.1.2  加载CSV
        2.1.3  加载HTML
        2.1.4  加载JSON
        2.1.5  加载Markdown
        2.1.6  加载PDF
      2.2  文档分块
        2.2.1  按字符进行拆分
        2.2.2  代码分割
        2.2.3  按Markdown标题进行分割
        2.2.4  按字符递归进行分割
        2.2.5  按标记进行分割
      2.3  文本嵌入
        2.3.1  文本嵌入的定义
        2.3.2  文本嵌入的应用
      2.4  向量数据库
        2.4.1  向量数据库简介
        2.4.2  Faiss向量数据库
      2.5  向量检索
        2.5.1  稀疏向量检索
        2.5.2  稠密向量检索
      2.6  模型参数设置与提示词工程使用
        2.6.1  大语言模型参数设置
        2.6.2  提示词工程使用技巧
      2.7  小结
    第3章  RAG架构
      3.1  经典RAG

        3.1.1  经典RAG简介
        3.1.2  经典RAG架构
        3.1.3  经典RAG构建实战
      3.2  多头RAG
        3.2.1  多头RAG简介
        3.2.2  多头RAG架构
        3.2.3  多头RAG构建实战
      3.3  自反思RAG
        3.3.1  自反思RAG简介
        3.3.2  自反思RAG架构
        3.3.3  自反思RAG构建实战
      3.4  纠正RAG
        3.4.1  纠正RAG简介
        3.4.2  纠正RAG架构
        3.4.3  纠正RAG构建实战
      3.5  自适应RAG
        3.5.1  自适应RAG简介
        3.5.2  自适应RAG架构
        3.5.3  自适应RAG构建实战
      3.6  图RAG
        3.6.1  图RAG简介
        3.6.2  图RAG架构
        3.6.3  图RAG构建实战
      3.7  小结
    第4章  RAG优化
      4.1  源数据清洗与整合
        4.1.1  源数据清洗
        4.1.2  多数据源整合
        4.1.3  多模态数据融合
      4.2  向量数据库优化
        4.2.1  存储格式优化
        4.2.2  量化压缩优化
        4.2.3  检索算法优化
        4.2.4  工程优化技术
      4.3  检索质量提升
        4.3.1  文本分块优化
        4.3.2  高质量嵌入模型
        4.3.3  查询重写
        4.3.4  重排序器
        4.3.5  混合检索优化
        4.3.6  多模态检索优化
      4.4  提示词工程优化
        4.4.1  动态提示词生成
        4.4.2  多轮提示词优化
        4.4.3  多模态提示词融合
      4.5  大语言模型优化
        4.5.1  模型参数优化
        4.5.2  模型量化优化
        4.5.3  模型微调优化
        4.5.4  模型推理优化

      4.6  小结
    第5章  RAG评估
      5.1  RAG评估概述
        5.1.1  加拿大航空公司的故事
        5.1.2  RAG存在的问题
        5.1.3  RAG评估的目的
        5.1.4  RAG要解决的问题
      5.2  RAG评估指标
        5.2.1  RAG Triad框架
        5.2.2  检索模块的评估指标
        5.2.3  生成模块的评估指标
        5.2.4  端到端的评估指标
      5.3  RAG评估数据集与工具
        5.3.1  RAG评估数据集
        5.3.2  RAG评估工具
      5.4  RAGAS评估工具实践
        5.4.1  RAGAS评估数据集
        5.4.2  RAGAS评估指标
        5.4.3  RAGAS评估实战案例
      5.5  小结
    第6章  Dify入门与应用实践
      6.1  Dify简介
      6.2  Dify安装与部署
        6.2.1  云服务
        6.2.2  Dify Premium简介
        6.2.3  Docker部署
        6.2.4  本地源码部署
      6.3  Dify功能模块详解
        6.3.1  探索
        6.3.2  工作室
        6.3.3  知识库
        6.3.4  工具
      6.4  Dify知识库创建
        6.4.1  选择数据源
        6.4.2  文本分段与清洗
        6.4.3  索引与检索配置
        6.4.4  知识库召回测试
        6.4.5  应用内集成知识库
        6.4.6  通过API访问知识库
      6.5  Dify工作流创建
        6.5.1  核心节点
        6.5.2  配置变量
        6.5.3  编排节点
        6.5.4  访问API
      6.6  Dify工具创建
        6.6.1  发布自定义工具
        6.6.2  使用自定义工具
      6.7  小结
    第7章  基于RAG构建智能问答系统
      7.1  智能问答系统概述

        7.1.1  智能问答系统的定义
        7.1.2  智能问答系统的发展简史
        7.1.3  智能问答系统的处理流程
        7.1.4  智能问答系统的应用分类
      7.2  智能问答系统技术架构的演变
        7.2.1  基于规则的智能问答系统架构
        7.2.2  基于检索的智能问答系统架构
        7.2.3  基于知识图谱的智能问答系统架构
        7.2.4  基于生成式的智能问答系统架构
        7.2.5  基于多模态的智能问答系统架构
      7.3  构建基于RAG的智能对话系统
        7.3.1  智能对话系统基础
        7.3.2  RAG增强智能对话系统
        7.3.3  RAG联动意图识别与槽位填充
        7.3.4  RAG实现多轮智能对话系统
        7.3.5  RAG赋能智能对话系统的发展
      7.4  小结
    第8章  基于RAG构建多模态系统
      8.1  多模态技术基础
        8.1.1  多模态技术简介
        8.1.2  多模态技术原理
        8.1.3  多模态技术应用
        8.1.4  多模态技术发展
      8.2  视觉语言模型
        8.2.1  视觉语言模型简介
          8.2.2 Qwen 2.5  -VL模型本地推理
      8.3  多模态嵌入模型
        8.3.1  多模态嵌入模型简介
        8.3.2  中文CLIP模型本地推理
        8.3.3  ImageBind模型本地推理
      8.4  基于RAG的多模态系统设计与实现
        8.4.1  基于RAG的多模态系统简介
        8.4.2  基于RAG的多模态系统设计
        8.4.3  基于RAG的多模态系统实现
        8.4.4  基于RAG的多模态系统发展
      8.5  小结
    第9章  基于RAG构建Agent系统
      9.1  Agent概述
        9.1.1  什么是Agent
        9.1.2  Agent的演进之路
        9.1.3  Agent的常见分类
        9.1.4  Agent的行业应用
        9.1.5  Agent的未来发展
      9.2  Agent技术框架
        9.2.1  Agent的四大组件
        9.2.2  ReAct框架原理
        9.2.3  OpenAI的Agent SDK
      9.3  基于RAG的Agent系统设计与实现
        9.3.1  基于RAG的Agent系统简介
        9.3.2  基于RAG的Agent系统设计

        9.3.3  基于RAG的Agent系统实现
      9.4  Agent的发展趋势
      9.5  小结