欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • RAG实践权威指南(构建精准高效大模型之道)/智能系统与技术丛书
      • 作者:宁星星|责编:高婧雅
      • 出版社:机械工业
      • ISBN:9787111781790
      • 出版日期:2025/06/01
      • 页数:255
    • 售价:35.6
  • 内容大纲

        本书由华大生命科学研究院资深NLP专家撰写,旨在带你从零构建高效的企业级RAG系统。本书全面解析RAG原理与实战,涵盖架构与组件、高阶技术与实践、检索与问答模块优化策略、模型推理等核心技术,并深入讲解三大落地优化技术,以及高阶变体与能力增强措施。
        本书共8章。第1章介绍RAG技术基础,帮助读者建立对RAG技术的全面认知。第2章介绍RAG系统的核心组件与实践,帮助读者掌握核心技术与基于Python库的实践。第3章介绍高阶RAG技术与实践的细节,帮助读者掌握进阶技术。第4章介绍检索与问答模块的优化,全方位讲解优化策略。第5章介绍模型推理技术,加速RAG技术的落地。第6章介绍RAG系统在实际应用中的鲁棒性、安全性和公平性优化技术,提升RAG系统的整体性能与可信度。第7章介绍RAG技术的高阶变体,以充分挖掘RAG技术的应用潜力。第8章介绍实时知识更新与跨模态能力增强,展望RAG技术未来应用的方向。
  • 作者介绍

        宁星星,华大生命科学研究院(BGI)生物智能研究所资深NLP算法工程师,目前从事RAG系统、Agent智能系统、生命科学垂直领域大模型等相关研发工作。拥有多年NLP算法相关开发经验,擅长大模型、AIGC、智能问答等相关技术,并多次获得全国性NLP与知识图谱相关竞赛奖项。著有《语义解析:自然语言生成SQL与知识图谱问答实战》一书。
  • 目录

    前言
    第1章  RAG技术基础
      1.1  为什么需要RAG技术
      1.2  工作流程与核心技术解析
        1.2.1  工作流程
        1.2.2  核心技术
      1.3  工作范式
      1.4  价值与实际应用场景
      1.5  计算资源与数据存储需求
        1.5.1  计算资源的需求
        1.5.2  数据存储的需求
      1.6  面临的主要挑战
    第2章  RAG系统的核心组件与实践
      2.1  向量数据库
        2.1.1  Elasticsearch
        2.1.2  FAISS
        2.1.3  Milvus
      2.2  检索系统
        2.2.1  基于知识图谱查询
        2.2.2  基于关系型数据库查询
        2.2.3  基于向量数据库查询
      2.3  生成系统
        2.3.1  Transformer
        2.3.2  GPT
      2.4  RAG系统基准测试工具
        2.4.1  评测数据集
        2.4.2  常用的评测基准与步骤
      2.5  基于常用Python库的RAG实践
        2.5.1  基于Hugging Face Transformers库
        2.5.2  基于PyTorch和TensorFlow
        2.5.3  基于LlamaIndex
        2.5.4  基于LangChain
    第3章  高阶RAG技术与实践
      3.1  切片与向量化技术
        3.1.1  切片
        3.1.2  向量化
        3.1.3  向量存储与检索
        3.1.4  优化切片与向量化策略
        3.1.5  实战:从文本到向量
      3.2  检索技术
        3.2.1  检索流程及优化策略
        3.2.2  关键词检索
        3.2.3  语义检索
        3.2.4  密集段落检索
        3.2.5  混合检索
        3.2.6  重排序
      3.3  高级检索策略
        3.3.1  假设性问题和假设性回答策略
        3.3.2  扩大检索语境
      3.4  生成模型的选型与提示词工程

      3.5  检索技术与生成技术的融合
        3.5.1  RAG-Token模型
        3.5.2  RAG-Sequence模型
    第4章  检索与问答模块优化
      4.1  数据预处理和管理优化
        4.1.1  数据清洗
        4.1.2  数据存储和访问优化
      4.2  检索模块的优化
        4.2.1  嵌入模型的训练优化
        4.2.2  文档解析技术的优化
        4.2.3  同义词扩展
        4.2.4  查询重写
      4.3  问答模块的优化
        4.3.1  问答能力的优化
        4.3.2  增强拒答能力
    第5章  模型推理优化
      5.1  推理加速技术
        5.1.1  量化
        5.1.2  剪枝
        5.1.3  知识蒸馏
      5.2  分布式推理
        5.2.1  分布式推理技术
        5.2.2  分布式推理算法
        5.2.3  常见的分布式推理系统
        5.2.4  分布式推理优化策略
      5.3  边缘计算优化
    第6章  鲁棒性、安全性和公平性优化
      6.1  模型鲁棒性优化
        6.1.1  对抗训练
        6.1.2  模型正则化
        6.1.3  随机自我集成
        6.1.4  防御模块
      6.2  模型安全性优化
        6.2.1  数据匿名化和加密
        6.2.2  访问控制
        6.2.3  验证查询和输出内容
        6.2.4  保护向量数据库
      6.3  模型公平性优化
        6.3.1  检测模型偏见的方法
        6.3.2  减少模型偏见的策略
    第7章  RAG技术的高阶变体
      7.1  长上下文的困境突围LongRAG
        7.1.1  原理解析
        7.1.2  源码解析:LongRAG的深度剖析
      7.2  知识图谱的优势融合GraphRAG
        7.2.1  原理解析
        7.2.2  源码解析:GraphRAG的深度剖析
      7.3  垂直领域的定向增强GeneRAG
        7.3.1  原理解析
        7.3.2  源码解析:GeneRAG的深度剖析

    第8章  实时知识更新与跨模态能力增强
      8.1  实时知识更新
        8.1.1  数据实时获取的方法
        8.1.2  知识库动态更新
        8.1.3  自动化数据管道
      8.2  跨模态能力增强
        8.2.1  多模态向量嵌入
        8.2.2  多模态内容生成
    附录  相似度计算

推荐书目

  • 孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...

  • 时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...

  • 本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...

更多>>>