-
内容大纲
RAG生成式AI为构建兼顾性能与成本的高效大模型、计算机视觉及生成式AI系统指明了方向。
本书深入剖析RAG,详解多模态AI流水线的设计、管理与把控。RAG通过将输出与可追溯的源文档关联,提升了输出的准确性与上下文相关性,为海量信息管理提供了一种动态思路。书中不仅展示RAG框架的搭建方法,介绍关于向量存储、切块、索引及排序等方面的实用知识,还传授优化项目性能、加深对数据理解的技巧,例如,运用自适应RAG与人类反馈来提高检索准确性,平衡RAG与微调的关系,实施动态RAG以增强实时决策能力,以及借助知识图谱可视化复杂数据。
读者可亲自上手,实践LlamaIndex和Deep Lake等框架、Pinecone和Chroma等向量数据库,以及来自Hugging Face和OpenAI的模型。学完本书,读者将掌握智能解决方案的实施技能,在生产、客户服务等各类项目中稳占竞争优势。 -
作者介绍
丹尼斯·罗斯曼Denis Rothman,毕业于索邦大学和巴黎一狄德罗大学,写过最早的word2vector embedding解决方案之一。他创作了第一批AI认知自然语言处理(NLP)聊天机器人之一,这个聊天机器人开启了他的职业生涯。它是一个语言教学应用程序,应用于Moet et Chandon和其他公司。他为IBM和服装生产商编写了一个AI资源优化器。然后,他还编写了一个在全球范围内使用的高级计划和排程(APS)解决方案。 -
目录
第1章 RAG入门
1.1 RAG的定义
1.2 简易、高级和模块化RAG
1.3 RAG对比微调
1.4 RAG生态
1.4.1 检索器(D)
1.4.2 生成器(G)
1.4.3 评估器(E)
1.4.4 训练器(T)
1.5 简易、高级和模块化RAG代码
1.5.1 第1部分:搭建环境与基本实现
1.5.2 第2部分:高级方法与评估
1.6 小结
1.7 问题
1.8 参考文献
1.9 扩展阅读
第2章 基于Deep Lake和OpenAI的RAG嵌入向量库
2.1 从原始数据到嵌入
2.2 按流水线组织RAG
2.3 RAG生成式AI流水线
2.4 搭建RAG流水线
2.4.1 配置环境
2.4.2 流水线组件1:数据采集与准备
2.4.3 流水线组件2:数据嵌入与存储
2.4.4 流水线组件3:增强输入生成
2.5 小结
2.6 问题
2.7 参考文献
2.8 扩展阅读
第3章 使用LlamaIndex、Deep Lake和OpenAI构建基于索引的RAG
3.1 使用基于索引RAG的原因
3.2 为无人机创建语义搜索引擎和生成式智能体
3.2.1 安装环境
3.2.2 流水线组件1:采集并准备文档
3.2.3 流水线组件2:创建并填充Deep Lake向量库
3.2.4 流水线组件3:基于索引的RAG
3.3 向量库索引查询引擎
3.3.1 查询响应和来源
3.3.2 优化组块
3.3.3 性能指标
3.4 树索引查询引擎
3.5 列表索引查询引擎
3.6 关键词索引查询引擎
3.7 小结
3.8 问题
3.9 参考文献
3.10 扩展阅读
第4章 无人机技术中的多模态模块化RAG
4.1 多模态模块化RAG
4.2 编写无人机技术多模态模块化RAG程序
4.2.1 加载LLM数据集
4.2.2 加载和可视化多模态数据集
4.2.3 多模态数据集导航
4.2.4 创建多模态查询引擎
4.2.5 多模态模块化RAG小结
4.2.6 性能指标
4.3 小结
4.4 问题
4.5 参考文献
4.6 扩展阅读
第5章 使用专家人类反馈提升RAG性能
5.1 自适应RAG
5.2 使用Python创建混合自适应RAG
5.2.1 检索器
5.2.2 生成器
5.2.3 评估器
5.3 小结
5.4 问题
5.5 参考文献
5.6 扩展阅读
第6章 使用Pinecone扩展RAG银行客户数据
6.1 使用Pinecone进行扩展
6.2 流水线组件1:采集并准备数据集
6.2.1 采集和处理数据集
6.2.2 探索性数据分析
6.2.3 训练机器学习模型
6.3 流水线组件2:扩展Pinecone索引(向量库)
6.3.1 管理向量库所面临的挑战
6.3.2 安装环境
6.3.3 处理数据集
6.3.4 切块并嵌入数据集
6.3.5 创建Pinecone索引
6.3.6 更新插入
6.3.7 查询Pinecone索引
6.4 流水线组件3:RAG生成式AI
6.4.1 基于GPT - 4的RAG
6.4.2 提取相关文本
6.4.3 增强提示词
6.4.4 增强生成
6.5 小结
6.6 问题
6.7 参考文献
6.8 扩展阅读
第7章 使用维基百科API和LlamaIndex创建可扩展的知识图谱RAG
7.1 基于知识图谱语义搜索的RAG架构
7.2 流水线组件1:采集并准备文档
7.2.1 检索维基百科数据及元数据
7.2.2 准备数据以执行更新插入
7.3 流水线组件2:创建并填充Deep Lake向量库
7.4 流水线组件3:基于知识图谱索引的RAG
7.4.1 生成知识图谱索引
7.4.2 展示图谱
7.4.3 与知识图谱索引交互
7.4.4 安装相似度分数计算库并定义函数
7.4.5 重排
7.4.6 示例指标
7.5 小结
7.6 问题
7.7 参考文献
7.8 扩展阅读
第8章 基于Chroma和Hugging Face Llama创建动态RAG
8.1 动态RAG架构
8.2 安装环境
8.2.1 Hugging Face
8.2.2 Chroma
8.3 激活会话时间
8.4 下载并准备数据集
8.5 嵌入并向Chroma插入数据
8.5.1 选择模型
8.5.2 嵌入并存储
8.5.3 展示嵌入
8.6 查询集合
8.7 提示与检索
8.8 使用Llama开发RAG
8.9 总会话时长
8.10 小结
8.11 问题
8.12 参考文献
8.13 扩展阅读
第9章 赋能AI模型:微调RAG数据和人类反馈
9.1 微调静态RAG数据的架构
9.2 安装环境
9.3 准备微调数据集
9.3.1 下载并可视化数据集
9.3.2 准备微调数据集
9.4 微调模型
9.5 使用经过微调的OpenAI模型
9.6 指标
9.7 小结
9.8 问题
9.9 参考文献
9.10 扩展阅读
第10章 使用Pinecone和OpenAI实现视频生成RAG
10.1 视频生成RAG架构
10.2 搭建视频生成环境
10.2.1 导入模块和库
10.2.2 GitHub
10.2.3 OpenAI
10.2.4 Pinecone
10.3 流水线组件1:生成器和注释器
10.3.1 AI视频数据集
10.3.2 生成器和注释器
10.4 流水线组件2:向量库管理器
10.5 流水线组件3:视频专家
10.6 小结
10.7 问题
10.8 参考文献
10.9 扩展阅读
附录
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
