-
内容大纲
本书系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。本书分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。
本书不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训机构和高校相关课程的教学用书。 -
作者介绍
梁楠,博士,毕业于北京航空航天大学,高级职称,长期从事模式识别、机器学习、统计理论的研究与应用,负责或参与科研项目多项,专注于人工智能、大语言模型的应用与开发,对深度学习、数据分析与预测等有独到见解。 -
目录
第1部分 理论基础
第1章 为何需要向量数据库
1.1 大语言模型的缺陷
1.1.1 高维向量表示中的信息丢失问题
1.1.2 嵌入空间对语义相似度的误差影响
1.2 高维数据存储与检索的技术瓶颈
1.2.1 高维数据的特性与存储难点分析
1.2.2 高维空间中的“维度诅咒”问题简介
1.2.3 高效检索:索引结构与搜索算法简介
1.3 传统数据库与向量数据库的对比分析
1.3.1 传统数据库的设计原理与局限性
1.3.2 高维向量检索在传统数据库中的实现难点
1.3.3 传统数据库与向量数据库的性能对比分析
1.4 向量数据库的优势
1.5 本章小结
1.6 思考题
第2章 向量数据库基础
2.1 向量数据库的核心概念与基本数据结构
2.1.1 向量数据库的定义与发展背景
2.1.2 向量数据库常见的数据结构:倒排索引、图索引与分区技术
2.1.3 向量数据库与传统数据库逻辑对比
2.2 特征提取与向量表示:从数据到高维坐标系
2.2.1 特征提取的基本方法
2.2.2 嵌入向量生成
2.2.3 数据预处理对向量质量的影响
2.3 高维空间特性与“维度诅咒”问题解析
2.3.1 高维空间中的稀疏性与数据分布特性
2.3.2 距离度量的退化:欧氏距离与余弦相似度
2.3.3 维度诅咒:降维与索引优化
2.4 本章小结
2.5 思考题
第2部分 核心技术与算法原理
第3章 向量嵌入
3.1 静态向量嵌入
3.1.1 传统词向量模型:Word2Vec与GloVe
3.1.2 静态嵌入的局限性:语义多义性与上下文缺失
3.1.3 静态向量嵌入在特定领域的应用
3.2 动态向量嵌入
3.2.1 动态词向量的生成:BERT与GPT的嵌入机制
3.2.2 动态嵌入的优势:上下文敏感性与语义一致性
3.2.3 动态向量嵌入的实时生成与优化
3.3 均匀分布与空间覆盖率
3.3.1 高维向量分布分析
3.3.2 嵌入向量的均匀性测量方法
3.3.3 空间覆盖率对检索性能的影响
3.4 嵌入向量优化
3.4.1 主成分分析与奇异值分解的降维应用
3.4.2 t-SNE与UMAP降维技术
3.4.3 降维对嵌入语义保留与性能的权衡分析
3.5 本章小结
3.6 思考题
……
第3部分 工具与系统构建
第4部分 实战与案例分析
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
