欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 向量数据库(大模型驱动的智能检索与应用)
      • 作者:梁楠|责编:王金柱
      • 出版社:清华大学
      • ISBN:9787302685647
      • 出版日期:2025/04/01
      • 页数:338
    • 售价:47.6
  • 内容大纲

        本书系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。本书分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。
        本书不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训机构和高校相关课程的教学用书。
  • 作者介绍

        梁楠,博士,毕业于北京航空航天大学,高级职称,长期从事模式识别、机器学习、统计理论的研究与应用,负责或参与科研项目多项,专注于人工智能、大语言模型的应用与开发,对深度学习、数据分析与预测等有独到见解。
  • 目录

    第1部分  理论基础
      第1章  为何需要向量数据库
        1.1  大语言模型的缺陷
          1.1.1  高维向量表示中的信息丢失问题
          1.1.2  嵌入空间对语义相似度的误差影响
        1.2  高维数据存储与检索的技术瓶颈
          1.2.1  高维数据的特性与存储难点分析
          1.2.2  高维空间中的“维度诅咒”问题简介
          1.2.3  高效检索:索引结构与搜索算法简介
        1.3  传统数据库与向量数据库的对比分析
          1.3.1  传统数据库的设计原理与局限性
          1.3.2  高维向量检索在传统数据库中的实现难点
          1.3.3  传统数据库与向量数据库的性能对比分析
        1.4  向量数据库的优势
        1.5  本章小结
        1.6  思考题
      第2章  向量数据库基础
        2.1  向量数据库的核心概念与基本数据结构
          2.1.1  向量数据库的定义与发展背景
          2.1.2  向量数据库常见的数据结构:倒排索引、图索引与分区技术
          2.1.3  向量数据库与传统数据库逻辑对比
        2.2  特征提取与向量表示:从数据到高维坐标系
          2.2.1  特征提取的基本方法
          2.2.2  嵌入向量生成
          2.2.3  数据预处理对向量质量的影响
        2.3  高维空间特性与“维度诅咒”问题解析
          2.3.1  高维空间中的稀疏性与数据分布特性
          2.3.2  距离度量的退化:欧氏距离与余弦相似度
          2.3.3  维度诅咒:降维与索引优化
        2.4  本章小结
        2.5  思考题
    第2部分  核心技术与算法原理
      第3章  向量嵌入
        3.1  静态向量嵌入
          3.1.1  传统词向量模型:Word2Vec与GloVe
          3.1.2  静态嵌入的局限性:语义多义性与上下文缺失
          3.1.3  静态向量嵌入在特定领域的应用
        3.2  动态向量嵌入
          3.2.1  动态词向量的生成:BERT与GPT的嵌入机制
          3.2.2  动态嵌入的优势:上下文敏感性与语义一致性
          3.2.3  动态向量嵌入的实时生成与优化
        3.3  均匀分布与空间覆盖率
          3.3.1  高维向量分布分析
          3.3.2  嵌入向量的均匀性测量方法
          3.3.3  空间覆盖率对检索性能的影响
        3.4  嵌入向量优化
          3.4.1  主成分分析与奇异值分解的降维应用
          3.4.2  t-SNE与UMAP降维技术
          3.4.3  降维对嵌入语义保留与性能的权衡分析
        3.5  本章小结

        3.6  思考题
    ……
    第3部分  工具与系统构建
    第4部分  实战与案例分析