欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Python大模型应用开发(核心技术与项目实战)/智能系统与技术丛书
      • 作者:宿永杰|责编:李梦娜
      • 出版社:机械工业
      • ISBN:9787111785637
      • 出版日期:2025/08/01
      • 页数:283
    • 售价:39.6
  • 内容大纲

        这是一本聚焦Python大语言模型应用开发的实战指南。从基础知识出发,逐步深入讲解主流开发工具与关键技术,最终以当前热门的数字人电商直播项目为例,呈现完整的AI实战路径。
        本书具有以下特色:
        由浅入深:本书各章节环环相扣,循序渐进,形成完整的知识体系。
        注重实战:本书注重实践,引导读者在解决实际项目问题的过程中掌握知识。
        内容新颖:本书均采用前沿、主流的技术和工具,使读者掌握先进的开发方法。
        经验总结:本书是对作者近10年工作经验的总结,对AI初学者具有极高的参考价值。
        全书分为三篇,共15章,具体内容如下:
        第一篇:基础知识(第1、2章)。本篇介绍大语言模型及其应用开发的基础知识,为后续章节的学习奠定坚实的基础。
        第二篇:开发技术(第3~10章)。本篇涵盖分词技术、词嵌入技术、向量数据库、提示词工程与优化、Hugging Face入门与开发、Lang Chain入门与开发、大语言模型微调,以及大语言模型的部署等内容。这些主题构成了大语言模型应用开发的核心技术体系,掌握这些技术对于深入开发大语言模型至关重要。
        第三篇:项目实战(第11~15章)。本篇聚焦数字人电商直播应用,包括数字人口播台词生成、直播间问答分类、直播间互动问答,以及直播间数据分析Text2 SQL等实战项目。这些内容基于当前热门的数字人应用开发,具有很高的实践价值和参考意义。
  • 作者介绍

        宿永杰     拥有近10年的技术研发经验,专注于人工智能(AI)技术架构与研发,研究方向涵盖大数据处理、AI应用架构及智能系统开发。目前从事智能座舱语音对话系统的架构设计与研发工作。     热衷于技术分享,长期活跃于技术社区,是CSDN博客专家,全网粉丝量超15万。     公众号 “AI研习社”。
  • 目录

    前言
    第一篇 基础知识
      第1章  大语言模型
        1.1  大语言模型概述
          1.1.1  大语言模型的定义
          1.1.2  大语言模型的分类
          1.1.3  大语言模型的应用场景
        1.2  大语言模型的演变与发展
          1.2.1  大语言模型的网络架构演变
          1.2.2  大语言模型发展的关键事件
        1.3  大语言模型的基础知识
          1.3.1  什么是算力
          1.3.2  显卡的基础知识
          1.3.3  大语言模型的参数数量与精度
          1.3.4  大语言模型的基本单位
          1.3.5  通用人工智能
        1.4  小结
      第2章  Python大语言模型应用开发
        2.1  Python大语言模型应用开发的基础知识
          2.1.1  Python编程的基础知识
          2.1.2  接口的设计与优化
          2.1.3  大语言模型接口开发实战
        2.2  Docker容器的基础知识
          2.2.1  Docker基础命令
          2.2.2  Docker构建镜像
          2.2.3  Docker容器编排
        2.3  大语言模型与NLP
          2.3.1  NLP的研究任务
          2.3.2  传统NLP的技术实现路径
          2.3.3  大语言模型对传统NLP的影响
        2.4  小结
    第二篇 开发技术
      第3章  分词技术
        3.1  分词
          3.1.1  什么是分词
          3.1.2  英文分词
          3.1.3  中文分词
          3.1.4  制作词云图
        3.2  常见的分词算法
          3.2.1  基于规则的分词算法
          3.2.2  基于统计的分词算法
          3.2.3  基于深度学习的分词算法
          3.2.4  基于预训练语言模型的分词算法
        3.3  使用大语言模型进行分词
          3.3.1  基于ChatGPT服务的分词
          3.3.2  基于本地大语言模型的分词
        3.4  小结
      第4章  词嵌入技术
        4.1  词袋模型
          4.1.1  词袋模型的基本概念和原理

          4.1.2  词袋模型的构建
        4.2  词向量模型
          4.2.1  One-Hot编码
          4.2.2  Word2Vec模型
        4.3  大语言模型生成Embedding
          4.3.1  使用ChatGPT生成Embedding
          4.3.2  使用Text2Vec生成Embedding
          4.3.3  使用sentence-transformers生成Embedding
          4.3.4  使用Transformers库生成Embedding
          4.3.5  统计输入文本的Token数
        4.4  大语言模型的Embedding应用
          4.4.1  Embedding数据集准备
          4.4.2  Embedding数据2D可视化
          4.4.3  Embedding中文相似度计算
        4.5  小结
      第5章  向量数据库
        5.1  向量数据库简介
          5.1.1  向量数据库的缘起
          5.1.2  向量数据库的特点
          5.1.3  与传统数据库的比较
          5.1.4  向量数据库的应用场景
        5.2  向量数据库的原理
          5.2.1  向量距离的度量
          5.2.2  相似度搜索算法
        5.3  向量数据库的应用
          5.3.1  FAISS向量数据库入门
          5.3.2  FAISS的相似度度量
          5.3.3  FAISS的索引分类
          5.3.4  FAISS的索引创建与操作
          5.3.5  FAISS的优化
        5.4  小结
      第6章  提示词工程与优化
        6.1  认识提示词工程
          6.1.1  人机交互的演进
          6.1.2  什么是提示词
          6.1.3  提示词工程
        6.2  提示词工程的使用技巧
          6.2.1  使用文本分隔符
          6.2.2  赋予模型角色
          6.2.3  将过程分步拆解
          6.2.4  尽可能量化需求
          6.2.5  提供正反示例
          6.2.6  要求结构化输出
          6.2.7  合理进行限制
          6.2.8  使用链式思维
        6.3  使用提示词完成NLP任务
          6.3.1  使用提示词进行分词
          6.3.2  使用提示词提取关键词
          6.3.3  使用提示词进行文本分类
          6.3.4  使用提示词进行情感分析

          6.3.5  使用提示词进行文本摘要
          6.3.6  使用提示词进行中英文翻译
        6.4  小结
      第7章  Hugging Face入门与开发
        7.1  Hugging Face简介
          7.1.1  什么是Hugging Face
          7.1.2  Hugging Face Hub客户端库
        7.2  Hugging Face数据集工具
          7.2.1  数据集工具简介
          7.2.2  数据集工具的基本操作
        7.3  Hugging Face模型工具
          7.3.1  Transformers简介
          7.3.2  数据预处理
          7.3.3  模型微调
          7.3.4  模型评价指标
        7.4  小结
      第8章  LangChain入门与开发
        8.1  初识LangChain
          8.1.1  LangChain简介
          8.1.2  LangChain的开发生态
        8.2  模型I/O
          8.2.1  模型I/O简介
          8.2.2  提示词模板
          8.2.3  模型包装器
          8.2.4  输出解析器
        8.3  数据增强
          8.3.1  文档加载器
          8.3.2  文档转换器
          8.3.3  文本嵌入
          8.3.4  向量存储库
          8.3.5  检索器
        8.4  链
        8.5  小结
      第9章  大语言模型微调
        9.1  大语言模型微调概述
          9.1.1  为什么需要微调
          9.1.2  少样本提示与微调
          9.1.3  微调的基本流程
        9.2  大语言模型的微调策略
          9.2.1  全面微调
          9.2.2  参数高效微调
        9.3  基于ChatGPT的微调
          9.3.1  使用Fine-Tuning UI微调
          9.3.2  使用CLI命令微调
          9.3.3  使用API微调
        9.4  基于Hugging Face的开源大模型微调
          9.4.1  Accelerate介绍
          9.4.2  PEFT介绍
        9.5  小结
      第10章  大语言模型的部署

        10.1  MLOps与LLMOps
          10.1.1  DevOps简介
          10.1.2  MLOps简介
          10.1.3  LLMOps简介
        10.2  大语言模型量化部署
            10.2.1 Qwen2-0.5  B简介
          10.2.2  ChatGLM3-6B简介
            10.2.3 基于Qwen2-0.5  B的CPU推理
          10.2.4  基于ChatGLM3-6B的GPU量化推理
        10.3  大语言模型部署实战
          10.3.1  基于Gradio框架的网页部署
          10.3.2  基于FastAPI框架的接口部署
        10.4  小结
    第三篇 项目实战
      第11章  数字人电商直播
        11.1  数字人直播概述
          11.1.1  数字人简介
          11.1.2  品牌虚拟代言人
          11.1.3  数字人与“人货场”
        11.2  2D数字人核心技术
          11.2.1  AI生成文案
          11.2.2  AI语音合成
          11.2.3  2D数字人口型驱动
          11.2.4  2D数字人直播推流
        11.3  2D数字人电商直播项目实战
          11.3.1  数字人直播流程简介
          11.3.2  大语言模型生成商品台词
          11.3.3  TTS将商品台词转成音频
          11.3.4  口型驱动生成2D数字人
          11.3.5  2D数字人推流到直播间
        11.4  小结
      第12章  数字人口播台词生成
        12.1  数字人口播台词生成概述
          12.1.1  数字人直播的台词特点
          12.1.2  数字人直播的台词编排
          12.1.3  数字人直播的防封策略
        12.2  数字人口播台词提示词模板
          12.2.1  整段式商品台词提示词模板
          12.2.2  分段式商品台词提示词模板
          12.2.3  商品互动问答台词提示词模板
        12.3  数字人口播台词生成项目实战
          12.3.1  使用提示词模板生成口播台词
          12.3.2  品牌知识库和提示词模板结合生成口播台词
        12.4  小结
      第13章  数字人直播间问答分类
        13.1  文本分类简介
          13.1.1  文本分类的方法
          13.1.2  文本分类的模型及特点
          13.1.3  文本分类的发展与挑战
        13.2  文本分类器的训练过程

          13.2.1  传统分类器的训练
          13.2.2  提示词少样本学习
          13.2.3  定制化微调预训练模型
        13.3  数字人直播间问答分类项目实战
          13.3.1  直播间问答分类简介
          13.3.2  直播间问答分类流程
          13.3.3  直播间问答分类实战
        13.4  小结
      第14章  数字人直播间互动问答
        14.1  RAG知识库构建
          14.1.1  RAG知识库基本概念
          14.1.2  RAG知识库构建流程
          14.1.3  RAG知识库的发展与挑战
        14.2  RAG知识库的优化策略
          14.2.1  非结构化文档解析优化
          14.2.2  文档分块策略优化
          14.2.3  中文Embedding优化
          14.2.4  Rewrite优化
          14.2.5  Rerank优化
          14.2.6  混合技术优化信息检索
        14.3  数字人直播间互动问答项目实战
          14.3.1  数字人直播间互动问答简介
          14.3.2  基于关键词检索的互动问答实现
          14.3.3  基于RAG向量库检索的互动问答实现
          14.3.4  基于RAG混合检索的互动问答实现
          14.3.5  基于大语言模型微调的互动问答实现
        14.4  小结
      第15章  数字人直播间数据分析Text2SQL
        15.1  数据分析的本质
        15.2  数据分析的思维和方法论
          15.2.1  费米估计
          15.2.2  辛普森悖论
          15.2.3  必知必会的两个原则
          15.2.4  三种思考模型
          15.2.5  四大战略分析工具
          15.2.6  五大生命周期理论
          15.2.7  数字化营销的“六脉神剑”
        15.3  数字人直播间数据分析Text2SQL项目实战
          15.3.1  Text2SQL概述
          15.3.2  Text2SQL开源项目简介
          15.3.3  Text2SQL项目实战
        15.4  小结