-
内容大纲
本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。
本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大模型的构建流程、Transformer模型,以及模型微调、对齐优化、提示工程等核心技术,之后介绍了推理优化、大模型训练、大模型评估、大模型部署等拓展技术。应用开发实践(第4~10章)详细讲解大模型插件应用开发、RAG实践,以及智能客服问答、学科知识问答、法律领域应用、医疗领域应用、智能助写平台等多领域的实践。 -
作者介绍
-
目录
前言
第1章 大模型概述
1.1 大模型的概念
1.2 大模型的应用现状
1.2.1 国外的大模型
1.2.2 国内的大模型
1.2.3 大模型的应用情况
1.3 大模型存在的问题
1.3.1 机器幻觉
1.3.2 安全伦理
1.3.3 选择错误目标
1.3.4 难以监督
1.4 大模型的发展趋势
1.4.1 多模态能力
1.4.2 AI Agent
1.4.3 端侧应用
1.4.4 可信任性及可解释性
1.4.5 自我学习
1.5 本章小结
第2章 大模型核心技术
2.1 大模型构建流程
2.1.1 预训练语言模型
2.1.2 模型微调
2.1.3 对齐优化
2.2 Transformer模型
2.2.1 Transformer模型概述
2.2.2 编码器与解码器
2.2.3 注意力机制
2.2.4 词向量
2.2.5 位置编码
2.2.6 规范化
2.2.7 激活函数
2.2.8 优化器
2.2.9 基于Transformer的大模型架构选择
2.3 模型微调
2.3.1 指令微调数据集
2.3.2 调优策略
2.4 对齐优化
2.4.1 反馈
2.4.2 偏好模型
2.4.3 RLHF
2.5 提示工程
2.5.1 提示工程开发流程
2.5.2 提示设计开发
2.6 本章小结
第3章 大模型技术拓展
3.1 推理优化技术
3.1.1 解码优化算法
3.1.2 推理加速策略
3.2 大模型训练技术
3.2.1 并行训练
3.2.2 训练容错
3.2.3 混合精度训练
3.3 大模型评估
3.3.1 大模型评估概述
3.3.2 大模型评估任务
3.3.3 大模型评估数据集
3.3.4 大模型评估方法
3.4 大模型部署
3.4.1 模型环境搭建
3.4.2 模型运行测试
3.5 本章小结
第4章 插件应用开发实践
4.1 应用概述
4.1.1 ChatGPT插件
4.1.2 LangChain插件
4.1.3 通用插件调用流程
4.2 天气查询插件开发
4.2.1 基于ChatGPT的插件开发
4.2.2 基于AutoGen的插件开发
4.3 语音交互插件开发
4.4 本章小结
第5章 RAG实践
5.1 应用概述
5.2 RAG流程
5.3 环境构建
5.4 应用实践
5.4.1 知识解析
5.4.2 检索
5.4.3 增强
5.4.4 生成
5.5 本章小结
第6章 智能客服问答实践
6.1 应用概述
6.2 环境构建
6.2.1 开发环境搭建
6.2.2 开源模型下载
6.3 应用开发
6.3.1 实现多轮对话系统
6.3.2 提示优化
6.3.3 第三方工具调用
6.4 应用部署
6.5 本章小结
第7章 学科知识问答实践
7.1 应用概述
7.2 环境构建
7.2.1 开发环境搭建
7.2.2 项目参数配置
7.3 学科知识图谱
7.3.1 大模型与知识图谱
7.3.2 学科知识图谱构建流程
7.3.3 学科知识数据集
7.3.4 学科知识处理
7.4 应用开发
7.4.1 功能设置
7.4.2 知识库构建
7.4.3 基于LangChain的问答实践
7.5 本章小结
第8章 法律领域应用实践
8.1 应用概述
8.2 对话数据微调
8.2.1 法律对话数据预处理
8.2.2 对话微调工具编写
8.2.3 模型微调框架的参数配置
8.2.4 微调前后的对话问答对比
8.3 指令微调
8.3.1 法律指令数据集预处理
8.3.2 指令微调工具编写
8.3.3 法律大模型指令问答评估
8.3.4 微调前后的对话问答对比
8.4 部署验证
8.5 本章小结
第9章 医疗领域应用实践
9.1 应用概述
9.2 医疗数据集构建
9.2.1 增量预训练数据集
9.2.2 有监督微调数据集
9.2.3 直接偏好优化数据集
9.2.4 模型评测数据集
9.3 增量预训练与微调
9.3.1 增量预训练
9.3.2 有监督微调
9.3.3 直接偏好优化
9.4 部署验证
9.5 模型评估
9.5.1 配置评估任务
9.5.2 启动评估任务
9.5.3 可视化评估结果
9.6 本章小结
第10章 智能助写平台实践
10.1 应用概述
10.2 业务逻辑
10.2.1 系统总体设计
10.2.2 模块设计
10.3 功能实现
10.3.1 写作润色功能
10.3.2 批阅纠错功能
10.3.3 智能翻译功能
10.3.4 个人中心功能
10.4 本章小结
附录 大模型的发展阶段
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...