-
内容大纲
如何保证大模型输出内容的可靠性?
如何建立自然语言和形式逻辑之间的映射?
如何在工业级应用中将自然语言查询自动转换为SQL语言?
如何由浅入深地实现一个知识图谱问答系统?
如何使用预训练技术提高模型语义理解的能力?
如何通过数据增强的方法提升语义解析的效果?
在实际产品中如何应用语义解析技术?
以上所有问题都能在本书中找到答案!
语义解析技术能解决大模型无法保证输出的形式语言可靠性和输出答案真实性的问题。本书由语义解析大赛获奖者撰写,通过本书的学习,读者可以了解NLP的相关技术,掌握自然语言生成SQL和知识图谱问答的实现方法。
本书从逻辑上分为三部分。
第一部分(第1章):从具体的语义解析问题入手,引出了各种主流技术,讨论了不同技术方案的对比和实现路径,并比较了不同数据集和技术路线的实验效果。
第二部分(第2~6章):详细讲解了5种语义解析技术路线,即基于机器翻译、模板填充、强化学习、GNN、中间表达的技术原理与实现示例。
第三部分(第7~11章):讲解了如何从零开始构建一个语义解析系统,并针对NL2SQL和知识图谱问答的不同应用场景提供实践方案。同时,阐述了在产品中落地语义解析技术可能遇到的问题和应对技巧。 -
作者介绍
-
目录
前言
第1章 NL2SQL和KBQA中的语义解析技术
1.1 人机交互应用与语义解析难点分析
1.2 主流的语义解析技术
1.2.1 NL2SQL任务及方法
1.2.2 KBQA任务及方法
1.2.3 语义解析技术方案对比
1.3 语义解析的预训练模型和数据集
1.3.1 语义解析中的预训练模型
1.3.2 NL2SQL数据集
1.3.3 KBQA数据集
1.4 本章小结
第2章 基于机器翻译的语义解析技术
2.1 机器翻译原理浅析
2.1.1 常见机器翻译技术路线
2.1.2 神经网络机器翻译基本框架
2.2 NL2SQL翻译框架的构建
2.2.1 Seq2Seq模型原理
2.2.2 将Seq2Seq模型应用于NL2SQL
2.3 从序列到集合:SQLNet模型的解决方案
2.3.1 序列到集合
2.3.2 列名注意力
2.3.3 SQLNet模型预测及其训练细节
2.4 T5预训练模型在NL2SQL中的应用
2.4.1 T5模型简介
2.4.2 T5模型架构
2.4.3 T5模型训练方式
2.4.4 T5模型在NL2SQL中的应用
2.5 NL2SQL的T5模型实践
2.6 本章小结
第3章 基于模板填充的语义解析技术
3.1 意图识别和槽位填充
3.1.1 意图识别和槽位填充的步骤
3.1.2 如何进行意图识别和槽位填充
3.2 基于X-SQL的模板定义与子任务分解
3.3 本章小结
第4章 基于强化学习的语义解析技术
4.1 Seq2Seq中的强化学习知识
4.2 SCST模型
4.2.1 SCST模型简介
4.2.2 SCST模型框架
4.2.3 SCST代码实现
4.3 MAPO模型
4.3.1 MAPO模型简介
4.3.2 MAPO代码实现
4.4 本章小结
第5章 基于GNN的语义解析技术
5.1 使用GNN对数据库模式进行编码
5.1.1 匹配可能模式项的集合
5.1.2 GNN编码表示
5.2 关注模式的Global GNN
5.2.1 Global GNN的改进
5.2.2 Gating GCN模块详解
5.2.3 Re-ranking GCN模块详解
5.3 关注模式链接的RATSQL
5.3.1 Relation-Aware Self-Attention模型
5.3.2 考虑更复杂的连接关系
5.3.3 模式链接的具体实现
5.4 关注模式链接拓扑结构的LGESQL
5.4.1 LGESQL模型简介
5.4.2 LGESQL模型框架
5.5 本章小结
第6章基 于中间表达的语义解析技术
6.1 中间表达:IRNet
6.2 引入中间表达层SemQL
6.3 IRNet代码精析
6.3.1 模式链接代码实现
6.3.2 SemQL的生成
6.3.3 SQL语句的生成
6.4 本章小结
第7章 面向无嵌套简单SQL查询的原型系统构建
7.1 语义匹配解决思路
7.2 任务简介
7.3 任务解析
7.3.1 列名解析
7.3.2 输入整合
7.3.3 输出子任务解析
7.3.4 模型整体架构
7.4 代码示例
7.4.1 QueryTokenizer类的构造
7.4.2 SqlLabelEncoder类的构造
7.4.3 生成批量数据
7.4.4 模型搭建
7.4.5 模型训练和预测
7.5 本章小结
第8章 面向复杂嵌套SQL查询的原型系统构建
8.1 复杂嵌套SQL查询的难点剖析
8.1.1 复杂嵌套SQL语句
8.1.2 难点与对策分析
8.2 型模型解析
8.2.1 构建复杂SQL语句的中间表达形式
8.2.2 型模型的搭建与训练
8.3 列模型解析
8.3.1 嵌套信息的编码设计
8.3.2 列模型的搭建与训练
8.4 值模型解析
8.4.1 值与列的关系解析
8.4.2 值模型的搭建与训练
8.5 完整系统演示
8.5.1 解码器
8.5.2 完整流程演示
8.6 本章小结
第9章 面向SPARQL的原型系统构建
9.1 T5、BART、UniLM模型简介
9.2 T5、BART、UniLM方案
9.3 T5、BART、UniLM生成SPARQL语句实现
9.4 T5、BART、UniLM模型结果合并
9.5 路径排序
9.6 SPARQL语句修正和再次排序
9.7 本章小结
第10章 预训练优化
10.1 预训练技术的发展
10.1.1 掩码语言建模
10.1.2 去噪自动编码器
10.2 定制预训练模型:TaBERT
10.2.1 信息的联合表示
10.2.2 预训练任务设计
10.3 TAPAS
10.3.1 附加Embedding编码表结构
10.3.2 预训练任务设计
10.4 GRAPPA
10.4.1 表格数据增强:解决数据稀疏难题
10.4.2 预训练任务设计
10.5 本章小结
第11章 语义解析技术落地思考
11.1 研究与落地的差别
11.2 产品视角的考虑
11.3 潜在的落地场景
11.4 实践技巧
11.4.1 数据增强在NLP领域的应用
11.4.2 数据增强策略
11.4.3 方案创新点
11.5 本章小结
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
