-
内容大纲
自然语言处理是一门集语言学、计算机科学、数学于一体的科学,它包含很广泛的内容,根据其应用目的不同,所采用的技术手段也不尽相同。
本书从数理基础到模型介绍,再到生活应用,从不同的层次,由浅入深、循序渐进地展示一个完整的自然语言处理学习体系。
本书分两部分。第一部分为理论基础,其中第1~4章对什么是自然语言处理、当前主流的自然语言处理技术,以及目前自然语言处理遇到的困境进行介绍;第5、6章从数学基础、语言模型,以及词法分析、语义分析等方面介绍自然语言处理的底层逻辑和模型原理。第二部分为实践应用,第7~11章介绍自然语言处理在生活中的应用。
本书实用性强、案例贴近生活,每章配有习题及其答案,读者可以扫描二维码查看习题答案。
本书可作为“自然语言处理”课程的本科生教材,也可作为“人工智能”“文本挖掘”“语料库语言学”课程的辅导书,还可作为自然语言处理领域的入门书籍。 -
作者介绍
-
目录
第一部分 理论基础
第1章 绪论
1.1 基本概念
1.2 自然语言处理的产生与发展
1.3 基本问题和主要困难
1.3.1 自然语言处理的基本问题
1.3.2 自然语言处理面对的主要困难
1.4 深度学习在自然语言处理中的应用
1.4.1 深度学习概述
1.4.2 面向自然语言处理的深度学习方法
1.4.3 目前深度学习应用存在的局限及展望
1.5 本章小结
习题1
第2章 数学基础
2.1 概率论基础
2.1.1 样本空间和概率
2.1.2 随机变量
2.1.3 条件概率公式、全概率公式和贝叶斯公式
2.1.4 期望和方差
2.2 信息论基础
2.2.1 自信息和熵
2.2.2 联合熵和条件熵
2.2.3 互信息、相对熵和交叉熵
2.2.4 困惑度
2.2.5 噪声信道模型
2.3 深度学习的数学基础
2.3.1 最大似然估计
2.3.2 梯度分析
2.3.3 梯度下降法
2.3.4 梯度消失和梯度爆炸
2.4 本章小结
习题2
第3章 语言模型
3.1 语言模型概念及基础理论
3.1.1 n元语法模型
3.1.2 神经概率语言模型
3.1.3 预训练语言模型
3.2 语言模型性能评价
3.2.1 基于信息熵的语言模型复杂度度量
3.2.2 基于困惑度的语言模型复杂度度量
3.2.3 基于语言模型的汉语信息熵估算
3.3 数据平滑
3.3.1 问题的提出
3.3.2 加法平滑方法
3.3.3 Good-Turing估计法
3.3.4 Katz平滑方法
3.3.5 Jelinek-Mercer平滑方法
3.3.6 Witten-Bell平滑方法
3.3.7 绝对减值法
3.4 神经网络语言模型
3.4.1 基础模型
3.4.2 CNN模型
3.4.3 RNN模型及其变体
3.4.4 Attention模型
3.4.5 Transformer模型
3.5 语言模型应用举例
3.5.1 BERT模型
3.5.2 短文本表示
3.5.3 Softmax回归模型
3.6 本章小结
习题3
第4章 隐马尔可夫模型与条件随机场
4.1 马尔可夫模型
4.1.1 马尔可夫过程
4.1.2 马尔可夫性
4.2 隐马尔可夫模型
4.2.1 隐马尔可夫模型的基本理论
4.2.2 估计问题
4.2.3 序列问题
4.2.4 参数估计问题
4.3 HMM应用举例
4.3.1 中文分词
4.3.2 词性标注
4.4 条件随机场及其应用
4.4.1 条件随机场概念
4.4.2 条件随机场应用
4.5 本章小结
习题4
第5章 词法分析与词性标注
5.1 汉语自动分词
5.1.1 分词规范问题
5.1.2 歧义切分问题
5.1.3 未登录词问题
5.1.4 汉语自动分词的原则
5.1.5 分词与词性标注结果评估方法
5.2 自动分词基本算法
5.2.1 最大匹配法
5.2.2 最短路径方法
5.2.3 基于HMM的分词方法
5.2.4 基于Bi-LSTM-CRF的分词方法
5.3 未登录词识别
5.3.1 概述
5.3.2 基于决策树的未登录词识别方法
5.3.3 基于统计和规则的未登录词识别方法
5.4 词性标注方法
5.4.1 概述
5.4.2 基于规则的词性标注方法
5.4.3 基于统计的词性标注方法
5.4.4 基于深度学习的词性标注方法
5.5 本章小结
习题5
第6章 语义分析
6.1 语义网络
6.1.1 基本概念
6.1.2 语义标注
6.2 概念依存
6.3 词义消歧
6.3.1 基本内容
6.3.2 理论方法
6.3.3 案例分析
6.4 词向量表示与词嵌入
6.4.1 基本内容
6.4.2 理论方法
6.4.3 案例分析
6.5 语义分析在华为毕昇编译器AI调优中的应用
6.5.1 基本内容
6.5.2 理论方法
6.6 本章小结
习题6
第二部分 实践应用
第7章 机器翻译
7.1 机器翻译概述
7.1.1 机器翻译方法概述
7.1.2 机器翻译的研究现状
7.2 统计机器翻译
7.2.1 基于词的机器翻译
7.2.2 基于短语的机器翻译
7.2.3 基于句子的机器翻译
7.3 神经机器翻译
7.3.1 神经机器翻译概述
7.3.2 神经机器翻译模型
7.4 实战GRU翻译模型
7.4.1 基础知识与环境配置
7.4.2 代码实现
7.5 本章小结
习题7
第8章 文本分类、聚类和情感分析
8.1 文本分类
8.1.1 文本分类的定义
8.1.2 文本分类的发展
8.1.3 传统文本分类的实现
8.1.4 基于深度学习的分类器设计
8.2 文本聚类
8.2.1 基于分层的文本聚类
8.2.2 基于划分的文本聚类
8.3 情感分析
8.3.1 基于情感词典的情感分析
8.3.2 基于深度学习的方面级情感分类算法
8.3.3 带有Attention机制的LSTM网络的方法
8.3.4 带有Attention机制的双向LSTM网络的方法
8.4 本章小结
习题8
第9章 信息抽取
9.1 实体识别与抽取
9.1.1 命名实体识别概述
9.1.2 有监督学习方法实现命名实体识别
9.1.3 基于深度学习的NER
9.2 实体消歧
9.2.1 实体消歧概述
9.2.2 基于上下文相似度的实体消歧
9.2.3 基于实体显著性的实体消歧
9.2.4 基于实体关联度的实体消歧
9.3 关系抽取
9.3.1 基于模式匹配的关系抽取
9.3.2 基于深度学习的关系抽取方法
9.3.3 关系抽取展望
9.4 事件抽取
9.4.1 事件抽取任务定义
9.4.2 基于模式匹配的事件抽取实现
9.4.3 基于深度学习的事件抽取实现
9.5 本章小结
习题9
第10章 知识图谱
10.1 知识图谱发展历史
10.2 知识图谱基本概念
10.2.1 知识库的概念及分类
10.2.2 知识库的表示形式
10.3 知识图谱的生命周期
10.3.1 知识建模
10.3.2 知识抽取
10.3.3 知识融合
10.3.4 知识存储
10.3.5 知识计算
10.3.6 知识图谱应用
10.4 知识图谱的现有应用
10.4.1 语义搜索
10.4.2 智能问答系统
10.4.3 辅助决策
10.4.4 个性化推荐
10.4.5 学科知识图谱
10.5 本章小结
习题10
第11章 问答系统与人机对话系统
11.1 问答系统
11.1.1 系统构成
11.1.2 基于信息检索和答案选择的混合式问答系统
11.2 基于大规模知识库的问答系统
11.2.1 知识库问答系统任务
11.2.2 基于中文知识图谱的问答系统
11.3 阅读理解式问答系统
11.4 对话系统
11.4.1 基于深度学习的多方对话系统
11.4.2 对话系统相关任务
11.5 医学视觉问答
11.5.1 相关概念介绍
11.5.2 面向医学数据特征优化的视觉问答系统
11.6 问答系统在MindSpore框架中的应用
11.6.1 华为昇思MindSpore框架
11.6.2 DAM模型
11.6.3 基于MindSpore框架的DAM模型分析
11.6.4 所用数据集`
11.7 本章小结
习题11
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
