欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 自然语言处理入门/人工智能核心系列/计算机前沿技术丛书
      • 作者:编者:李洋//李实|责编:王芳//李晔
      • 出版社:清华大学
      • ISBN:9787302644484
      • 出版日期:2024/01/01
      • 页数:174
    • 售价:19.6
  • 内容大纲

        自然语言处理的目标是使计算机能够像人类一样理解语言。近年来,自然语言处理作为一门学科发展迅速,得到了越来越广泛的应用。本书从基本概念出发,对自然语言基础任务进行介绍,首先介绍自然语言处理基础的词法、句子以及篇章级任务:中文分词、命名实体识别、关系抽取、词向量技术、关键词提取和文本分类,然后介绍近年来广泛应用的知识图谱、机器阅读理解、自动文摘、文本生成、对话系统等内容以期读者能够对自然语言处理各个部分的研究内容和技术手段有更加深入的理解。
        本书可作为高等院校相关专业本科生及研究生对于自然语言处理领域学习的入门教材。
  • 作者介绍

  • 目录

    第1章  中文分词
      1.1  中文分词中的基本问题
        1.1.1  中文分词规范问题
        1.1.2  歧义切分问题
        1.1.3  未登录词识别问题
      1.2  基于词表的分词算法
        1.2.1  正向最大匹配算法
        1.2.2  逆向最大匹配算法
        1.2.3  双向最大匹配算法
      1.3  基于统计模型的分词算法
      1.4  基于序列标注的分词算法
        1.4.1  基于HMM的分词方法
        1.4.2  基于CRF的分词方法
        1.4.3  基于Bi-LSTM-CRF的中文分词方法
      参考文献
    第2章  命名实体识别
      2.1  基于CRF的命名实体识别
        2.1.1  CRF基本概念
        2.1.2  命名实体识别任务
      2.2  基于Bi-LSTM-CRF的命名实体识别
        2.2.1  RNN
        2.2.2  LSTM网络
        2.2.3  双向LSTM网络
        2.2.4  Bi-LSTM-CRF
      2.3  注意力机制
      参考文献
    第3章  关系抽取
      3.1  实体关系抽取定义
      3.2  实体关系抽取框架
      3.3  评测方法
      3.4  有监督实体关系抽取方法
      3.5  半监督实体关系抽取方法
      3.6  远程监督实体关系抽取方法
      参考文献
    第4章  词向量技术
      4.1  One-Hot词向量技术
      4.2  Word2Vec词向量技术
        4.2.1  CBOW模型
        4.2.2  Skip-Gram模型
        4.2.3  优化方法
      4.3  BERT词向量嵌入
        4.3.1  注意力机制
        4.3.2  Transformer
        4.3.3  BERT
        4.3.4  基于BERT的衍生模型
      参考文献
    第5章  关键词提取
      5.1  TextRank关键词提取算法
        5.1.1  基于图的排序算法
        5.1.2  基于图的排序算法的拓展运用

        5.1.3  基于图的排序算法在关键词提取中的运用
        5.1.4  TextRank算法
      5.2  TF-IDF关键词提取算法
      5.3  LDA与PLSA关键词提取算法
        5.3.1  相关基础知识
        5.3.2  PLSA模型
        5.3.3  LDA模型
      参考文献
    第6章  文本分类
      6.1  文本分类概述
      6.2  文本表示
        6.2.1  离散式表示
        6.2.2  分布式表示
      6.3  文本特征提取
        6.3.1  基于DF的特征提取法
        6.3.2  信息增益法
        6.3.3  x2统计量
        6.3.4  互信息法
      6.4  特征权重计算方法
      6.5  分类器构建
        6.5.1  朴素贝叶斯分类器
        6.5.2  SVM分类器
        6.5.3  基于神经网络的分类器
      6.6  文本分类评价指标
      参考文献
    第7章  知识图谱
      7.1  知识图谱概述
        7.1.1  知识图谱的介绍
        7.1.2  知识图谱基本概念
        7.1.3  知识表示与存储
      7.2  知识图谱构建
        7.2.1  知识抽取
        7.2.2  知识融合
        7.2.3  知识加工
        7.2.4  知识更新
      7.3  知识图谱补全
        7.3.1  知识图谱补全简介
        7.3.2  表示学习的相关理论
        7.3.3  知识图谱补全(表示学习)
      7.4  知识图谱应用
        7.4.1  通用和领域知识图谱
        7.4.2  语义集成
        7.4.3  语义搜索
        7.4.4  基于知识的问答
      参考文献
    第8章  机器阅读理解
      8.1  机器阅读理解概述
        8.1.1  机器阅读理解任务
        8.1.2  机器阅读理解发展
      8.2  数据集以及测评方式

        8.2.1  数据集
        8.2.2  测评方式
      8.3  模型
        8.3.1  模型架构
        8.3.2  预训练模型
      8.4  应用以及未来
        8.4.1  智能客服
        8.4.2  搜索引肇
        8.4.3  教育
        8.4.4  机器阅读理解面临的挑战
      参考文献
    第9章  自动文摘和文本生成
      9.1  自动文摘概述
        9.1.1  自动文摘任务
        9.1.2  自动文摘发展及分类
      9.2  生成式摘要
        9.2.1  问题与方法
        9.2.2  文摘评测
      9.3  自动文本生成
        9.3.1  自动文本生成概述
        9.3.2  基于主题的文本生成
        9.3.3  自动文本生成技术评测
      参考文献
    第10章  对话系统
      10.1  问题理解
        10.1.1  意图识别
        10.1.2  槽填充
      10.2  对话状态管理
        10.2.1  对话状态跟踪
        10.2.2  对话策略
      10.3  答句生成
      参考文献