欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Java自然语言处理(原书第2版)/智能系统与技术丛书
      • 作者:(美)理查德·M.里斯//(印)艾希什辛格·巴蒂亚|责编:李美莹|译者:邹伟//李妍//武现臣
      • 出版社:机械工业
      • ISBN:9787111657873
      • 出版日期:2020/07/01
      • 页数:221
    • 售价:31.6
  • 内容大纲

        本书融合作者多年从业和教学经验,全面阐述使用Java从非结构化数据中组织和提取有用文本的各种实用方法。本书重点介绍NLP应用中可能遇到的核心NLP任务,每个任务都从问题的描述以及应用领域开始,循序渐进地进行分析并给出解决方案,便于你更好地理解NLP技术,高效地解决实际问题。
        全书内容丰富,不仅全面描述和总结了自然语言处理的基础知识,还详细介绍了自然语言处理的多种技术,包括NLP工具、文本分词、文本断句、词性判断、任务识别、文本分类、关系提取和组合应用等。书中结合多个示例进行深入分析,并采用Java编程语言进行处理与结果分析。
  • 作者介绍

  • 目录

    译者序
    前言
    作者简介
    审校者简介
    第1章  NLP概论
      1.1  NLP是什么
      1.2  为什么使用NLP
      1.3  为什么NLP这么难
      1.4  NLP工具汇总
        1.4.1  Apache OpenNLP
        1.4.2  Stanford NLP
        1.4.3  LingPipe
        1.4.4  GATE
        1.4.5  UIMA
        1.4.6  Apache Lucene Core
      1.5  Java深度学习
      1.6  文本处理任务概述
        1.6.1  查找文本的各部分
        1.6.2  文本断句
        1.6.3  特征工程
        1.6.4  查找人物和事件
        1.6.5  词性判断
        1.6.6  对文本和文档进行分类
        1.6.7  关系提取
        1.6.8  使用组合方法
      1.7  理解NLP方法
        1.7.1  识别任务
        1.7.2  选择模型
        1.7.3  建立并训练模型
        1.7.4  验证模型
        1.7.5  运用模型
      1.8  准备数据
      1.9  总结
    第2章  查找文本的各部分
      2.1  理解文章的各个部分
      2.2  分词是什么
      2.3  简单的Java分词器
        2.3.1  使用Scanner类
        2.3.2  使用split方法
        2.3.3  使用BreakIterator类
        2.3.4  使用StreamTokenizer类
        2.3.5  使用StringTokenizer类
        2.3.6  Java核心分词的性能考虑
      2.4  NLP分词器API
        2.4.1  使用OpenNLPTokenizer类
        2.4.2  使用Stanford分词器
        2.4.3  训练分词器找出文本的各部分
        2.4.4  分词器比较
      2.5  了解规范化
        2.5.1  转换成小写

        2.5.2  删除停用词
        2.5.3  使用词干分析
        2.5.4  使用词元化
        2.5.5  使用管道进行标准化处理
      2.6  总结
    第3章  文本断句
    第4章  人物识别
    第5章  词性判断
    第6章  用特征表示文本
    第7章  信息检索
    第8章  对文本和文档进行分类
    第9章  主题建模
    第10章  使用解析器提取关系
    第11章  组合管道
    第12章  创建一个聊天机器人