欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 自然语言处理实战(从入门到项目实践)
      • 作者:(印)索米亚·瓦贾拉//博迪萨特瓦·马祖达尔//阿努杰·古普塔//哈尔希特·苏拉纳|责编:温雪|译者:吴进操//黄若星
      • 出版社:人民邮电
      • ISBN:9787115597892
      • 出版日期:2022/09/01
      • 页数:293
    • 售价:43.92
  • 内容大纲

        本书以实际业务场景为例,介绍自然语言处理(NLP)系统开发项目的整个生命周期——从收集数据到部署和监控模型。读者将深入理解NLP系统的开发流程,知道如何消除开发痛点,从算法、数据等方面提高NLP系统的质量。全书分为四大部分,共有11章。第一部分概述NLP技术,为全书奠定知识基础。第二部分从实战角度讲解NLP系统的开发要点,内容涉及文本分类、信息提取等。第三部分专注于NLP重点应用的垂直领域:社交媒体、电子商务、医疗行业、金融业等。第四部分将所有知识点融会贯通,并讲解如何利用所学知识部署NLP系统。
        本书适合在实际工作中与自然语言处理系统打交道的所有人,包括软件工程师、测试工程师、算法工程师、数据工程师、产品经理和相关技术负责人。
  • 作者介绍

  • 目录

    本书赞誉

    前言
    第一部分  基础
      第1章  自然语言处理概要
        1.1  真实世界中的自然语言处理
        1.2  什么是语言
          1.2.1  语言的基本模块
          1.2.2  为什么自然语言处理很困难
        1.3  机器学习、深度学习和自然语言处理:概述
        1.4  自然语言处理方法
          1.4.1  基于启发式的自然语言处理
          1.4.2  用于自然语言处理的机器学习
          1.4.3  用于自然语言处理的深度学习
          1.4.4  为什么深度学习还不是自然语言处理的灵丹妙药
        1.5  自然语言处理演练:对话智能体
        1.6  小结
      第2章  自然语言处理流水线
        2.1  数据获取
        2.2  文本提取和清洗
          2.2.1  HTML解析和清洗
          2.2.2  Unicode规范化
          2.2.3  拼写更正
          2.2.4  特定于系统的错误更正
        2.3  预处理
          2.3.1  预备步骤
          2.3.2  常用步骤
          2.3.3  其他预处理步骤
          2.3.4  高级处理
        2.4  特征工程
          2.4.1  经典自然语言处理机器学习流水线
          2.4.2  深度学习流水线
        2.5  建模
          2.5.1  从简单的启发式开始
          2.5.2  构建自己的模型
          2.5.3  构建最终模型
        2.6  评估
          2.6.1  内在评估
          2.6.2  外在评估
        2.7  建模之后的阶段
          2.7.1  部署
          2.7.2  监控
          2.7.3  模型更新
        2.8  使用其他语言
        2.9  案例研究
        2.10  小结
      第3章  文本表示
        3.1  向量空间模型
        3.2  基本的向量化方法
          3.2.1  独热编码

          3.2.2  词袋
          3.2.3  n-gram袋
          3.2.4  TF-IDF
    ……
    第二部分  核心
    第三部分  应用
    第四部分  综合