-
内容大纲
本书以实际业务场景为例,介绍自然语言处理(NLP)系统开发项目的整个生命周期——从收集数据到部署和监控模型。读者将深入理解NLP系统的开发流程,知道如何消除开发痛点,从算法、数据等方面提高NLP系统的质量。全书分为四大部分,共有11章。第一部分概述NLP技术,为全书奠定知识基础。第二部分从实战角度讲解NLP系统的开发要点,内容涉及文本分类、信息提取等。第三部分专注于NLP重点应用的垂直领域:社交媒体、电子商务、医疗行业、金融业等。第四部分将所有知识点融会贯通,并讲解如何利用所学知识部署NLP系统。
本书适合在实际工作中与自然语言处理系统打交道的所有人,包括软件工程师、测试工程师、算法工程师、数据工程师、产品经理和相关技术负责人。 -
作者介绍
-
目录
本书赞誉
序
前言
第一部分 基础
第1章 自然语言处理概要
1.1 真实世界中的自然语言处理
1.2 什么是语言
1.2.1 语言的基本模块
1.2.2 为什么自然语言处理很困难
1.3 机器学习、深度学习和自然语言处理:概述
1.4 自然语言处理方法
1.4.1 基于启发式的自然语言处理
1.4.2 用于自然语言处理的机器学习
1.4.3 用于自然语言处理的深度学习
1.4.4 为什么深度学习还不是自然语言处理的灵丹妙药
1.5 自然语言处理演练:对话智能体
1.6 小结
第2章 自然语言处理流水线
2.1 数据获取
2.2 文本提取和清洗
2.2.1 HTML解析和清洗
2.2.2 Unicode规范化
2.2.3 拼写更正
2.2.4 特定于系统的错误更正
2.3 预处理
2.3.1 预备步骤
2.3.2 常用步骤
2.3.3 其他预处理步骤
2.3.4 高级处理
2.4 特征工程
2.4.1 经典自然语言处理机器学习流水线
2.4.2 深度学习流水线
2.5 建模
2.5.1 从简单的启发式开始
2.5.2 构建自己的模型
2.5.3 构建最终模型
2.6 评估
2.6.1 内在评估
2.6.2 外在评估
2.7 建模之后的阶段
2.7.1 部署
2.7.2 监控
2.7.3 模型更新
2.8 使用其他语言
2.9 案例研究
2.10 小结
第3章 文本表示
3.1 向量空间模型
3.2 基本的向量化方法
3.2.1 独热编码
3.2.2 词袋
3.2.3 n-gram袋
3.2.4 TF-IDF
……
第二部分 核心
第三部分 应用
第四部分 综合
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...