-
内容大纲
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的实现路线,并对应用于业界算法大赛中的技术方案和技巧进行源代码解读,帮助读者深入理解技术原理。最后,本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。
本书适合具备Python和机器学习技术基础的高等院校学生、文本分析(或者自然语言处理)以及知识图谱领域的算法工程师和研究机构的研究者阅读,也适合数据科学和人工智能领域的研究者作为参考书。 -
作者介绍
-
目录
第1章 什么是数据科学
1.1 数据科学的定义
1.1.1 数据科学的背景
1.1.2 数据科学的定义
1.2 数据科学的关键技术
1.2.1 数据存储计算
1.2.2 数据治理
1.2.3 结构化数据分析
1.2.4 语音分析
1.2.5 视觉分析
1.2.6 文本分析
1.2.7 知识图谱
1.3 本章小结
1.4 习题
1.5 本章参考文献
第2章 文本预训练模型
2.1 文本分析技术的发展史
2.2 Transformer模型结构
2.3 预训练模型的结构和变种
2.4 加速处理器GPU和TPU
2.4.1 GPU的介绍
2.4.2 GPU产品命名
2.4.3 TPU和GPU的区别
2.4.4 TPU的使用总结
2.5 预训练模型的常见问题
2.5.1 模型输入的常见问题
2.5.2 模型原理的常见问题
2.5.3 模型进化的常见问题
2.6 预训练模型的源码解读
2.6.1 模型架构
2.6.2 BertModel
2.6.3 BERT预训练任务
2.6.4 BERT微调
2.7 本章小结
2.8 习题
2.9 本章参考文献
第3章 多语种文本分析
3.1 多语种文本分析背景介绍
3.2 多语种文本分析技术
3.2.1 Polyglot技术
3.2.2 Multilingual BERT
3.2.3 XLM多语言模型
3.2.4 XLMR多语言模型
3.2.5 模型实验效果
3.3 多语种文本分析源码解读
3.4 本章小结
3.5 习题
3.6 本章参考文献
第4章 文本情感分析
第5章 文本机器翻译
第6章 文本智能纠错
第7章 知识图谱构建
第8章 知识图谱问答
第9章 结构化知识NL2SQL问答
第10章 ChatGPT大语言模型
第11章 行业实践案例
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...