欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 数据科学技术(文本分析和知识图谱全彩印刷)
      • 作者:苏海波//刘译璟//易显维//苏萌|责编:赵军
      • 出版社:清华大学
      • ISBN:9787302649700
      • 出版日期:2024/01/01
      • 页数:334
    • 售价:51.6
  • 内容大纲

        数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的实现路线,并对应用于业界算法大赛中的技术方案和技巧进行源代码解读,帮助读者深入理解技术原理。最后,本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。
        本书适合具备Python和机器学习技术基础的高等院校学生、文本分析(或者自然语言处理)以及知识图谱领域的算法工程师和研究机构的研究者阅读,也适合数据科学和人工智能领域的研究者作为参考书。
  • 作者介绍

  • 目录

    第1章  什么是数据科学
      1.1  数据科学的定义
        1.1.1  数据科学的背景
        1.1.2  数据科学的定义
      1.2  数据科学的关键技术
        1.2.1  数据存储计算
        1.2.2  数据治理
        1.2.3  结构化数据分析
        1.2.4  语音分析
        1.2.5  视觉分析
        1.2.6  文本分析
        1.2.7  知识图谱
      1.3  本章小结
      1.4  习题
      1.5  本章参考文献
    第2章  文本预训练模型
      2.1  文本分析技术的发展史
      2.2  Transformer模型结构
      2.3  预训练模型的结构和变种
      2.4  加速处理器GPU和TPU
        2.4.1  GPU的介绍
        2.4.2  GPU产品命名
        2.4.3  TPU和GPU的区别
        2.4.4  TPU的使用总结
      2.5  预训练模型的常见问题
        2.5.1  模型输入的常见问题
        2.5.2  模型原理的常见问题
        2.5.3  模型进化的常见问题
      2.6  预训练模型的源码解读
        2.6.1  模型架构
        2.6.2  BertModel
        2.6.3  BERT预训练任务
        2.6.4  BERT微调
      2.7  本章小结
      2.8  习题
      2.9  本章参考文献
    第3章  多语种文本分析
      3.1  多语种文本分析背景介绍
      3.2  多语种文本分析技术
        3.2.1  Polyglot技术
        3.2.2  Multilingual BERT
        3.2.3  XLM多语言模型
        3.2.4  XLMR多语言模型
        3.2.5  模型实验效果
      3.3  多语种文本分析源码解读
      3.4  本章小结
      3.5  习题
      3.6  本章参考文献
    第4章  文本情感分析
    第5章  文本机器翻译

    第6章  文本智能纠错
    第7章  知识图谱构建
    第8章  知识图谱问答
    第9章  结构化知识NL2SQL问答
    第10章  ChatGPT大语言模型
    第11章  行业实践案例