欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Python日语数字人文之文本挖掘技术及其应用
      • 作者:钟勇|责编:刘坚
      • 出版社:东南大学
      • ISBN:9787576621334
      • 出版日期:2025/05/01
      • 页数:223
    • 售价:31.2
  • 内容大纲

        本书作为基于Python的日语数字人文系列研究著作之一,聚焦于文本挖掘领域中的各种数字技术,研究其Python编程实现路径及在日语语言研究中的应用方法。具体说来,本书较为全面地梳理和研究词云图绘制、关键词提取、词共现网络分析、主题模型建构、文本向量化、文本聚类、情感分析等文本挖掘领域中适用于日语数字人文研究的数字技术,详细演示其在日语文本数据处理中的Python编程实现,并通过一系列研究实例剖析其在日语语言研究中的具体应用方法。本书旨在助力语言学研究者,尤其是日语语言研究者较为系统地了解文本挖掘涉及的主要内容及范围,较为快捷地掌握基于Python的日语文本挖掘技术编程实现,进而打通技术与应用之间的壁垒,提升开展新兴日语数字人文研究的眼光和能力。
  • 作者介绍

        钟勇,男,1984年生,湖南人,中共党员;博士毕业于日本九州大学,现任南京航空航天大学外国语学院副研究员、硕士生导师、日语系副主任及英语系与日语系联合党支部书记;主要研究领域为二语习得、语言数字人文、Python数据处理等;迄今已在《日语学习与研究》、「言語文化論究」等国内外学术期刊上发表论文30余篇,主持省部级、院校级课题项目等7项,出版学术专著2部。
  • 目录

    第一章 绪论
      参考文献
    第二章 日语词云图绘制技术
      2.1 技术概要与编程提示
      2.2 词云图绘制编程实现
        2.2.1 所用语料与编程步骤
        2.2.2 分步代码
        2.2.3 完整代码
      参考文献
    第三章 日语关键词提取技术
      3.1 技术概要与编程提示
      3.2 基于TF IDF的关键词提取编程实现
        3.2.1 所用语料与编程步骤
        3.2.2 分步代码
        3.2.3 完整代码
      3.3 基于TextRank和MultipartiteRank的关键词提取编程实现
        3.3.1 所用语料与编程步骤
        3.3.2 分步代码
        3.3.3 完整代码
      3.4 基于BERT类模型的关键词提取编程实现
        3.4.1 所用语料与编程步骤
        3.4.2 分步代码
        3.4.3 完整代码
      参考文献
    第四章 日语词共现网络分析技术
      4.1 技术概要与编程提示
      4.2 基于前N位选取法和窗口跨距的词共现网络分析编程实现
        4.2.1 所用语料与编程步骤
        4.2.2 分步代码
        4.2.3 完整代码
      4.3 基于高低频词界定公式选取法和句子单位的词共现网络分析编程实现
        4.3.1 所用语料与编程步骤
        4.3.2 分步代码
        4.3.3 完整代码
      4.4 基于二八定律选取法和依存关系的词共现网络分析编程实现
        4.4.1 所用语料与编程步骤
        4.4.2 分步代码
        4.4.3 完整代码
      参考文献
    第五章 日语主题模型建构技术
      5.1 技术概要与编程提示
      5.2 基于LDA的主题模型建构编程实现
        5.2.1 所用语料与编程步骤
        5.2.2 分步代码
        5.2.3 完整代码
      5.3 基于BERTopic的主题模型建构编程实现
        5.3.1 所用语料与编程步骤
        5.3.2 分步代码
        5.3.3 完整代码
      参考文献

    第六章 日语文本向量化技术
      6.1 技术概要与编程提示
      6.2 基于Word2vec的单词向量化编程实现
        6.2.1 所用语料与编程步骤
        6.2.2 分步代码
        6.2.3 完整代码
      6.3 基于BERT的单词向量化编程实现
        6.3.1 所用语料与编程步骤
        6.3.2 分步代码
        6.3.3 完整代码
      6.4 基于Sentence BERT的句子向量化编程实现
        6.4.1 所用语料与编程步骤
        6.4.2 分步代码
        6.4.3 完整代码
      6.5 基于BERT的句子和文档向量化编程实现
        6.5.1 所用语料与编程步骤
        6.5.2 分步代码
        6.5.3 完整代码
      6.6 基于Doc2Vec的文档向量化编程实现
        6.6.1 所用语料与编程步骤
        6.6.2 分步代码
        6.6.3 完整代码
      参考文献
    第七章 日语文本聚类技术
      7.1 技术概要与编程提示
      7.2 基于TF IDF和K 均值聚类算法的文本聚类编程实现
        7.2.1 所用语料与编程步骤
        7.2.2 分步代码
        7.2.3 完整代码
      7.3 基于Doc2Vec和层次聚类算法的文本聚类编程实现
        7.3.1 所用语料与编程步骤
        7.3.2 分步代码
        7.3.3 完整代码
      7.4 基于BERT和HDBSCAN聚类算法的文本聚类编程实现
        7.4.1 所用语料与编程步骤
        7.4.2 分步代码
        7.4.3 完整代码
      参考文献
    第八章 日语情感分析技术
      8.1 技术概要与编程提示
      8.2 基于情感词典的情感分析编程实现
        8.2.1 所用语料与编程步骤
        8.2.2 分步代码
        8.2.3 完整代码
      8.3 基于传统机器学习的情感分析编程实现
        8.3.1 所用语料与编程步骤
        8.3.2 分步代码
        8.3.3 完整代码
      8.4 基于深度学习的情感分析编程实现
        8.4.1 所用语料与编程步骤

        8.4.2 分步代码
        8.4.3 完整代码
      参考文献
    第九章 日语语言研究实例
      参考文献

同类热销排行榜

推荐书目

  • 孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...

  • 时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...

  • 本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...

更多>>>