-
内容大纲
本书面向语言工程,对现有汉语词类体系和词性标注工作展开调查,梳理总结汉语词类体系和词性标注中存在的主要问题,并以英汉语对比为基础,揭示汉语词类体系与词性标注的主要特点,为汉语本体研究和语料库加工提供参考。本书还开展了词性自动标注模型研究,在隐马尔科夫模型的基础上,建立了多观察和多状态搭接的COV模型,并将该模型运用到词性标注任务中,获得了较好的标注效果。
本书适合语言学研究者和学习者以及对语言工程感兴趣的读者参阅。 -
作者介绍
-
目录
第1章 绪论
1.1 研究背景
1.2 研究目标与内容
1.3 本书结构
第2章 词类研究概述
2.1 国际上词类研究概述
2.2 汉语词类研究概述
2.3 面向语言信息处理的汉语词类研究
第3章 词性标注研究概述
3.1 词性标注与语料库加工
3.2 主要的英语语料库介绍
3.3 主要的汉语语料库介绍
3.4 有关汉语词性标注的评测活动
3.5 语言工程中的自动标注方法研究
第4章 词类属性调查
4.1 调查目的及方法
4.2 词类及其兼类的总体分布
4.3 主要词类属性调查
4.4 另类词分布统计
第5章 词性标注调查
5.1 相关术语及定义
5.2 语料标注调查的必要性
5.3 词性标注的调查原则
5.4 调查目的及方法
5.5 标注语料的总体情况
5.6 实词兼类调查
5.7 虚词兼类调查
5.8 语料标注调查结果分析
第6章 汉语词类与词性标注问题分析
6.1 汉语词类体系的分析
6.2 汉语词性标注分析
6.3 汉语词类问题的总结及相关对策
第7章 英汉语词类问题的比较
7.1 句法约束与词类之间的关系比较
7.2 词类属性与句法实现之间的比较
7.3 词性标注过程的比较
7.4 英汉语词类特点的总结
第8章 COV模型与词性标注
8.1 标注模型概述
8.2 COV模型的形式化描述及与HMM模型的对比分析
8.3 参数估计及稀疏数据处理
8.4 算法描述
8.5 评价方法
8.6 实验设计及结果分析
8.7 COV模型在英文词性标注中的应用
8.8 COV模型讨论
第9章 汉语词性标注体系与自动标注错误的关系分析
9.1 自动标注错误原因
9.2 兼类词词性调查分类
9.3 主要评价指标
9.4 实验结果及分析
9.5 主要结论和启示
第10章 总结与展望
10.1 主要工作
10.2 未来展望
参考文献
附录 词性标注调查词(词频)表
同类热销排行榜
- 目送/人生三书
-
21世纪的《背影》 + 感人至深的“生死笔记”+ 龙应台亲手摄影 + 跨三代共读的人生之书!
华人世界率性犀利的一枝笔,龙应台独家...
- 顾城的诗(金版)(精)/蓝星诗库
- 人类群星闪耀时(插图本)/译林名著精选
- 牛津高阶英汉双解词典(附光盘第8版)(精)
- 文化苦旅(新版)
- 摆渡人
- 解忧杂货店(精)
- 骆驼祥子
- 曾国藩(又笨又慢平天下)
- 查令十字街84号(珍藏版)(精)
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
