-
内容大纲
高定国、珠杰编著的这本《藏文信息处理的原理与应用(藏文信息处理技术)》共10章,1~6章主要介绍藏文信息处理的概念、藏文字符的编码方式及目前所用的几种藏文字符编码,支持藏文处理的Windows、Linux系统以及不同系统下藏文字符的键盘、语音、字符识别输入方式,藏文字形设计技术等藏文信息处理的原理;7~10章以藏文信息处理的原理为基础,介绍了藏文信息检索、藏文信息抽取、藏文文本分类和机器翻译等藏文信息处理的应用。
本书可以作为高等院校藏文信息技术、计算机科学与技术、电子信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可以作为从事藏文信息处理、藏语计算语言学、数据挖掘和人工智能研究的相关人员的参考书。 -
作者介绍
-
目录
第1章 概论
1.1 信息
1.2 信息处理
1.3 中文信息处理
1.3.1 汉文信息处理的发展历史
1.3.2 汉文信息处理的研究内容
1.4 藏文信息处理
1.4.1 藏文信息处理的概念
1.4.2 藏文信息处理的主要研究对象
1.5 藏文信息处理的发展历史
1.5.1 藏文字符的处理
1.5.2 藏语自然语言处理技术
1.5.3 软件本地化
1.5.4 应用领域的研究
第2章 藏文字符
2.1 藏字概述
2.2 藏字的结构
2.2.1 藏字的构件
2.2.2 藏字的结构
2.2.3 藏字的构字规则
2.2.4 现代藏字的结构方式
2.3 藏字的书写
2.3.1 藏文字体
2.3.2 藏文的书写规则
2.4 藏字的属性统计
2.4.1 藏字的数量
2.4.2 藏字字长
2.4.3 结构方式统计
2.4.4 藏字的频度统计
2.4.5 藏字的熵
2.5 现代藏字的字典序列
第3章 藏文字符编码体系
3.1 英文字符在计算机中的表示
3.1.1 标准ASCII码字符
3.1.2 扩展ASCII码字符
3.2 汉字在计算机中的表示
3.2.1 汉字的编码体系
3.2.2 ISO/IEC 2022汉字编码理论
3.2.3 GB 2312—80
3.3 ISO/IEC 10646
3.3.1 ISO/IEC 10646简介
3.3.2 UCS的总体结构
3.3.3 基本多文种平面BMP
3.3.4 BMP平面中藏文的编码段
3.4 Unicode编码
3.5 GB 1 3000标准
3.6 GB 1 8030标准
3.7 藏文编码字符集
3.7.1 藏文编码概况
3.7.2 《藏文编码字符集基本集》
3.7.3 《藏文编码字符集基本集》分析
3.7.4 《藏文编码字符集扩充集》
3.7.5 《藏文编码字符集扩充集》分析
3.8 藏字处理系统的编码
3.8.1 不同藏文输入系统的编码
3.8.2 藏文不同编码间的转化
第4章 支持藏文的操作系统
4.1 操作系统概述
4.2 支持藏字处理的操作系统
4.2.1 支持藏字处理的DOS系统
4.2.2 支持藏字处理的Windows系统
4.2.3 支持藏字处理的Linux系统
4.2.4 系统界面藏化的软件——藏文之星
第5章 藏字输入技术
5.1 藏字输入技术概述
5.1.1 藏字键盘输入
5.1.2 藏文语音识别输入
5.1.3 藏文字形识别输入
5.2 藏文字符键盘输入编码理论
5.2.1 编码中的几个概念
5.2.2 藏文字符键盘设计分析
5.2.3 藏文字符输入键盘编码理论
5.2.4 藏文键盘布局国家标准
5.3 Windows藏文字符键盘输入技术
5.3.1 WindowsIME藏文字符输入技术
5.3.2 TSF输入技术
5.4 LinuX藏文字符键盘输入技术
5.4.1 LinuX藏文输入法的总体设计
5.4.2 LinuX藏文输入法的消息
5.4.3 LinuX藏文输入法引擎回调函数
5.4.4 Linux藏文输入法引擎接口数据结构
5.5 藏文字形识别输入
5.5.1 藏文字符识别输入的原理和方法
5.5.2 藏文字符识别的预处理
5.5.3 藏文字符识别的特征提取
5.5.4 藏文字符识别的分类
5.5.5 藏文字符识别的后处理
5.6 藏语语音识别输入
5.6.1 藏语语音识别技术的原理
5.6.2 藏语语音识别理论
第6章 藏文字形设计技术
6.1 藏文点阵字库的设计
6.1.1 什么是点阵字型
6.1.2 藏文点阵字型的设计
6.1.3 点阵字库的使用
6.2 藏文矢量字形设计过程
6.3 藏文矢量字形的处理
6.4 TTF字形技术
6.4.1 什么是TrueType
6.4.2 TrueType字体文件结构
6.4.3 TrueType的特点和优势
6.4.4 TrueType的应用
6.4.5 TrueType藏文字库的设计
6.5 OTF字形技术
6.5.1 OpenType概述
6.5.2 OpenType字库设计相关的几个概念
6.5.3 藏字定型器处理藏字的步骤
6.5.4 支持藏字的Open7ype标记
6.5.5 OpenType申藏字的特征标记
6.5.6 Openl,ype藏文字库的设计
第7章 藏文信息检索
7.1 信息检索概述
7.1.1 信息检索的定义
7.1.2 信息检索的方式
7.1.3 检索系统的结构
7.2 信息检索的评测
7.3 信息检索系统的模型及算法
7.3.1 布尔模型
7.3.2 扩展的布尔模型
7.3.3 向量空间模型
7.3.4 概率模型
7.3.5 统计语言模型
7.4 Web信息检索
7.4.1 搜索引擎概述
7.4.2 搜索引擎的实现技术
7.4.3 搜索引擎技术的发展趋势
7.5 藏文数字图书馆
第8章 藏文信息提取
8.1 信息提取概述
8.1.1 信息提取的概念
8.1.2 信息提取的历史和现状
8.1.3 信息提取任务
8.1.4 信息提取系统的评测
8.2 信息提取系统的结构
8.2.1 信息提取系统的构建方法
8.2.2 通用信息提取结构
8.2.3 Bare Bones结构
8.3 信息提取中的自然语言处理技术
8.4 信息提取技术
8.4.1 基于规则的信息提取技术
8.4.2 归纳学习法
8.4.3 隐马尔可夫模型
8.5 Web信息提取技术
8.6 藏文信息提取初探
8.6.1 藏文命名实体
8.6.2 藏文Web信息提取
第9章 文本分类
9.1 文本分类的概念
9.2 文本特征的选择
9.2.1 文本分类过程
9.2.2 预处理
9.2.3 文本特征的选择
9.3 文本分类方法
9.3.1 Rocchio方法
9.3.2 N-Gram方法
9.3.3 语义关系的贝叶斯方法
9.3.4 KNN方法
9.3.5 支持向量机方法
9.3.6 决策树方法
9.4 评估方法
第10章 机器翻译
10.1 概述
10.2 机器翻译的发展历史
10.3 机器翻译的基本过程
10.4 机器翻译的基本原理
10.4.1 基于规则的机器翻译方法
10.4.2 基于实例的机器翻译方法
10.4.3 统计机器翻译方法
10.5 机器翻译的评测
10.5.1 人工评测方法
10.5.2 自动评测方法
10.5.3 机器翻译评测项目
10.6 藏汉机器翻译初探
10.6.1 汉藏短语抽取
10.6.2 藏文句子边界识别
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...