首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 17 毫秒
1.
藏文拉丁转写是指不必理解藏语词、句语义的情况下,按照读音将藏文字符号影射为拉丁字母符号。用于表述藏文信息的方法.文章针对藏文文字和书写特点,借鉴国际藏学领域藏学专家通用的拉丁转写方法,以信息处理为研发目的,在Linux系统输入法机制下,定制藏文输入字符的选取原则、外码设计原则;基于rfinput输入法服务器确定藏文拉丁转写输入法实现模型、处理模块的分析设计及藏文特性处理等几个部分.[摘要]藏文拉丁转写是指不必理解藏语词、句语义的情况下,按照读音将藏文字符号影射为拉丁字母符号。用于表述藏文信息的方法.文章针对藏文文字和书写特点,借鉴国际藏学领域藏学专家通用的拉丁转写方法,以信息处理为研发目的,在Linux系统输入法机制下,定制藏文输入字符的选取原则、外码设计原则;基于rfinput输入法服务器确定藏文拉丁转写输入法实现模型、处理模块的分析设计及藏文特性处理等几个部分.  相似文献   

2.
由于计算机技术突飞猛进的发展,藏文拉丁转写标准的确立显得十分迫切,但是目前存在的藏文拉丁转写方案仍不完善,本文叙述了藏文的历史和特点,阐明了藏文拉丁转写的必要性与要求,分析了一些主流的藏文拉丁转写方案的特点.  相似文献   

3.
在藏文信息处理系统中,藏文拉丁转写是需要解决的重要课题。本文从藏文文本规范化、黏着语的分离与还原、基字的确定和藏文音节转写规则四个部分设计了藏文拉丁转写方案,最终实现藏文拉丁转写。该转写方案的设计在藏文信息处理领域具有非常重要的现实意义和应用价值。  相似文献   

4.
1997 年7 月,国际标准化组织ISO和国际电工委员会IEC表决通过了以中国提案为主的藏文编码字符集.此次发布的藏文编码标准是国际标准ISO/IEC10646《通用多八位编码字符集》的重要组成部分.本文回顾了该标准的研制过程,分析了藏文编码的技术性能指标,论述了它的合理性、科学性和完备性.并建议对藏文上下加变形显形式予以编码,在拼音文字辅助平面建立藏文编码字符集辅助集.  相似文献   

5.
首先介绍藏文音节独特的构造方法, 以及藏文字母的语音特性带来的藏文组合形式上的诸多限制。然后以藏文音节为研究对象, 借助藏文语法规则, 建立现代藏文音节的简化模型和相应的规则库,并介绍其应用领域。最后提出一种基于音节模型的的藏文音节自动拼写算法, 并通过实验验证规则方法的有效性。  相似文献   

6.
藏文分词词典是藏文自动分词系统的的重要组成部分.词典的数据结构与检索速度直接影响到自动分词系统的质量.文章对几种常见的汉语分词词典机制及其效率进行了分析,并根据藏文基本集编码字符串的结构特征,提出了一种逐音节二分的藏文分词词典机制.  相似文献   

7.
研究科学、合理的藏文输入方案,使输入法易学、易用、快速和规范是至关重要的.文章强调藏文不“编码”的编码输入表明一种思想:我们不能孤立地讨论编码.藏文拉丁字母转写是一种自然的编码方式,拉丁字母转写转换为藏文的输入不仅在易学、易记、快打、规范以及四者的统一方面有潜力可挖,而且对信息时代的语言规范性研究也有重要意义.  相似文献   

8.
基于藏文音节规则的识别后处理方法,总结了音节规则的约束条件 试验表明该方法在藏文文本识别后处理中具有较高的自适应性 在《印刷藏文(汉英混排)文档识别系统》的测试中,50万字的藏文测试样本,识别率在97.3%的基础上提高了0.3%,显示出该方法具有良好的效果  相似文献   

9.
藏文排序在字、词典排序,计算机中藏文的排序等方面有着广泛的应用,文章根据藏文编码国家标准(GB)的整字编码方案,研究藏文的排序问题。通过藏文结构的线性化处理,提出基于藏文编码国家标准的基字定位算法和排序算法,并将应用于藏文电子词典的排序中。  相似文献   

10.
基于藏文编码GB的藏文排序方法研究   总被引:3,自引:0,他引:3  
藏文排序在字、词典排序,计算机中藏文的排序等方面有着广泛的应用,文章根据藏文编码国家标准(GB)的整字编码方案,研究藏文的排序问题。通过藏文结构的线性化处理,提出基于藏文编码国家标准的基字定位算法和排序算法,并将应用于藏文电子词典的排序中。  相似文献   

11.
藏文编码字符集构件集   总被引:3,自引:1,他引:2  
本文论述了藏文信息结构和构件拆分的原理,采用统计方法,建立了藏文编码字符集构件集,用已编码的藏文字符表示未编码的藏文外字具体字型的结构和内容,说明厂构件集的选取与排序,论证了它的可行性,以期建立全藏文编码体系。  相似文献   

12.
分析了藏文字符的结构特征,系统阐述了“藏文编码字符集构件集点阵字型”的设计原则、编码技术,这对进一步研制开放性藏文系统提供了理论依据。  相似文献   

13.
文章描述藏文文本校对在国内外的发展现状,并借鉴国内外自动校对技术及算法研究的最新成果,提出基于词的藏文文本校对模型的研究方案。针对藏文文本的复杂特征和容易出现的错误状况,提出了统计与规则相结合的校对方案。  相似文献   

14.
文章就藏文字处理领域对藏文校对功能的实际需要,提出了基于音节的藏文文本校对方案对藏语音节规则的详细描述.采用统计方法对藏语音节的搭配规则等做了探索性的研究,创建了音节及音节搭配规则等多种知识库,以这些知识库为基础进行音节模式匹配查错.设计实现了音节规则模型与音节库模式匹配方法相结合的音节级查错.通过借鉴藏文传统语法理论、现代语言学理论、计算机技术和统计学理论等知识,介绍了藏文文本校对的设计思想,给出了藏文文本校对系统的组成原理、关键技术及可操作的实现方法.实验结果表明,基于音节的查错方案是可行的.为进一步研究开发藏文智能校对软件提供了所需的规则特征集和统计语料等基础性的研究资料.也为将来实现基于词、语法和语义层面的校对奠定了基础.  相似文献   

15.
藏文文本词校对模型研究   总被引:5,自引:0,他引:5  
  相似文献   

16.
随着数据信息的海量增长,人们迫切需要在海量的数据中精准获取有用信息,为了解决这个问题,问答系统应运而生.现今,英文问答系统及中文问答系统取得了显著成绩,但藏文问答系统却鲜有人问津.作为一个多民族的国家,伴随信息化的高速前行,藏文问答系统的研究势在必行.文章通过对现有藏文分词、信息检索等技术分析,借用中英文问答系统成熟的模式,结合藏语语法的特殊性质,对基于FAQ库的藏文问答系统的构建进行分析研究.  相似文献   

17.
藏文文本资源的收集对藏语信息处理研究有着至关重要的作用.文章在分析国内外藏文网页主要编码方式的基础上,提出了藏文网页的编码识别、自动获取与过滤,文本编码统一转换的算法.系统主要包括网页编码识别网页、自动获取、文本过滤、编码转换等几个模块.在windows平台下对系统的测试结果良好,为藏语电子文本的收集和整理提供了方便、快捷的平台.  相似文献   

18.
藏文分词是藏文自然语言处理的基础。根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计实现了一个基于藏语虚词切分的正向最大匹配的藏文分词系统,该系统对原始文本进行逐次扫描处理得到分词结果。实验表明,文章提出的藏文分词系统具有较高的切分精度和切分速度。  相似文献   

19.
针对藏文图像文本识别在Android系统上的应用问题,提出了一种基于混合注意力机制神经网络模型(CBAM-LeNet-5)的藏文图像文本识别方法,并采用Android平台研发了APP,实现印刷体藏文文本图像预处理、字丁分割以及识别等功能.经实验,改进后的网络模型比传统的LeNet-5模型识别率提高了2.36个百分点,表...  相似文献   

20.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号