共查询到20条相似文献,搜索用时 78 毫秒
1.
《西北民族学院学报》2015,(1):32-36
在藏文信息处理中,实现藏文字符排序的关键在于准确地判断藏文音节,而藏文音节判定的关键是对音节构件的识别.文章在借鉴藏文传统语法理论的基础上,结合现代语言学、计算机理论和统计学等知识,介绍了藏文音节的组合形式与特征,规则等问题,以藏文国际标准编码体系为依据,根据音节组件的约束关系,分析了藏文音节七元组的组合规则与类型,有利于藏文音节字符构件的研究和七元组类型的分析、识别与处理. 相似文献
2.
首先介绍藏文音节独特的构造方法, 以及藏文字母的语音特性带来的藏文组合形式上的诸多限制。然后以藏文音节为研究对象, 借助藏文语法规则, 建立现代藏文音节的简化模型和相应的规则库,并介绍其应用领域。最后提出一种基于音节模型的的藏文音节自动拼写算法, 并通过实验验证规则方法的有效性。 相似文献
3.
文章描述藏文文本校对在国内外的发展现状,并借鉴国内外自动校对技术及算法研究的最新成果,提出基于词的藏文文本校对模型的研究方案。针对藏文文本的复杂特征和容易出现的错误状况,提出了统计与规则相结合的校对方案。 相似文献
4.
在藏文文本理解中虚词发挥着重要的句法、语义桥接作用,其规则的有效性在藏文分词处理中扮演着特殊的角色。由于虚词本身及其角色的丰富性,在一定意义上可以说藏文分词处理是虚词识别的过程。因此,虚词识别的正确与否直接影响着藏文文本分词处理的效果。文章依据藏语自身的语法规律和虚词功能的特殊性,首先构建了虚词知识库、虚词兼类库,以及其作为藏文连续文本中识别虚词的依据;其次,研制了标有词汇属性的分词词表和一定规模的训练语料库资源,以基于条件随机域(CRF)的方法进行词性标注,并结合虚词和词性赋码的资源制作了藏文自动分词赋码一体化处理的模型。 相似文献
5.
6.
本论述采用藏语三级切分体系对藏文文本进行分词和词性标注,并借助手工建立的藏文情感分析用词表,与已有的特征选择方法相结合提取情感特征,用相似度分类算法进行藏文文本的情感分类,达到了较好的分类效果. 相似文献
7.
以藏文音节拼写检查、梵音转写藏文检查、接续关系检查、词语检查为研究内容, 提出藏文文本自动校对框架和接续关系检查算法。根据该框架及算法, 设计并实现藏文自动校对系统。通过实验证明算法和系统的可靠性和有效性。 相似文献
8.
藏文文本自动校对系统开发研究 总被引:2,自引:0,他引:2
文本自动校对在自然语言处理领域中有着广阔的应用前景.文章通过比较分析国内外文本自动校对系统的发展现状,提出了设计现代藏文文本自动校对系统的两种方案,并就第二种方案研究了现代藏文文本自动校对系统的结构和功能设计. 相似文献
9.
计算机藏文编码性能指标分析 总被引:1,自引:1,他引:1
于洪志 《西北民族学院学报》1997,18(2):15-20
从规范性、兼容性、一致性、完备性四个方面分析了计算机藏文国家标准编码性能指标,论述了建立藏文编码体系的必要性和可行性 相似文献
10.
11.
12.
何清强 《广西民族大学学报》2009,(4)
外国留学生在动宾式离合词习得的偏误中,A类偏误跟B类偏误有显著性差别。中介语和实验都表明,总偏误率随着学习阶段的上升而降低,且各阶段偏误率差异显著,但A类偏误率没有随着总偏误率降低而降低;A类偏误率显著高于B类偏误率。AB两类偏误率的这种对比关系跟学习阶段、母语背景均不相关,尽管总偏误率各阶段差异显著。因此,在习得难度上,无论对哪个阶段哪种母语背景的留学生来说,A类扩展成分的习得要难于B类扩展成分的习得,教学的重点也就应该放在A类扩展成分的使用上。 相似文献
13.
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注. 相似文献
14.
定义了正态总体方差检验的OC函数,探讨了其性质,并给出了一种控制两类错误下最小样本容量确定的方法.且可应用于实际工作中. 相似文献
15.
文章将民间故事的类型解析与文化解读结合起来,一方面运用故事类型研究和机智人物故事研究的理论与方法,分析了藏族机智人物故事的亚型及其情节结构。其中巧解难题、斗阎王、公鸡蛋等多数亚型与汉族及其他民族重叠交融,另有戏谑喇嘛等亚型体现了藏族口头文化的特征。其次,文章还对藏族机智人物故事的民俗文化进行了解读,指出藏族的饮食习俗等日常生活文化是机智人物故事产生、形成的温床,而宗教信仰等历史文化观念则深深地渗入其间,使藏族机智人物故事呈现出鲜明的藏民族特色。 相似文献
16.
17.
基于情境的文本中的时间信息分析 总被引:3,自引:2,他引:3
情境用来描述文本中具体的动态和静态事件,时间是其重要因素·为了分析文本中的时间信息,本文首先给出了一个基于情境的文本理解的模型,并在时态逻辑的基础上,提出了文本的时间信息分析方法,它是将事物发展变化的时间顺序作为理解文本的一条重要线索·其主要工作包括:讨论了时间的概念、时间的类型和时间单位的转换机制;分析了命题间的时间关系、对象行为间的时间关系以及事件状态与时间过程的关系;并给出了所使用的时态逻辑 相似文献
18.
19.
模糊性是语言的自然属性。手机短信作为人类语言的一部分,其语言亦和自然语言一样具有模糊性。中文手机短信中语言模糊性表现最为突出的娱乐搞笑和祝福传情类短信,在语音、语言表达、语言结构及修辞上的模糊,在短信中具有丰富的语用价值与功能。 相似文献
20.
GIS中多层多边形叠置的误差分析 总被引:1,自引:0,他引:1
汤国安 《西北大学学报(自然科学版)》1995,(5)
多边形叠置法是GIS技术近年来研究的热点,它的成熟与完善将有效推动多要素地学分析实现系统化与自动化。多边形叠置法所产生误差的研究对目前各种技术方法所产生误差的机理进行了分析,并对如果控制误差发生及减少误差数量的原理与方法作了系统研究. 相似文献