首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 593 毫秒
1.
藏语自然语言处理研究藏语词法分析、句法分析、语义分析及语用分析,对藏语机器理解以及机器翻译提供理论基础.在构成藏语句子的各类成分中,语动词占有非常重要的地位,对藏语句法分析起决定性作用.文章对藏语动词从所含音节个数和语法特征两方面进行了分类,给出了藏语动词分布统计模型和统计算法,在含101669条词的藏语语料中分类统计了藏语动词分布,描述了藏语动词的分布特征.  相似文献   

2.
文章将藏语的动词在传统分法基础上细分为使动动词、自主动词、不自主动词、自动动词、判断动词、存在动词、情态助动词等7类,并对藏语中具有黏着性和屈折性变化的动词进行举例说明和分析,在藏文信息处理过程中切分动词提供依据.  相似文献   

3.
藏语句子边界识别是一项重要的基础性工作,它的准确率直接影响藏语句法分析、汉藏(或藏汉)平行语料库和藏汉(或汉藏)机器翻译等的研究工作。文章通过分析藏文文法知识,提出了一种比较简单而实用的词性规则法,其主要思想是:单垂符或双垂符的前后词性来判断句子是否结束。经测试,文章提出的藏语句子边界识别方法在文学类、诗歌类、医学类和新闻类等536句藏语语料中句子边界的识别准确率达到96.37%。  相似文献   

4.
文章将藏语的动词在传统分法基础上细分为使动动词、自主动词、不自主动词、自动动词、判断动词、存在动词、情态助动词等7类,并对藏语中具有黏着性和屈折性变化的动词进行举例说明和分析,在藏文信息处理过程中切分动词提供依据。  相似文献   

5.
语料中抽取句子是藏语自然语言处理领域中一项关键技术,在句型研究、句法分析、语义分析、语用分析、问答系统和机器翻译等很多领域都有广泛的应用前景.文章在分析藏语句尾词性和虚词特征的基础上,提出了一种基于虚词和句尾词特征的藏语句子抽取方法,即从文本串的单垂符或双垂符开始,通过逆向搜索虚词的位置节点和句尾词性抽取藏语句子.实验表明,该方法抽取藏语句子的准确率可达98.9%以上,抽取句子的数量明显提高.  相似文献   

6.
《藏语拉萨口语语法》(专著 )作者王志敬 (校藏文系副教授 )。少数民族语言学家马学良先生认为 ,“王志敬同志新编的《藏语拉萨口语语法》是一部有藏语特点语法书。对双语教学、研究、翻译都是必不可少的好书。”这是第一次运用现代语言学理论写成的语法书。全书分为二十六章 :诸论 ;语素和词 ;词的构造 ;复合词 ;句子 ;词类 ;体词 ;动词 ;三个特殊动词 ;动名词与形动词 ;形容词 ;主谓结构 ;偏正结构 ;述宾结构 ;述补结构 ;联合结构 ;连谓结构 ;副词 ;代词 ;介词 ;语气词和叹词 ;复句 ;引语 ;名化结构 ;藏语中的歧义 ;藏语形态。 488千字 ,…  相似文献   

7.
岳强 《科技信息》2013,(2):251-252
形动词和副动词的相对时间并不完全是一种形态时间,而是一种形态—句法时间,这种形态—句法时间只能在句子中表现出来。而句子在我们的日常交际中起着重要的作用,且对于中国学生来说会有一定的难度,所以研究形动词和副动词的时间意义能够帮助我们清晰地理解形动词、副动词短语的意义以及了解俄汉语之间的某些区别和联系。  相似文献   

8.
文章以藏文传统文法理论为依据,以具有黏着性和屈折性变化的动词特征作为研究对象,分析和说明了藏语动词的各个式和时态下其形态的变化情况,并从中总结了拟测式、判断式、否定式、命令式、推断式等5种式和3个时态的分类.这对藏语动词属性库的建立和分类精细化方面提供了新的视角,并且为词性标注、自动分词、机器翻译、自然语言理解等藏文信息处理领域的各项研究工作打下了基础.  相似文献   

9.
论藏语主语     
一、藏语主语的形式特征藏语主语的形式特征表现在位置结构及格标记两个方面。1.1位置结构从单纯的结构出发,我们将藏语土语定义为位于句首、后接动词性结构同为句子直接成分的名词性结构。如(1)中的五(谁)和(2)中的自1(眼):1.2格标记藏语具有形式标记的词所占比例高达46%,由此衍生出句法结构的显明的形式特征。名词所附加的格标记始终是藏语主语研究的最重要的形式依据,而格标记的异同却源于动词。因此藏语主语的研判必须把格标记与动词结合起来。1.2.l格标记9。”(含变体。)以和。为格标记的主语,与之照应的调语大多…  相似文献   

10.
基于统计的语料库语言学已经成为语言信息处理研究的主要方法 .文章就1 341个藏文的单音节动词,从形态、句法和语义等层面归纳为17类属性,在此基础上,统计动词各类形态结构的数据,描述了每个动词的特征信息,分析藏语动词在句法和语义结构之间的对应关系,构建了一个以形态和句法特征为主、兼顾语义信息的藏语动词知识库,为进一步搭建藏语动词框架语义库和创建藏语句法树库奠定了基础.  相似文献   

11.
基于藏文La格(??????)例句的自动分类在藏语自然语言处理领域的重要性,根据藏文La格的用法和添接规则,在对藏文La格例句进行分类并定义分类概念的基础上,提出一种融合双通道音节特征的藏文La格例句自动分类模型.该模型首先使用word2vec和Glove构建双通道藏文音节嵌入,分别在每路卷积中融合双通道音节特征,丰富...  相似文献   

12.
许多自然语言句子具有QAB的形式,这里Q是量化短语;A是普通名词短语;B是动词短语。自然语言语句表达量化的方式是多种多样的,这样在形式逻辑中对量化式的刻画也是方法各异。许多英语限定词在经典一阶逻辑里能够得到刻画,尽管要使用有点复杂的累赘的说法。但是也有许多限定词不能在经典一阶逻辑中表达出来。我们可以增加新的量词符号,比如说most来丰富经典一阶逻辑的表达能力。  相似文献   

13.
统计与规则相结合的藏文句子自动断句方法   总被引:1,自引:0,他引:1  
 藏文句子断句是藏文信息处理领域的难点之一,也是藏汉机器翻译、藏文文本分类等工作的一项重要基础性研究.提出了一种统计与规则相结合的藏文句子自动断句方法以解决藏文标点符号功能的歧义问题,实验结果表明该方法具有比较好的效果,F1值达到98%以上.在规则中首先使用经验的方法,识别出不确定的藏文句子作为候选句子,然后采用基于关联词的复句分析方法进行分句合并形成二次候选句子;最后使用最大熵的方法对二次候选句子进行断句.经验方法和复句分析有效解决了最大熵算法无法触及的语料稀疏和分句问题.  相似文献   

14.
在藏文文本理解中虚词发挥着重要的句法、语义桥接作用,其规则的有效性在藏文分词处理中扮演着特殊的角色。由于虚词本身及其角色的丰富性,在一定意义上可以说藏文分词处理是虚词识别的过程。因此,虚词识别的正确与否直接影响着藏文文本分词处理的效果。文章依据藏语自身的语法规律和虚词功能的特殊性,首先构建了虚词知识库、虚词兼类库,以及其作为藏文连续文本中识别虚词的依据;其次,研制了标有词汇属性的分词词表和一定规模的训练语料库资源,以基于条件随机域(CRF)的方法进行词性标注,并结合虚词和词性赋码的资源制作了藏文自动分词赋码一体化处理的模型。  相似文献   

15.
压缩技术旨在模拟人类的文本概括和信息提取能力。句子压缩技术是自动生成能够保留原句核心内容的,合乎语法的,语义连贯的简短句子。文章分析了英文句子压缩技术中基于句法分析的Hedge Trimmer压缩技术,讨论了相关压缩理论,探索其压缩过程并用类C语言进行算法实现。提出了好的压缩句应该至少满足以下3个标准:第一是保留原句的核心内容,第二是具有正确的语法,第三是压缩长度合理。在算法的评估工作中,从DUC 2003语料库中选取了624个原始句子和对应的人工压缩句,与Hedge Trimmer压缩算法自动生成的压缩句进行对照分析。发现5种压缩效果不理想的情况,分析其原因并提出了改进策略。最后,通过实例对改进算法生成的压缩句和原来算法生成的压缩句进行对比评估,证明了改良算法能够获得更理想的压缩句。在英文句子压缩领域,改良的Hedge Trimmer句子压缩算法值得推广和应用。  相似文献   

16.
为了建立一个面向中文信息处理的现代汉语复句深加工语料库,我们必须进行短语字段的自动识别工作.目的是把这些字段排除在分句层次分析的范围之外.这项工作建立在自动分词和词性标注的基础上,首先通过编写的程序把所有不含动词的字段暂时统一识别为短语字段.对于虽包含动词但前后有明显形式标志的字段则通过制定相应的规则来识别.还有一部分字段只包含一个动词,但前后却没有明显的形式标志,对此,需要利用字段中的结构助词"的"来帮助识别.  相似文献   

17.
隐喻是自然语言中比较常见的语言现象,在情感计算过程中有些句子的情感是由隐喻引起的,因此隐喻问题的解决将影响情感计算的结果.为此结合相关的隐喻理论,从机器学习的角度,对汉语文本中的显性隐喻的识别进行研究.以本体和喻体所属的范畴不同作为切入点,首先利用词性标注和依存句法分析提取句子中的本体词汇和喻体词汇,然后进行范畴划分和词汇语义相似度计算,最后使用支持向量机进行学习,从而对特定的隐喻句子进行识别.这一研究对后续的隐喻自动识别和隐喻理解起到了一定的作用.  相似文献   

18.
判断句是古代汉语的一种句式,确定一个句子是否是判断句,要根据古代汉语判断句的结构特征和本质特征,古代汉语的名词谓语句并不都是判断句。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号