首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
HENU汉语自动分词系统中歧义字段消除算法   总被引:2,自引:0,他引:2  
先用基于词典的最大匹配法匹配出最长词和次长词,再用检测跨越的方法发现切分歧义,判断出切分歧义是交集型切分歧义还是组合型切分歧义,根据切分歧义类型的不同分别进行切分歧义的消除.交集型切分歧义的消除方法主要是混合使用基于规则的方法和基于统计的方法,组合型歧义的消除方法主要是使用基于规则的方法,找到正确的切分位置.  相似文献   

2.
歧义,指不同的深层结构向表层结构转换、投影中的机遇同一。是相同的语言形式表达了不同的语义内容。句法歧义是一种组合歧义。本文从大量的语言事实出发,着眼于句法歧义中层次切分、语法结构关系和深层语义联系之间的多样关系,初步归纳其类型格式,分析构成条件,寻求分化手段,以期得出一些规律性东西。  相似文献   

3.
英语中的"双关"与"歧义"   总被引:2,自引:0,他引:2  
在英语中,双关与歧义都是具有一种语言形式表达两种或两种以上不同意义的特点,因而常被混淆。本文试从Hill教授的“双关”三要素的角度来揭示“双关”与“歧义”的各自特征和辨别方法,旨在提高我们正确地运用和辨析双关辞格的能力,避免产生歧义。  相似文献   

4.
语言是一种约定俗成的社会现象,而木是人们根据科学的规律创造出来。因此语句和语义之间没有必然的联系,往往不同的词句可以表达同一的思想,而同一的词句也可以表达木同的意思。后者便是语言中的歧义现象。歧义现象属于语义学(Semantics)研究的范畴。所谓歧义指的是有好几种可能的语言选入(Semanticrenng)(赵世开)。或歧义就是一个单词,一个短语或一个句子包含两个或更多的不同意义(Traugott&Tatt)。引起歧义的因素很多,造成词汇歧义的原因在于词语的同音同形异义词(nomonymx)和一词多义(polysemy),而结构歧义一般起因…  相似文献   

5.
在分词过程中如何处理歧义切分是中文分词算法要解决的难点之一.文中提出了一种改进的基于词典和基于统计的组合中文分词算法,能够发现并处理交集型歧义,该算法在发现歧义的过程中没有采取传统的双向匹配法而是采用双栈的结构,减少了匹配花费时间,并分别采取长词优先和最大概率方法处理一般的交集型歧义和特殊的同词长交集型歧义.最后通过实例对文中所提出的算法进行实验验证,结果表明该算法比传统的分词算法有更好的准确率.  相似文献   

6.
英语定语从句是一种特殊的定语结构,它既不同于英语中其它形式的定语,汉语中也没有任何一种语结构形式与之完全相当。传统语法认为定语从句是修饰、限定主句某一单位或全部的后置定语,它分为限制性和非限制性两类。一般的翻译理论正是按照此种单纯注重表层结构形式的分析。对此出发语与归宿语的异同,再归纳罗列一些译法。近年来国内一些学者认为,这  相似文献   

7.
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.  相似文献   

8.
不论哪种语言都存在大量的歧义现象,英语也不例外。研究歧义现象不仅对语言的理解、写作、翻译等有着实际的意义,对语言学理论的发展也起着重要作用。近几十年来国外在语法理论研究上的新进展也有不少是从歧义现象入手取得一些突破的。语言是一种约定俗成的社会现象,而不是人们主观创造出来的,因此语句和语义之间没有一种必然的一一对应关系。往往不同的词句可以表达同一思想,而同一词句却可以表达不同的意思。造成这种歧义的原因是多方面的,但最主要的是词汇歧义和语法歧义。造成词汇歧义的  相似文献   

9.
形容词作定语时修饰主语或宾语,在句法上与其中心语构成直接成分;形容词作状语时修饰谓语,在句法上与谓语构成直接成分。但在语义平面上,定语形容词的语义不仅指向其中心语,还指向句内的其它成分或句外成分;状语形容词的语义不仅指向谓语,还指向句子中的主语、宾语等体词性成分,形成了一种句法与语义相悖的结构。作定语和状语的同一形容词虽语义指向相同,但所表达的主观意义不同,修饰语形容词语义指向的不同是人类认知模式的反映。  相似文献   

10.
形容词作定语时修饰主语或宾语,在句法上与其中心语构成直接成分;形容词作状语时修饰谓语,在句法上与谓语构成直接成分。但在语义平面上,定语形容词的语义不仅指向其中心语,还指向句内的其它成分或句外成分;状语形容词的语义不仅指向谓语,还指向句子中的主语、宾语等体词性成分,形成了一种句法与语义相悖的结构。作定语和状语的同一形容词虽语义指向相同,但所表达的主观意义不同,修饰语形容词语义指向的不同是人类认知模式的反映。  相似文献   

11.
汉语分词中一种逐词匹配算法的研究   总被引:1,自引:0,他引:1  
提出了一种改进的运词匹配算法.该算法通过对非歧义字段切分,对人名地名进行判别,以及对伪歧义字段进行处理,使交集型歧义字段切分正确率有了大幅度提高.在5万汉字语料开放测试中,交集型歧义字鼹切分正确率可达98%以上.  相似文献   

12.
通过对歧义定义的历史反思,认为应该将歧义与多义、修辞中的故意“设歧”、误解、曲解相区分;明确歧义的发生环境是语境;主体是说写者,是其无意所致;产生的物质材料是多义语言形式;滋生机制是语境对物质材料多义性的不能消解。歧义是在具体语境中,说写者用不违反语法规则和逻辑规则的形式(包括多义词、多义短语、多义句子)无意中表达出两种或两种以上意思的现象。  相似文献   

13.
田君 《长春大学学报》2003,13(3):98-100,104
实义切分是对连贯性话语进行超句分析的一种基本方法。它的表达手段除了词序和语调外,还有标点符号。本文就“冒号可作为实义切分补充表达手段”这一问题进行尝试性的研究,力求进一步完善实义切分理论。  相似文献   

14.
张雯 《科技信息》2013,(2):221-221
许多人在运用英语时,不论是在口语还是在书写中,会大量涌现歧义句。英语歧义句是指句子本身含有两个或两个以上的意思。为了避免歧义现象的发生,添加上下文、句法结构等策略常被运用在句子中。此外,歧义还经常作为一种交际技巧在语言表达中发挥作用,如表达言外之意、幽默等。在交际中经常会遇见许多歧义性的句子,使人们直接造成误解或误会。所以在语言交际过程中应注意避免和消除歧义,巧妙运用歧义发挥其作用,从而提高运用英语的能力。  相似文献   

15.
在科技英语中,以which及“介词+which”引导的定语从句从表达的形式来看,有多种类型:有的从句和所修饰的词之间没有逗号分开,有的有逗号分开;关系代词which在从句中可作主语、宾语(动词或介词的宾语),有时还可作表语;有的定语从句和所修饰的词之间还可以被另一作定语的介词短语或动词谓语及其他成分隔开的;which前的介词可以是简单介词,也可以是短语介词,还可以是“名词(或代词)+of+which ”引导的;等  相似文献   

16.
在现代英语教学中,经常会见到一种形式具有可解释的几种意义。每种释义都必须具备一定的语境,否则就会产生歧义。造成这种歧义的因素不仅仅是词汇,语法结构也会造成歧义。现代语言学家一直很注意语法内部的结构关系问题。他们认为一切语言在表达思想的平面上基本相同,不同之处在于表示实际言语行为的表层结构。因为语句的表层意思是由语法内部结构决定的,如果表层结构中某一成分可作不同的分析,被揭示的深层结构则会产生不同的释义。因此,完整的语法规则应该阐明深层结构概念和表层结构形式之间互为因果的辩证关系。如:  相似文献   

17.
歧义是在基于词典的分词方法中常见的问题,以往的基于词典的分词方法往往使用双向最大匹配法获得分词结果后,通过使用上下文信息来进行歧义消解,但是对于没有上下文信息的单独语料无法进行歧义消解。本文提出一种通用的基于词频的歧义消解法,该方法是与上下文无关的,能够消解没有上下文信息的语料切分后产生的歧义,扩大了歧义消解的应用范围,简化了歧义消解的处理过程。实验表明:文本方法与传统基于词典的分词算法相比,具有更强的适用性及更高的可用性。  相似文献   

18.
一种基于SVM和规则消除组合型歧义的算法   总被引:2,自引:0,他引:2  
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.  相似文献   

19.
中文分词中歧义切分处理策略   总被引:1,自引:0,他引:1  
文章试图从歧义字段本身的特点,即从伪歧义与真歧义这两个角度,以规则库为辅助手段,构建相应概率统计模型来解决歧义字段切分的问题.概率模型中特征的选取考虑了相邻词语和相邻词语的语义信息.实验表明该模型在解决歧义切分问题上是有效的.  相似文献   

20.
基于最大熵模型的交集型切分歧义消解   总被引:6,自引:0,他引:6  
利用最大熵模型研究中文自动分词中交集型切分歧义的消解.模型输出的类别为两种:前两个字结合成词和后两个字结合成词.模型采用的特征为:待切分歧义字段的上下文各一个词、待切分歧义字段和歧义字段两种切分可能的词概率大小关系.通过正向最大匹配(FMM)和逆向最大匹配(BMM)相结合的分词方法,发现训练文本中的交集型歧义字段并进行标注,用于最大熵模型的训练.实验用1998年1月<人民日报>中出现的交集型歧义字段进行训练和测试,封闭测试正确率98.64%,开放测试正确率95.01%,后者比常用的词概率法提高了3.76%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号