首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 255 毫秒
1.
在跨语言文本分析任务中,多词短语比单个词汇歧义小,语义表达更加准确,有助于提高文本理解的准确性。现有方法主要关注单个词的跨语言对齐。将多词短语抽取和跨语言对齐相融合,提出了一种基于多策略过滤的汉日多词短语抽取和对齐的方法。首先从一个语种出发,通过重复串、左右邻接熵、内部关联度、多词嵌套、停用词等方法提取并过滤得到具备完整语义的多词短语,然后利用平行语料库计算汉日多词短语的相似度,实现跨语言对齐。在整个过程中可结合日语语言规则与特点,根据语料规模、相关领域对过滤阈值进行动态调整,提高了多词短语的领域适用性。实验结果表明,该方法可有效抽取汉日多词短语并进行准确对齐,以多词短语为对齐单元,语义表达更完整,实用价值更大。  相似文献   

2.
针对维吾尔语词与语素和短语区别中存在的问题,对维语语素进行了重新划分,并对词与语素、词与短语进行了较为精准的区分,可为今后的维吾尔语研究提供借鉴。  相似文献   

3.
《花间集》是我国文学史上第一部文人词总集,共收录了晚唐五代18位词人的500首词作。《花间集》中有大量的描写妇女身体发肤、容貌情态的词语,姑且名之为体貌词。就形式来说,《花间集》体貌词包括词、短语两类。依据短语层次的不同,体貌短语可以分为简单短语和复杂短语两种类型,又可以从结构类型、文学修辞等角度进行研究分析。  相似文献   

4.
各语言单位之间的中间状态是一种普遍、客观的存在,如词与短语之间的“短语词”即是.同样,在语素与词之间也有“语素词”,它在当代汉语某些类型的新词语中普遍存在,主要特征是有词的形式但却不能独立使用来表达一个新的意义.当代汉语语素词的新义有三个来源,即外语中引进、一般性引申和修辞性引申.建立语素词的概念,不仅有助于进一步了解和认识当代汉语新词语,加深与拓展对词汇产生和词义发展的认识,同时也可以纠正已有的一些不正确、不全面认识,以及某些工具书的不当立条与释义等.语素词与词义的增加和新词的产生关系密切,它的进一步发展就是产生新词新义.  相似文献   

5.
“离合词”是汉语中介于词与短语之间一种特殊的语法现象。从语法性质来说,它属于词;它最早出现于宋代,类化作用、认知方式、语体色彩、经济原则等都与离合词的产生和形成有密切联系。  相似文献   

6.
汉语词语分界的难点之一就是双音节中补型词语。从某个角度看,人们习惯于把此类短语划归在词的界限内,使这种分界具有不平衡性。事实上,从语音形式、意义内容、结构关系和功能特点上看,中补型复合词在总量上是比较少的,不仅当然少于此类短语,也少于主谓型、动宾型、偏正型和联合型复合词。  相似文献   

7.
短语动词的语义具有不可分析性,但从认知语言学的角度分析,短语动词中小品词的基本义和引申义是可以通过意象图式和概念隐喻推断出来。OVER在短语动词中的四个基本义通过意象图式理论构建了出来,OVER在短语动词中的引申义运用概念隐喻理论进行了详细的解读。  相似文献   

8.
以转换生成语法框架下的X-阶标理论为理论基础,对实义词短语即名词短语、动词短语、形容词短语、副词短语、介词短语的内部结构特征作了详细分析,并结合实例论证了实义词短语的中间语类X'在消解歧义结构和解释某些语言现象方面的实用价值,从而为语言的结构分析开辟了新的视角和蹊径。  相似文献   

9.
文章在学术界提出的英语短语动词表义规律性的基础上,进一步探索了有相同小品词的短语动词在组合及句法上的规则性,并论述了规则性的存在对短语动词教学改革的意义,即短语动词教学应该走以小品词为中心的处理道路。  相似文献   

10.
基于概率频度的普通话韵律结构预测统计模型   总被引:1,自引:0,他引:1  
为进一步提高文语转换系统中韵律结构预测的准确度,提出了一个基于概率频度的统计模型的方法,预测韵律词和韵律短语边界两级韵律结构。该方法提取与韵律词和韵律短语边界有关的语言学特征(词性、语法词、长度和位置等),并进行样本训练计算各个特征的概率频度值,最终分别建立韵律词和韵律短语的统计模型。实验结果表明:统计模型的方法对于韵律词和韵律短语边界预测的正确率分别可达90.6%和84.6%,并与决策树算法和T ransform ation-based learn ing(TBL)转换规则学习算法比较,提高10%以上的正确率。  相似文献   

11.
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题, 在基于短语的统计机器翻译系统中, 通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作, 生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上, 与基线系统相比, 该方法在多个测试集上明显提高了翻译系统的翻译质量, 在部分测试集上BLEU 值可提高1%左右。  相似文献   

12.
经过对科技论文题名中多余词语的归类分析,常见的多余词语大体可分为谦虚性、夸张性、无意义性和重复性四种类型。对科技论文题名中多余词语的修改,可根据不同情况分别采用删除法、改写法和删增法等。  相似文献   

13.
本文报道了旱地沙蜥Phrynocephalus Helioscopus(pallas)的核型,2n=(2V+201)+24m,NF=48,由11对大染色体和12对小染色体组成,第一对大染色体为亚中央着丝粒染色体,其余均为端部着丝粒染色体。Ag—NORs显带显示NORs位于第二对大染色体远离着丝粒的一端。本文还观察分析了精巢的减数分裂。  相似文献   

14.
词汇是语言中的基本要素,对社会的变化最为敏感。新词就是一个最近创造的词或词组,或者一个附加了新的义项的现有的词或词组。英语当中的新词产生有三种主要的方式:外来语的借用、旧词新用、创造新词。创造新词是通过传统的构词法构成新的词汇,这是英语新词的主要来源,其方法主要有词缀法、合成法、拼缀法、缩略法和类推法几种。  相似文献   

15.
词汇是语言中的基本要素,对社会的变化最为敏感。新词就是一个最近创造的词或词组,或者一个附加了新的义项的现有的词或词组。英语当中的新词产生有三种主要的方式:外来语的借用、旧词新用、创造新词。创造新词是通过传统的构词法构成新的词汇,这是英语新词的主要来源,其方法主要有词缀法、合成法、拼缀法、缩略法和类推法几种。  相似文献   

16.
探讨性地分析了现代英美俚语中缩写词、缩略词和简化词的构词规律。缩写词是由一个短语中每个单词的首字母组成,缩略词是指由某个单词的前几个字母、中间几个字母或首尾字母组成的词,简化词指的是那些取字母的形状,字母在字母表中的位置及发音特点而形成的简化字。这些规律表明了英语将在词、句子和语法方面不断简化的发展趋势。  相似文献   

17.
“(别V)了“在预设“受话人正在V“、“受话人正要V“两种语境中运用,发话人要求受话人发生以“不V“为终点的变化。“别(V了)“在预设“没V,但可能V“的语境中运用,发话人提醒受话人避免以“V“为终点的变化。  相似文献   

18.
喜树染色体制作与核型分析   总被引:3,自引:0,他引:3  
本文采用喜树顶芽及新生愈伤组织为试验材料,进行染色体制作方法的研究 并就喜树染色体核型进行了分析,其结果显示:喜树体细胞染色体为2n=44,其中正中部着丝点染色体(M)为1对,中部着丝点染色体(m)为16对,近中部着丝点染色体(sm)为1对,端部着丝点(T)为4对,其核型公式为K(2n)=44=2M+32m+2sm+8T,核型属于"2B"型  相似文献   

19.
借助于Copula这一工具对在具有联合分布H(x,y)的二维总体(X,Y)经概率积分变换得到的随机变量H(X,Y)的分布函数K(V)给定条件下,求出关于次序统计量X(n)=max{X1,X2,…,Xn}和Y(n)=max{Y1,Y2,…,Yn}经概率积分变换得到的随机变量Hn(X(n),Y(n))的分布函数Kn(v)的方法进行了研究,并找出了Kn(v)不随样本容量n变化的情形,进而得到了较准确地刻画二维R.V相依性的相关性指标Kendall's τ.  相似文献   

20.
淡肩角蟾的核型分析   总被引:1,自引:0,他引:1  
本文应用骨髓细胞直接制备染色体标本的方法研究了武夷山产淡肩角蟾(Megophrys boetteri)的核型。结果表明,淡肩角蟾的染色体数目2n=26,由6对大型的和7对小型的染色体组成,其中有8对(第1、2、4、5、6、8、10、12对)中部着丝粒染色体,4对(第3、7、9、11对)亚中部着丝粒染色体和1对(第13对)端部着丝粒染色体。第6对染色体的长臂上有时可见到次缢痕。从核型特征上看,淡肩角蟾确是无尾两栖类中较原始的种类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号