首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
该文使用事件相关电位(event-related potentials,ERPs)以词汇判断的实验范式探讨了维吾尔语形态复杂词加工的认知神经机制。实验刺激材料设计了4个因素,分别为单语素词(没有带任何词缀)、单语素假词(真词中替换2个音构成)、屈折词(单语素名词后加格附加成分构成)、屈折假词(假词干真词缀的词)。实验材料的长度严格控制在平均词长为6个字母。脑电实验数据显示,屈折词和屈折假词在350~550ms时间窗口出现比较明显的N400效应。其中屈折假词的N400效应是被试加工假词时词汇搜索失败的标志,但屈折词的N400效应则反映了词汇通达时词干和词缀之间的交互作用。另外还发现单语素词、屈折词和屈折假词这三者的认知神经基础也不同。在大脑右半球屈折词引发的负波平均振幅比左半球要大。结果表明:母语为维吾尔语者的被试在加工维吾尔语屈折词时按其语素分解加工,但是加工维吾尔语单语素词时是整体加工及存储的。  相似文献   

2.
为了解决基于词语的维吾尔语语音识别系统集外词过多的问题,采用形态分析生成的语素或数据驱动切分生成的统计子词代替词语作为识别系统的词典单元。在此基础上,提出一种根据语素识别系统和统计子词识别系统在声学模型训练数据上的音素错误率差别选择词语最佳分解结果,从而构建语素-统计子词联合词典的方法。在维吾尔语电话交谈式语音识别任务上比较各个系统的性能。实验结果表明,语素或统计子词的运用能有效缓解词语系统集外词过多的问题。与词典大小为200K的词语系统相比,55K的语素-统计子词联合系统使测试集上的音素错误率从45.4%下降到43.8%。  相似文献   

3.
各语言单位之间的中间状态是一种普遍、客观的存在,如词与短语之间的“短语词”即是.同样,在语素与词之间也有“语素词”,它在当代汉语某些类型的新词语中普遍存在,主要特征是有词的形式但却不能独立使用来表达一个新的意义.当代汉语语素词的新义有三个来源,即外语中引进、一般性引申和修辞性引申.建立语素词的概念,不仅有助于进一步了解和认识当代汉语新词语,加深与拓展对词汇产生和词义发展的认识,同时也可以纠正已有的一些不正确、不全面认识,以及某些工具书的不当立条与释义等.语素词与词义的增加和新词的产生关系密切,它的进一步发展就是产生新词新义.  相似文献   

4.
方位名词可以放在别的词或短语的前边作定语,组成偏正短语;方位名词也可以作为语素放在别的语素前边,构成偏正式合成词,这是方位名词的语法特征之一。  相似文献   

5.
就近年维吾尔语的研究而言,外来词研究的人越来越多,但是外来语素却鲜有涉及。语素是语言中最小的语音语义结合体,相当一部分语素都具有能产性。因此维吾尔语外来语素的研究在词汇学上是很有意义的。本文拟对维吾尔语主要的四种外来语素及其特点进行初步研究,并简单介绍维吾尔语固有语素,以资比较。  相似文献   

6.
汉语语法研究的一个重要问题就是语素、词、短语、句子的界定。张斌十分重视语法单位的辨识及其再分类。他从结构语言学的基本原则出发并结合汉语实际,对语素、词、短语、句子的辨识和再分类方法以及各层次单位间的相互关系做了细致讨论,并有新贡献。  相似文献   

7.
汉语语法研究的一个重要问题就是语素、词、短语、句子的界定.张斌十分重视语法单位的辨识及其再分类.他从结构语言学的基本原则出发并结合汉语实际,对语素、词、短语、句子的辨识和再分类方法以及各层次单位间的相互关系做了细致讨论,并有新贡献.  相似文献   

8.
汉语词汇中,自古以来就有合音词。如古代汉语词汇中的“诸”为“之乎”的合音词,“叵”为“不可”的合音词。现代汉语普通话词汇中也有“您”(你们)、“甭”(不用)等合音词。合音词的特点是,以单音节词的形式,表现双音节词或短语的意义,读音上以原词或短语前一个语素或词音节的声母,跟后一个语素或短语后一个音节的韵母(或某一部分)拼合而成为单音节词,很像传统的“反切”法。因此,合音词语音形式小而词义容量大,是语言交流交际中唯一的一种一个言节两个语素的简练形式,可谓既经济又实用的浓缩语言形式。无疑,合音词是口头…  相似文献   

9.
对维吾尔语的韵律结构进行了全面的研究,从维吾尔语语音合成(text to speech,TTS)语音库中提取了音节的时长、能量、基频均值、最大值、最小值和基频范围等韵律特征参数,分析了其在音节处于不同韵律层次时的变化规律。提取了语音数据中韵律边界前后的音节延长量、音高重置和无声段等声学特征参数,并对它们的分布规律进行了统计分析。实验结果表明:不同韵律层级之间时长延长量和音高差值随着边界层级的提高而增加;韵律词边界之间没有显著地停顿,韵律短语和语调短语层级边界之间的平均停顿时长分别是154.2和212.8ms。  相似文献   

10.
以维吾尔语为代表的低资源、形态丰富语言的信息处理对于满足"一带一路"语言互通的战略需求具有重要意义。这类语言通过组合语素来表示句法和语义关系,因而给语言处理带来严重的数据稀疏问题。该文提出基于双向门限递归单元神经网络的维吾尔语形态切分方法,将维吾尔词自动切分为语素序列,从而缓解数据稀疏问题。双向门限递归单元神经网络能够充分利用双向上下文信息进行切分消歧,并通过门限递归单元有效处理长距离依赖。实验结果表明,该方法相比主流统计方法和单向门限递归单元神经网络获得了显著的性能提升。该方法具有良好的语言无关性,能够用于处理更多的形态丰富语言。  相似文献   

11.
政治文件中的排比的类型可以分为语素排比、词排比、短语排比、分句或单句排比、复句排比、句群排比等类型.排比在此类文件中能清晰地表达思想,加强语势,从而大大地提高了表达效果.  相似文献   

12.
政治文件中的排比的类型可以分为:语素排比、词排比、短语排比、分句或单句排比、复句排比、句群排比等类型。排比在此类文件中能清晰地表达思想,加强语势,从而大大地提高了表达效果。  相似文献   

13.
为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人工采集汉语医学词汇65394条,翻译获得31421条维语术语,对汉语语料分词,对维语语料形态切分,获得实验数据;其次,使用词向量方法,设计了基于词向量表示的双语术语抽取实验,准确率为25.12%;并将传统统计短语对齐抽取技术应用于汉维医疗平行语料,准确率为27.28%;实验结果表明,新方法更需要大量平行语料支持,但是两种方法都有助于提高汉维医学领域机器翻译质量,使提取和翻译大量医学术语自动化.  相似文献   

14.
在跨语言文本分析任务中,多词短语比单个词汇歧义小,语义表达更加准确,有助于提高文本理解的准确性。现有方法主要关注单个词的跨语言对齐。将多词短语抽取和跨语言对齐相融合,提出了一种基于多策略过滤的汉日多词短语抽取和对齐的方法。首先从一个语种出发,通过重复串、左右邻接熵、内部关联度、多词嵌套、停用词等方法提取并过滤得到具备完整语义的多词短语,然后利用平行语料库计算汉日多词短语的相似度,实现跨语言对齐。在整个过程中可结合日语语言规则与特点,根据语料规模、相关领域对过滤阈值进行动态调整,提高了多词短语的领域适用性。实验结果表明,该方法可有效抽取汉日多词短语并进行准确对齐,以多词短语为对齐单元,语义表达更完整,实用价值更大。  相似文献   

15.
维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明,所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能,并且使识别系统的单词错误率比基于单词的系统相对减少22%。  相似文献   

16.
本文根据朱德熙先生有关组成关系和实现关系的理论,对汉语的语素与词的关系作了新的解释。认为,语素与单纯词间为实现关系,语素与合成词间为组成关系。  相似文献   

17.
描述基于统计机器翻译的汉语到维吾尔语的一对一词对齐系统。系统进程分为两个模块:预处理和词字对齐。预处理过程,包括中文文本预处理和维吾尔语文本预处理过程:首先将维吾尔语通过专用工具转换为拉丁维文,然后将拉丁维吾尔语中的特殊文字转换成无歧义的字符。词对齐的实现过程:首先使用IBM模型1,其次利用IBM模型2,构建出一个词对齐系统。实验表明,该系统实现的词对齐比GIZA++中实现的正确率可以提高2.6个百分点。  相似文献   

18.
《花间集》是我国文学史上第一部文人词总集,共收录了晚唐五代18位词人的500首词作。《花间集》中有大量的描写妇女身体发肤、容貌情态的词语,姑且名之为体貌词。就形式来说,《花间集》体貌词包括词、短语两类。依据短语层次的不同,体貌短语可以分为简单短语和复杂短语两种类型,又可以从结构类型、文学修辞等角度进行研究分析。  相似文献   

19.
提出语素词的采集方法,在统计的基础上采用语法跟语义分析相结合的方法,分类来提取语素字,并且对语素字内部的兼类情况进行了分析,采用基于范例的推理方法提取兼类语素字。  相似文献   

20.
基于深度学习的神经机器翻译已在多个语言对上显著超过传统的统计机器翻译,成为当前的主流机器翻译技术。该文从词粒度层面出发,对国际上具有影响力的6种神经机器翻译方法在维吾尔语-汉语翻译任务上进行了深入分析和比较,这6种方法分别是基于注意力机制(GroundHog),词表扩大(LV-groundhog),源语言和目标语言采用子词(subword-nmt)、字符与词混合(nmt.hybrid)、子词与字符(dl4mt-cdec)以及完全字符(dl4mt-c2c)方法。实验结果表明:源语言采用子词、目标语言采用字符的方法(dl4mtcdec)在维吾尔语-汉语神经机器翻译任务上性能最佳。该文不仅是首次将神经机器翻译方法应用到维吾尔语-汉语机器翻译任务上,也是首次将不同的神经机器翻译方法在同一语料库上进行了对比分析。该研究对维吾尔语-汉语机器翻译任务和神经机器翻译的进一步研究工作都具有重要的参考意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号