首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
史晓亮 《科技信息》2011,(5):I0161-I0161,I0154
歧义的处理是提高译文质量的关键,作为一种特殊的歧义,语言陷阱的表层结构和真实含义是相反或相对的。为了避免翻译过程中的错误解码所引起的误解给对外交流与合作产生不良影响,本文提出了一种基于网络环境中英汉机器翻译过程的语言陷阱分析系统,该设计基于英语语言陷阱分析的知识库,并在系统中集成了DSP和英文语音字典库。测试结果表明。该系统检测分析语言陷阱效果明显。  相似文献   

2.
机器翻译属于人工智能中的一个领域,在现代工业技术中的地位越来越重要.但机器翻译中通常会遇到的歧义问题大大影响了机器对自然语言的理解.使机器翻译的难度加大,译文可读性极差.本文主要讨论机器翻译中存在的歧义问题,以及基于词汇和句法的处理歧义问题的常用方法.  相似文献   

3.
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.  相似文献   

4.
控制性语言可实现词汇及风格的标准化,保证信息内容前后的一致性,消除歧义,降低语言的复杂程度,质量控制具有客观的标准可以遵循。控制性语言在一定程度上降低了自然语言的复杂性,相应地可以提高翻译质量,因而引起了机器翻译研究人员的关注。以技术规范文献的英汉机器翻译为例,讨论控制性语言的生成规则,使用控制性语言的益处及其对提高机器翻译质量所起的作用。  相似文献   

5.
在机器翻译的研究中,混合式方法是一种好方法.本文的主要工作有两部分:第一部分提出一种近似机器翻译的算法;第二部分针对自然语言在各个层次上普遍存在的歧义性,对语言歧义的问题进行分析,论述一些具体消歧方法.  相似文献   

6.
汉语自动分词系统中切分歧义与未登录词的处理策略   总被引:3,自引:0,他引:3  
本文主要综述了汉语自动分词系统中,切分歧义与未登录词的表现形式以及相应的处理策略,指出在没有完全突破现行机器翻译理论的前提下,增强机器翻译系统中切分歧义与未登录词的处理能力,是提高系统准确率的一种有效措施.  相似文献   

7.
如何提高机器翻译效率并得到高质量的译文一直是机器翻译系统追求的主要目标。增强机译系统的学习功能是提高机译系统性能的一条有效途径,也是智能机译系统的一个重要组成部分。英汉智能机器翻译系统中交互处理机制是通过静态的知识重组和动态的在线学习,不断完善机译系统的知识库,在不降低批量处理效率的前提下,逐步提高机译系统的译文质量,文章重点介绍了英汉机译系统中交互机制的设计和实现。  相似文献   

8.
在机器翻译中,从原文输入到译语文输出的各个分析和转换层面上都存在着不同类型的歧义现象,因此消歧处理成为机器翻译所面临的最重要同时了难的课题之一。前人 一些机器翻译产生深刻影响的文法理论,但歧义问题始终未能得到圆满解决。在基于SC法的智能汉机器翻译系统(IMT/EC)中,充分利用文法的技术特点,在机器翻译的几个主要阶段处理了不同类型的歧义问题,使IMT/EC的译准率明显提高。  相似文献   

9.
基于目标语统计的译文选择的研究   总被引:1,自引:0,他引:1  
译文选择是词义消歧研究在机器翻译中的分支.本文介绍了基于目标语统计的译文选择的原理,并以英汉机器翻译中汉语译文的选择为例,详细讨论了基于目标语统计的方法的实现.通过对词典译文的处理得到统计数据.为适应实用化系统的要求,统计数据进行压缩,并采用特殊的检索算法.提出了多项式级的逐步渗透译文选择算法,实验结果表明,该算法可以将译文选择正确率提高10%以上.  相似文献   

10.
机器翻译涉及的技术很多,主要工作有两部分:第一部分给出一种汉英机器翻译中的短语处理方法,包括短语切分和短语查找;第二部分研究了汉英机器翻译中译文生成的一些问题.  相似文献   

11.
机器翻译的质量评估作为不依赖参考译文而预测翻译质量的任务,在机器翻译领域中起到了重要的作用.相较于机器翻译,质量评估的数据资源非常稀缺,将跨语言预训练模型应用到该任务中,不但能受益于从大规模语料中学习到的跨语言知识,解决数据量不足的问题,而且极大地节约了计算资源.但与建立跨语言预训练模型采用的正常数据不同,译文质量评估面对的是正常的源端文本和错误程度不同的目标端文本,即它需要应对更大的两端语义差异.因此,本文为基于跨语言预训练模型的译文质量评估系统引入了特殊的语义关联处理层,通过相似度增强的拼接机制来增强原文与译文的语义关联性,从而提高质量评估的准确性.该方法在WMT19质量评估任务数据集上的实验结果验证了上述方法的有效性.  相似文献   

12.
机器翻译的研究是人工智能中自然语言理解部分的一个分支,而译文质量是机器翻译系统评估的核心问题.讨论了基于n-gram共现的机器翻译自动评测框架,介绍了BLEU、N IST两种自动评价方法,并针对其提出若干改进思路,旨在更好地实现机器翻译译文质量的自动评估,从而对机器翻译系统的开发和完善提供更好的指导和辅助.  相似文献   

13.
在机器翻译涉及的技术很多.其中,语言消歧就被列为机器翻译最为急迫解决的问题之一.本文的的工作首先对语言歧义的问题进行分析。然后论述一些具体消歧方法.  相似文献   

14.
神经网络机器翻译技术模拟人脑神经系统,以深度学习技术为基础,将整个句子作为翻译的基本单元,使得机器翻译的准确率大大提升。谷歌、百度、腾讯三家公司推出的翻译软件都采用了神经网络翻译技术,通过比较可知三者的长句翻译能力突出,译文风格各具特色,但在语言方面都仍面临困境。首先,因语言差异导致的漏译误译;其次,因词义多义引起的选词障碍;第三,因语境因素带来的隐性含义的理解。本文认为只有不断完善深度学习的算法,建立纠错数据库,进行跨学科交流,才能进一步提升机器翻译质量。  相似文献   

15.
汉语的歧义分布在语言的不同层面上,从词形变化到句子结构都存在歧义.针对汉英机器翻译不同阶段遇到的歧义问题,采用了隐马尔柯夫模型和贝叶斯分类法来进行排歧.实验表明:基于统计的多步消歧策略在汉英机器翻译系统中具有较高的排歧准确率.  相似文献   

16.
深度学习方法凭借对语义的深度理解能力在机器翻译领域取得长足的进步.然而,对于低资源语言,大规模双语语料的缺乏易导致模型过拟合.针对低资源神经机器翻译数据稀疏的问题,提出了一种迭代知识精炼的对偶学习训练方法,利用回译扩充双语平行语料,通过迭代调整伪语料和真实语料比例,在学习语言表征的同时降低噪声风险,最后结合译文质量及流利度奖励,在源语-目标语和目标语-源语两个方向上优化模型参数,从而达到提升译文质量的目的.在第15届全国机器翻译大会(CCMT 2019)蒙古语-汉语翻译任务上进行了多项实验,结果表明本文方法相比基线提高显著,充分证明该方法的有效性.  相似文献   

17.
针对传统的基于实例的机器翻译(EBMT)方法中系统构筑复杂度和成本较高的问题,提出一种基于依存树到串的汉英实例机器翻译方法。与传统方法相比,该方法只需进行源语言端的句法结构分析,可以大大降低构筑系统的复杂度,有效降低成本。为了提高翻译精度,引入中文分词、词性标注和依存句法分析联合模型,可以减少汉英EBMT中源语言端基础任务中的错误传递,提高提取层次间特征的准确性。在此基础上,结合依存结构的特征和中英语料的特性,对依存树到串模型进行规则抽取以及泛化处理。实验结果表明,相对于基线系统,该方法可以提高实例对抽取质量,改善泛化规则和译文质量,提高系统性能。  相似文献   

18.
目前性能最优的译文质量估计系统使用神经机器翻译中的编码器-解码器模型作为特征提取器.该方法由于限制词表大小易导致数据稀疏问题,从而使得较多的未登陆词不能被正确评价.为了缓解上述问题,在详细分析不同子词切分方法的特点后,提出了基于字节对编码(BPE)子词切分和基于一元文法语言模型子词切分的神经译文质量估计方法,并将两者的译文质量估计的得分与基于词语切分的神经译文质量估计得分融合后进行译文质量估计.在WMT18句子级别译文质量估计子任务数据集上的实验结果表明:融合BPE子词切分、一元文法语言模型子词切分和词语切分的神经译文质量估计方法的性能在多个评测子任务上超过了WMT18给出的最好参与系统,深入的实验分析进一步揭示了融合不同粒度的句子切分方法提高了译文质量估计的健壮性.  相似文献   

19.
基于最长次长匹配的汉语自动分词   总被引:12,自引:1,他引:11  
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT),自然语言理解(NLU),情报检索(IR)等都需以自动分词作为基础。为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长匹配原则的汉语自动分词方法,分词效果较好。  相似文献   

20.
歧义处理是中文分词的难点之一,其中交集型歧义占该类问题的主要部分,而无监督学习可以利用互联网上的无标注语料库来处理该问题.文章将比较卡方统计量、t-测试差在歧义处理中的效果,通过对其研究提出一种改善歧义处理性能的方法.实验结果表明,所提出的方法能有效进行分词,并提高了交集型歧义消解的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号