首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 224 毫秒
1.
深度学习方法凭借对语义的深度理解能力在机器翻译领域取得长足的进步.然而,对于低资源语言,大规模双语语料的缺乏易导致模型过拟合.针对低资源神经机器翻译数据稀疏的问题,提出了一种迭代知识精炼的对偶学习训练方法,利用回译扩充双语平行语料,通过迭代调整伪语料和真实语料比例,在学习语言表征的同时降低噪声风险,最后结合译文质量及流利度奖励,在源语-目标语和目标语-源语两个方向上优化模型参数,从而达到提升译文质量的目的.在第15届全国机器翻译大会(CCMT 2019)蒙古语-汉语翻译任务上进行了多项实验,结果表明本文方法相比基线提高显著,充分证明该方法的有效性.  相似文献   

2.
机器翻译的研究是人工智能中自然语言理解部分的一个分支,而译文质量是机器翻译系统评估的核心问题.讨论了基于n-gram共现的机器翻译自动评测框架,介绍了BLEU、N IST两种自动评价方法,并针对其提出若干改进思路,旨在更好地实现机器翻译译文质量的自动评估,从而对机器翻译系统的开发和完善提供更好的指导和辅助.  相似文献   

3.
借鉴并利用基于短语的因子化机器翻译方法,结合基于隐马尔科夫模型的词性标注系统实现了蒙古文的自动词性标注.首先使用基于短语的因子化机器翻译方法对词表词进行标注,然后用基于隐马尔科夫模型的词性标注方法对生词进行标注.实验结果表明,采取的蒙古文词性标注方法的准确率达到97.91%.最后,将该方法标注的词性融入到蒙汉统计机器翻译系统后,译文质量有了较大提高,进一步证明该方法的有效性和实用性.  相似文献   

4.
在信息技术迅猛发展的Intemet时代,迫切需要通过机器翻译来解决各民族之间的文字沟通障碍.提出了一个基于规则和语料的英藏机器翻译系统的语言模型及结构设计,给出了系统的设计思想、设计原则,深入分析了翻译方法的选择,阐述了系统的总体结构、翻译算法及语言模型.  相似文献   

5.
回顾了统计机器翻译发展的历程,讨论了噪声信道模型、基于短语的统计机器翻译和基于句法的统计机器翻译,主张把理性主义方法和经验主义方法结合起来,以推进机器翻译的进一步发展。  相似文献   

6.
针对基于短语的统计机器翻译使用有限的语义知识, 导致长距离的动宾短语对翻译质量不高的问题, 提出基于动词选择偏向性的翻译模型, 引入动词对宾语的语义约束信息, 为动词找到合适的宾语翻译。首先使用条件概率方法, 训练动词对宾语的选择偏向性, 然后将选择偏向性作为一个新特征, 集成到基于短语的翻译系统中。在大规模测试数据集上完成汉语到英语的翻译, 实验结果表明, 基于选择偏向性的翻译模型能够很好地捕获长距离的语义依赖关系, 从而提高译文质量。  相似文献   

7.
机器翻译属于人工智能中的一个领域,在现代工业技术中的地位越来越重要.但机器翻译中通常会遇到的歧义问题大大影响了机器对自然语言的理解.使机器翻译的难度加大,译文可读性极差.本文主要讨论机器翻译中存在的歧义问题,以及基于词汇和句法的处理歧义问题的常用方法.  相似文献   

8.
机器翻译的质量评估作为不依赖参考译文而预测翻译质量的任务,在机器翻译领域中起到了重要的作用.相较于机器翻译,质量评估的数据资源非常稀缺,将跨语言预训练模型应用到该任务中,不但能受益于从大规模语料中学习到的跨语言知识,解决数据量不足的问题,而且极大地节约了计算资源.但与建立跨语言预训练模型采用的正常数据不同,译文质量评估面对的是正常的源端文本和错误程度不同的目标端文本,即它需要应对更大的两端语义差异.因此,本文为基于跨语言预训练模型的译文质量评估系统引入了特殊的语义关联处理层,通过相似度增强的拼接机制来增强原文与译文的语义关联性,从而提高质量评估的准确性.该方法在WMT19质量评估任务数据集上的实验结果验证了上述方法的有效性.  相似文献   

9.
如何提高机器翻译效率并得到高质量的译文一直是机器翻译系统追求的主要目标。增强机译系统的学习功能是提高机译系统性能的一条有效途径,也是智能机译系统的一个重要组成部分。英汉智能机器翻译系统中交互处理机制是通过静态的知识重组和动态的在线学习,不断完善机译系统的知识库,在不降低批量处理效率的前提下,逐步提高机译系统的译文质量,文章重点介绍了英汉机译系统中交互机制的设计和实现。  相似文献   

10.
数据平滑技术主要是用来解决统计语言模型在实际应用中数据稀疏问题,它是语言建模的核心技术,Katz平滑方法是应用最广泛的方法之一.本文对Katz平滑算法作了改进,使之应用于trigger对的平滑,并在汉语-蒙古语机器翻译系统实现了该算法,实验结果表明该技术可以提高翻译效果.  相似文献   

11.
提出一种利用规则与统计相结合的方法用于英汉机译系统中以消解语义级歧义 ,建立了一种根据单词之间的词语搭配关系以消除歧义的模型。该模型利用英汉双语语料选择合理的词组语义 ,对有歧义的单词作出标注。在此基础上给出了语义消歧的学习算法 ,并建立了一套有效的提高召回率的消歧算法。算法在英汉机译系统中的实际应用使正确率提高了约 10 % ,效果显著。  相似文献   

12.
英语科技名词汉译是科技文献资料翻译的重要组成部份。名词不仅数量多,使用广,且具多意性,翻译中应竭力做到取意正确,既能表达原意,又符合汉语规范。“信、达、雅”是长期以来检查译作质量高低的重要准绳。随着科学技术的发展,接踵而来的是新概念、新方法、新理论的不断出现,从而形成新的科学体系。反映上述客观事物,尤其是概念,均需名词,翻译中应一一定名,汉语中若无相应词汇表达,就得造新词或采取其它手段。科技英语中普通名词与专有名词的汉译不尽相同,常用的有意译、音译、音意兼顾译、形译、缩译等手段。普通名词意译为主,专有名词音译为主。本文还就现代英语名词汉译的发展与发展规律和规范等问题进行了讨论。  相似文献   

13.
英语缩略词是英语新词的主要来源之一,地位十分重要.由于对英语缩略词的定义、分类及其结构特征认识不清,往往带来很多争论,使得这类词语的汉译也带来了很大的影响.文章从历时和共时的角度探讨英语缩略词的定义、分类,围绕英汉语缩略词的结构差异,提出了准确、通俗易懂和遵循惯译的翻译标准,并探讨了缩略词和汉语字母词的关系,建立了相应的翻译步骤和翻译方法.  相似文献   

14.
汉英语言存在着较大的文化差异,其中颜色词的文化差异极易导致东西方人理解的误区。以红、蓝、白为例,从分析该三种颜色词的文化内涵异同的角度出发,通过举例,指出对颜色词的翻译须建立在对当地风俗、历史和文化背景等诸多方面有所了解的基础上,再根据语境,仔细斟酌,不可望文生义。最后对英汉两种语言颜色词差异的原因进行了探讨。  相似文献   

15.
基于最长次长匹配的汉语自动分词   总被引:11,自引:1,他引:11  
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT),自然语言理解(NLU),情报检索(IR)等都需以自动分词作为基础。为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长匹配原则的汉语自动分词方法,分词效果较好。  相似文献   

16.
根据语义学理论的基本原理,探讨了英汉词语的核心、外延和认知意义,提出在翻译过程中必须正确把握词语的弹性,才能达到原文和译文之间的“动态对等”。  相似文献   

17.
意译法作为外译汉的主要方法而存在,但它也有不少缺陷。直译是对意译不足的一种补充方式,它可把某些外语词语原封不动地移用到汉语中来。不译指对一些使用拉丁字母文字语言中的一些词语,干脆不译,照样写进汉语中。直译、不译都是语言多元化的结果。  相似文献   

18.
Finding out out-of-vocabulary words is an urgent and difficult task in Chinese words segmentation. To avoid the defect causing by offline training in the traditional method, the paper ptoposes an improved prediction by partical match (PPM) segmenting algorithm for Chinese words based on extracting local context information, which adds the context information of the testing text into the local PPM statistical model so as to guide the detection of new words. The algorithm focuses on the process of online segmentation and new word detection which achieves a good effect in the close or opening test, and outperforms some well-known Chinese segmentation system to a certain extent.  相似文献   

19.
对于基于实例的机器翻译,最困难的是如何从多个翻译实例中选出最相信的样例,本文对日中机器翻译系统提出了一种基于概念分类与附属词的方法来计算相似性,该方法充分体现的名中词间的组合搭配关系,可适当缩减实例库规模,简化权值的计算,取得了较好的效果。  相似文献   

20.
英语外来词强势进入,方式不一。现代汉语在吸收外来词时应遵循“心态开放、体系规范”的原则,最终采取“以意译成分为主”的方式,使外来词合情合理地融入现代汉语体系中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号