首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
信息时代,知识的更新换代进一步加快,对翻译人才的要求越来越高,翻译课的传统模式以及方法已不能适应新的需要。随着机器翻译技术的不断发展,机器翻译、翻译记忆等产品也逐步地以各种方式应用到了翻译教学当中。构建一个面向翻译教学的机器翻译系统,整体、系统地将机器翻译技术应用于翻译教学,提高翻译教学的质量,全面提高学生的翻译能力。  相似文献   

2.
目前,基于深度学习的神经机器翻译已经成为机器翻译领域的主流方法.神经机器翻译模型相较于统计机器翻译模型具有更庞大的参数规模,因此其翻译质量取决于训练数据是否充足.由于与维吾尔语相关的平行语料资源严重匮乏,神经机器翻译模型在维汉翻译任务上表现不佳,为此提出了一种利用伪语料对神经机器翻译模型进行增量训练的方法,可有效提升神经机器翻译在维汉翻译任务上的质量.  相似文献   

3.
近年来,基于深度学习的神经机器翻译已经成为机器翻译的主流方法.神经机器翻译模型比统计机器翻译模型更依赖于大规模的标注数据.因此,当训练语料稀缺或语料领域不一致时,翻译质量会显著下降.在藏汉翻译中,训练语料大多为政府文献领域且数据稀缺;在汉英语音翻译中,训练语料大多为书面语领域且噪音语料稀缺.为了提高神经机器翻译模型在这2个任务上的表现,该文提出了一种噪音数据增强方法和2种通用的领域自适应方法,并验证了其有效性.  相似文献   

4.
刘雅嫦  邹莉 《科技信息》2008,(14):290-290
机器翻译就是用电子计算机来进行各种语言的翻译,它是由语言学、数学和计算技术三门科学相结合的一种新的边缘学科,其产生与发展是人们对社会发展趋势的自然反应。笔者通过对机器翻译实例进行分析,得出机器翻译虽有速度快、词汇多、成本低等诸多优点,但仍然存在各种各样的缺陷,最终得出机器翻译不能够完全取代人工翻译的结论。  相似文献   

5.
依赖于大规模的平行语料库,神经机器翻译在某些语言对上已经取得了巨大的成功.然而高质量平行语料的获取却是机器翻译研究的主要难点之一.为了解决这一问题,一种可行的方案是采用无监督神经机器翻译(unsupervised neural machine translation,UNMT),该方法仅仅使用两门不相关的单语语料就可以进行训练,并获得一个不错的翻译结果.受多任务学习在有监督神经机器翻译上取得的良好效果的启发,本文主要探究UNMT在多语言、多任务学习上的应用.实验使用3门互不相关的单语语料,两两建立双向的翻译任务.实验结果表明,与单任务UNMT相比,该方法在部分语言对上最高取得了2~3个百分点的双语互译评估(BLEU)值提升.  相似文献   

6.
机器翻译和计算机辅助翻译极大地提高了翻译效率。在机器翻译尚不尽如人意的情况下,计算机辅助翻译作为一种替代手段,成为翻译人员的一种有效选择,目前已有诸多商业产品问世。主流的计算机辅助翻译工具的核心技术是翻译记忆,其核心模块是翻译记忆系统、术语管理系统、对齐工具、翻译项目管理工具等。立足于计算机辅助翻译的原理和特点,分析计算机辅助翻译的核心技术和核心模块,介绍主流的计算机辅助翻译软件,以期对计算机辅助翻译软件的使用和推广提供参考。  相似文献   

7.
鉴于中国绝大多数德语学习者都有着英语作为第一外语的学习经历以及德英两种语言之间源远流长的亲近关系,采用德英翻译软件辅助学习这种方式,以英语为中介语言,借助语言形式、强化学习、语法翻译以及窄式阅读等理论的支撑,已经在实践中被证明是一种新型的、行之有效的德语网络学习模式,并可望在德语作为二外的习得中取得更为令人满意的成果。德英翻译软件作为机器翻译(MT)的形式之一,实际上对德语和英语的教学学习及研究均具有重要的意义,值得推广。  相似文献   

8.
提出一种基于翻译日志的统计机器翻译模型的剪枝方法。该方法利用翻译规则在翻译日志中的命中频数对机器翻译规则进行过滤, 保留当前机器翻译模型所需的最小规则表。实验表明, 该方法能够在仅保留原有模型1%~3%翻译规则的前提下达到原有模型的翻译效果。  相似文献   

9.
近年来,基于神经网络的机器翻译取得了快速发展,然而由于它需要大规模的平行语料库,所以对于资源稀缺的小语种的翻译往往显得效果不佳.在分析编码-解码框架和注意力机制的基础上,基于对偶学习的思想,提出了一种面向小语种翻译的半监督神经网络模型.该模型利用较大的单语语料库与少量平行语料库来实现小语种翻译.实验结果表明,当平行语料资源不足以训练一个普通神经网络模型时,使用半监督网络模型能够取得较好的结果,但所采用的半监督学习模型对单语语料库的数量要求非常高,要达到一定数量级才能达到良好效果.  相似文献   

10.
机器翻译的质量依赖可供其学习的语料,随着人工智能的发展,语料库数据的建设成为实现翻译智能化和场景化的关键。人工智能翻译下大数据语料来源众多,互联网、企业数据库,用户生成内容和机器生成内容都将成为语料数据的来源;其类型也呈现出多样性特征,从传统的术语、文本、拓展到非结构化数据和知识图谱。鉴于此,人工智能翻译下的大数据语料库建设可以从基于第三方开源数据、众包翻译的共享模式、基于机器闭环学习模式和人机协同模式四个方面进行,未来的翻译教学也可依托语料库的建设成为翻译智能化中的重要一环。  相似文献   

11.
近年来,神经机器翻译模型已经成为机器翻译领域的主流模型,如何从大量的训练数据中快速、准确地学习翻译知识是一个值得探讨的问题.不同训练样本的难易程度不同,样本的难易程度对模型的收敛性有极大影响,但是传统的神经机器翻译模型在训练过程中并没有考虑这种差异性.本文探究样本的难易程度对神经机器翻译模型训练过程的影响,基于“课程学...  相似文献   

12.
现有的机器翻译模型通常在词粒度切分的数据集上进行训练,然而不同的切分粒度蕴含着不同的语法、语义的特征和信息,仅考虑词粒度将制约神经机器翻译系统的高效训练.这对于藏语相关翻译因其语言特点而显得尤为突出.为此提出针对藏汉双向机器翻译的具有音节、词语以及音词融合的多粒度训练方法,并基于现有的注意力机制神经机器翻译框架,在解码器中融入自注意力机制以捕获更多的目标端信息,提出了一种新的神经机器翻译模型.在CWMT2018藏汉双语数据集上的实验结果表明,多粒度训练方法的翻译效果明显优于其余切分粒度的基线系统,同时解码器中引入自注意力机制的神经机器翻译模型能够显著提升翻译效果.此外在WMT2017德英双语数据集上的实验结果进一步证明了该方法在其他语种方向上的适用性.  相似文献   

13.
虽然源语言和目标语言单语数据已被证明通过正向翻译和反向翻译改进神经机器翻译非常有用,但如何更有效的同时使用还值得更深入的研究.为了在神经机器翻译中更有效地同时使用源语言和目标语言单语数据,本文提出了一种基于集束搜索的正向翻译和基于最优N随机采样的反向翻译的组合方法.具体地,将该方法应用于第十七届全国机器翻译大会(CCMT 2021)汉英和英汉新闻领域的翻译评测任务,实验结果表明,与其他常用的单语数据增强方法相比,该方法可以更有效地提升神经机器翻译模型的翻译质量.此外,在使用该方法之前,先进行领域知识迁移还可以进一步取得翻译质量的提升.  相似文献   

14.
根据Talmy的事件框架理论,汉语和英语都是卫星框架型语言,但汉语和英语在表达相同的运动事件框架时却存在差异,这就引起了在翻译,特别是机器翻译方面的不对等。本论文从研究这种差异出发,总结出对翻译,特别是对机器翻译的启示。  相似文献   

15.
介绍了机器翻译方法和统计翻译模型,利用国际开源软件构建了一个基于短语的蒙汉机器翻译系统.初步试验结果表明,基于短语翻译方法的蒙汉机器翻译系统具有较好的翻译效果.  相似文献   

16.
深度学习方法凭借对语义的深度理解能力在机器翻译领域取得长足的进步.然而,对于低资源语言,大规模双语语料的缺乏易导致模型过拟合.针对低资源神经机器翻译数据稀疏的问题,提出了一种迭代知识精炼的对偶学习训练方法,利用回译扩充双语平行语料,通过迭代调整伪语料和真实语料比例,在学习语言表征的同时降低噪声风险,最后结合译文质量及流利度奖励,在源语-目标语和目标语-源语两个方向上优化模型参数,从而达到提升译文质量的目的.在第15届全国机器翻译大会(CCMT 2019)蒙古语-汉语翻译任务上进行了多项实验,结果表明本文方法相比基线提高显著,充分证明该方法的有效性.  相似文献   

17.
在汉越神经机器翻译中,由于汉越平行语料稀少,使得数据稀疏问题十分严重,极大地影响了模型的翻译效果.为了提升数据稀疏情况下的汉越神经机器翻译性能,提出一种基于深度可分离卷积的汉越神经机器翻译方法.该方法根据越南语的语言特点,将越南语切分为词、音节、字符、子词4种不同的粒度并利用深度可分离卷积改进神经机器翻译模型,通过增加深度可分离卷积神经网络,对模型输入的不同粒度序列进行卷积运算,提取更多的特征数据,相比传统卷积降低了模型的理论计算量.实验结果表明,该方法在越南语4种不同翻译粒度上均取得最佳效果,一定程度上提升了汉越神经机器翻译性能.  相似文献   

18.
陆正海 《科技信息》2008,(31):62-62
本文,作者首先简单介绍了网页机器翻译的现状及网页的构成,然后作者提出了一个网页机器翻译的模型,整个模型分成两个部分:有标记文本的翻译和纯文本的翻译。至于有标记文本,作者提出了一个4步法来恰当处理标记,而纯文本的翻译就相对简单。为了提高翻译质量,本文还首先确定了文本的语域,然后使用了EMBT来翻译文本。  相似文献   

19.
机器翻译是人工智能研究中的一个前沿领域 ,它涉及到语言学、数学、哲学、心理学、计算机科学、自动控制技术等多个学科的知识。而归根结底 ,它的发展和完善必须建立在语言学研究的基础之上。本文通过对几种英汉机器翻译软件的翻译实例分析 ,从语义学的角度阐述了机器翻释中的一个关键问题———多义问题 ,并简要介绍了计算语言学对多义问题的处理方法。  相似文献   

20.
神经网络机器翻译技术模拟人脑神经系统,以深度学习技术为基础,将整个句子作为翻译的基本单元,使得机器翻译的准确率大大提升。谷歌、百度、腾讯三家公司推出的翻译软件都采用了神经网络翻译技术,通过比较可知三者的长句翻译能力突出,译文风格各具特色,但在语言方面都仍面临困境。首先,因语言差异导致的漏译误译;其次,因词义多义引起的选词障碍;第三,因语境因素带来的隐性含义的理解。本文认为只有不断完善深度学习的算法,建立纠错数据库,进行跨学科交流,才能进一步提升机器翻译质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号