首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对维汉机器翻译中存在的维吾尔语(下文简称维语)形态复杂性和数据稀疏性问题,提出了一种层次化融合多个维语语法特征的神经网络机器翻译模型.该模型采用4种特征(词干、词性、词缀、词缀形态)作为源端语言附加信息,用于辅助单一词汇形式表示的维语语句;同时引入层次化多特征融合的神经网络结构,用于分层处理维语的词干级和词缀级特征,以增强机器翻译系统对维语的句法结构和语义知识的学习能力,从而提高维汉机器翻译质量.在维汉公开数据集上的实验结果表明,所提出的层次化多特征融合模型可以有效提高维汉机器翻译系统性能,其双语互译评估(BLEU)值和字符匹配度(ChrF3)值均有明显提升.  相似文献   

2.
提出了一种汉-维句子对齐混合算法,它是以基于词典的方法为主、基于长度的方法为辅的一种混合对齐算法.目的在于建立一个以汉文-维文平行语料库及面向政府文献的汉-维机器翻译为应用背景的,实用汉-维句子对齐系统.  相似文献   

3.
目前,基于深度学习的神经机器翻译已经成为机器翻译领域的主流方法.神经机器翻译模型相较于统计机器翻译模型具有更庞大的参数规模,因此其翻译质量取决于训练数据是否充足.由于与维吾尔语相关的平行语料资源严重匮乏,神经机器翻译模型在维汉翻译任务上表现不佳,为此提出了一种利用伪语料对神经机器翻译模型进行增量训练的方法,可有效提升神经机器翻译在维汉翻译任务上的质量.  相似文献   

4.
该文介绍了中国科学院自动化研究所参加第15届全国机器翻译大会(CCMT2019)翻译评测任务总体情况以及采用的技术细节.在评测中,中国科学院自动化研究所参加了3个翻译任务,分别是蒙汉日常用语机器翻译、藏汉政府文献机器翻译以及维汉新闻领域机器翻译; 阐述了参评系统采用的模型框架、数据预处理方法以及译码策略; 最后给出了不同设置下评测系统在测试数据集上的表现,并进行了对比和分析.  相似文献   

5.
神经机器翻译在高资源情况下已经获得了巨大的成功,但是对低资源情况翻译效果还有待提高.目前,维吾尔语-汉语(维汉)翻译和蒙古语-汉语(蒙汉)翻译都属于低资源情况下的翻译任务.本文提出将汉语单语数据按照领域相似性划分成多份单语数据,并通过回译方法分段利用不同的单语数据训练翻译模型,然后借助模型平均和模型集成等方法进一步提升维汉和蒙汉翻译质量.使用第16届全国机器翻译大会(CCMT 2020)的评测数据进行实验,结果表明该方法可以有效地提升维汉和蒙汉翻译的翻译质量.  相似文献   

6.
把人工智能技术与机器翻译结合起来,研究智能翻译,这是机器翻译的一个发展方向。本文作者根据人工智能的原理,在俄汉、英汉机器翻译实践的基础上,在智能翻译方面提出了一个新的实现方案。按照这个方案研制了微计算机翻译系统。运行结果表明这个方案是可行的。  相似文献   

7.
从高效利用现有资源的角度出发,针对维汉平行语料匮乏导致维汉神经机器翻译效果欠佳的问题,提出一个基于回译和集成学习的方法.首先,利用回译和大规模汉语单语语料构造出维汉伪平行语料,并利用伪平行语料进行训练得到中间模型;其次,使用自助采样法对原始平行语料进行N次重采样,得到N个近似同一分布但具有差异性的子数据集;基于N个子数据集分别对中间模型进行微调,得到N个具有差异性的子模型;最后,将这些子模型集成.在CWMT2015和CWMT2017的测试集上的实验证明,该方法比基线系统的BLEU值分别提升了2.37和1.63.  相似文献   

8.
为了得到更好的翻译结果,研究者对于利用平行数据生成大量高质量生成数据进行了广泛的研究.为此,针对数据增强和系统训练方法,提出结合知识蒸馏、数据增强和数据筛选的方法得到高质量生成数据.具体为利用知识蒸馏的方法得到鲁棒性更强的汉维翻译模型,在该汉维模型的基础之上通过反向翻译的方法生成质量较好的生成数据,并利用不同的数据筛选方法进一步得到高质量生成数据.之后利用现有的平行数据和生成数据训练得到一个高性能的维吾尔语-汉语神经机器翻译系统.在CCMT2021维汉评测任务中验证上述方法对于维汉翻译质量的影响,对比基线系统、反向翻译和同任务其他系统,该方法训练得到的系统有着更好的翻译结果,并在该翻译任务上获得了第一名.  相似文献   

9.
在机器翻译中,从原文输入到译语文输出的各个分析和转换层面上都存在着不同类型的歧义现象,因此消歧处理成为机器翻译所面临的最重要同时了难的课题之一。前人 一些机器翻译产生深刻影响的文法理论,但歧义问题始终未能得到圆满解决。在基于SC法的智能汉机器翻译系统(IMT/EC)中,充分利用文法的技术特点,在机器翻译的几个主要阶段处理了不同类型的歧义问题,使IMT/EC的译准率明显提高。  相似文献   

10.
探讨汉语彝语机器翻译的方法与实现.阐述了课题研究的背景和意义,给出了技术实施中的时态转换的匹配规则,汉彝句型转换的翻译初步实践、汉语句子单词切分时的边界处理算法.从而实现对源语言汉语单词的切分检索,通过算法对语句进行调序,再结合彝族特定的语法、句型结构,最终生成目标语言彝语.即采用适合汉彝语法的句法结构转换再增减恰当的词汇来构成符合源语句语义信息的目标语句,从而达到汉彝机器翻译的基本层次.  相似文献   

11.
自从MM定理诞生以来,企业的资本结构理论一直是经济学界关注的焦点之一.随着中国资本市场和企业改革的发展,关于资本结构的研究对于中国的上市公司来说很有必要.文中首先总结了中国上市公司的资本结构自身的特点,探讨了企业资本结构的内部和外部影响因素,最后对内部影响因素进行实证检验和分析,并且得出了一些与国外研究略有区别的结论.  相似文献   

12.
运用文献资料法、文献计量法等方法,对1993年以来我国体操科研是否呼应规则导向的动态特点进行探究。结果表明:体操科研在量上顺应了规则的要求,而在质上,其对规则导向的领会呈现了定位错乱—基本错位—基本满足—正中要点的动态发展特点。同时研究得出,发展难度动作和创新是体操运动的主流,全面掌握技能、增强艺术美感、吃透规则是比赛制胜的保证,理论研究、技术训练、综合保障是研究领域的三大热点,规则探析、赛事评述和预测是研究中的"常春藤"。  相似文献   

13.
山旱地农业研究始终是我省农业发展的重点科研攻关项目,尤其是山旱地春小麦的品种选育,一直是较为薄弱的环节。本文基于田间试验资料,运用统计分析的方法,对旱地春小麦主要农艺性状与产量间进行了较为详细的相关性分析和论证,得出旱地春小麦各生态选育指标中,以株高对产量的直接效应最大,其次为亩穗数,小穗数和千粒重。  相似文献   

14.
集中介绍了CAD/CAPP/CAM中的有关特征技术.同时,介绍了近几年国内外有关特征技术的研究热点.  相似文献   

15.
将二项式定理及多项式定理从数的领域拓广到矩阵领域,并对对角线型三角矩阵n次幂的求法进行了研究。  相似文献   

16.
商业性地质工作是和公益性地质工作相对应提出的.在公益性也质工作得到初步加强的同时,如何认识商业性地质工作风险管理的问题,是当前政府部门和地勘单位值得关注的一个重要问题。  相似文献   

17.
作为高师院校的化学专业,对学生进行绿色化学的教育至关重要。通过对实验室还原氧化铜残渣回收利用的研究,将绿色化学教育贯穿于其中。  相似文献   

18.
本文在对车流径路算法进行深入探讨的同时,建立了路网上有条件约束的车流组织的优化模型,并提出了求解模型的运筹学算法.最后,对优化方案调整方法也作了初步的研究.  相似文献   

19.
贵州省小学生心理健康与教师认知发展的关系   总被引:1,自引:1,他引:0  
研究对分布在6个年级中的1 231名小学生的心理健康状况及他们任课教师认知发展状况进行了测查,并作相关研究。从总体上看,小学生心理健康状况良好,存在年级和性别差异;小学生的心理健康与教师认知发展的6个因子都达到了极其显著的正相关。  相似文献   

20.
本文得出微扰能量和波函数的递推公式,由它可很容易地得出任意高级微扰能量和波函数的一般公式.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号