期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

玉霞王斯日古楞《内蒙古师范大学学报(自然科学版)》2015,(3):364-367,371

借鉴并利用基于短语的因子化机器翻译方法,结合基于隐马尔科夫模型的词性标注系统实现了蒙古文的自动词性标注.首先使用基于短语的因子化机器翻译方法对词表词进行标注,然后用基于隐马尔科夫模型的词性标注方法对生词进行标注.实验结果表明,采取的蒙古文词性标注方法的准确率达到97.91%.最后,将该方法标注的词性融入到蒙汉统计机器翻译系统后,译文质量有了较大提高,进一步证明该方法的有效性和实用性. 相似文献

2.

民汉稀缺资源神经机器翻译技术研究

赵阳周龙王迁马聪刘宇宸王亦宁向露张家俊周玉宗成庆《江西师范大学学报(自然科学版)》2019,(6):630-637

该文介绍了中国科学院自动化研究所参加第15届全国机器翻译大会(CCMT2019)翻译评测任务总体情况以及采用的技术细节.在评测中,中国科学院自动化研究所参加了3个翻译任务,分别是蒙汉日常用语机器翻译、藏汉政府文献机器翻译以及维汉新闻领域机器翻译; 阐述了参评系统采用的模型框架、数据预处理方法以及译码策略; 最后给出了不同设置下评测系统在测试数据集上的表现,并进行了对比和分析. 相似文献

3.

结合BERT数据增强的基于词切分的蒙汉神经机器翻译系统

何乌云秀芝包晶晶陈美兰王斯日古楞《厦门大学学报(自然科学版)》2022,(4):667-674

神经机器翻译是目前机器翻译领域主流研究方法,但是蒙汉平行语料的稀缺使得蒙汉神经机器翻译性能难以提升.本文针对基于Transformer的蒙汉神经机器翻译系统,利用深度学习模型对蒙古文词切分方法进行研究,分析了蒙古文部分切分、BPE子词切分和BiLSTM-CNN-CRF神经网络切分方法对于蒙汉机器翻译模型的影响,并在此基础上利用基于BERT(bidirectional encoder representations from Transformers)中文语义相似度计算的数据增强技术去扩充蒙汉机器翻译训练数据.在CCMT2019提供的数据集上进行对比实验,实验结果表明,数据增强方法的BLEU值相较于基线实验提升显著,且BLEU4值达到了75.28%. 相似文献

4.

汉语-维吾尔语机器翻译解码器研究

张亚军《昌吉学院学报》2011,(3):110-113

描述了基于短语统计的汉语-维吾尔语(简称汉维)机器翻译解码器。搜索算法的效率是解码的关键,基于短语统计的搜索算法在汉维机器翻译中是首次使用,并构建翻译备选项列表,基本实现了汉维机器翻译的解码器研究设计。分析对比实验结果,证明该搜索算法的有效性。相似文献

5.

基于翻译日志的统计机器翻译模型剪枝

刘凯吕雅娟姜文斌刘群《北京大学学报(自然科学版)》2014,50(1):167

提出一种基于翻译日志的统计机器翻译模型的剪枝方法。该方法利用翻译规则在翻译日志中的命中频数对机器翻译规则进行过滤, 保留当前机器翻译模型所需的最小规则表。实验表明, 该方法能够在仅保留原有模型1%~3%翻译规则的前提下达到原有模型的翻译效果。相似文献

6.

基于数据增强及领域适应的神经机器翻译技术

谷舒豪单勇谢婉莹郭登级王树根邵晨泽薛海洋张良冯洋《江西师范大学学报(自然科学版)》2019,43(6)

近年来,基于深度学习的神经机器翻译已经成为机器翻译的主流方法.神经机器翻译模型比统计机器翻译模型更依赖于大规模的标注数据.因此,当训练语料稀缺或语料领域不一致时,翻译质量会显著下降.在藏汉翻译中,训练语料大多为政府文献领域且数据稀缺;在汉英语音翻译中,训练语料大多为书面语领域且噪音语料稀缺.为了提高神经机器翻译模型在这2个任务上的表现,该文提出了一种噪音数据增强方法和2种通用的领域自适应方法,并验证了其有效性. 相似文献

7.

基于语义分布相似度的翻译模型领域自适应研究

姚亮洪宇刘昊刘乐姚建民《山东大学学报(理学版)》2016,51(7):43-50

统计机器翻译系统由规模较大、领域混杂的平行语料训练获得,当训练数据和测试数据领域分布不一致时,其翻译质量往往较低。针对这一问题,提出了一种基于语义分布相似度的翻译模型领域自适应方法。该方法首先获得目标领域源语言端和目标语言端的词向量,并构建二者之间的映射关系。借助这一映射关系,获取源语言单词在目标语言端的语义k近邻词,然后基于该语义k近邻词在通用领域语义空间的分布,计算双语短语在目标领域下的翻译相似度,并作为新特征加入解码器,以此提升通用翻译模型的领域自适应能力。实验结果表明,相比于基准系统,利用本文所提方法优化后的翻译系统在英汉翻译任务新闻领域测试集和科技领域测试集上,分别获得0.67和0.56个BLEU值的性能提升。相似文献

8.

面向神经机器翻译的正向翻译与反向翻译相结合的改进方法

吴章淋魏代猛李宗耀於正哲商恒超陈潇雨郭嘉鑫王明涵雷立志陶士敏杨浩秦璎《厦门大学学报(自然科学版)》2022,(4):675-681

虽然源语言和目标语言单语数据已被证明通过正向翻译和反向翻译改进神经机器翻译非常有用,但如何更有效的同时使用还值得更深入的研究.为了在神经机器翻译中更有效地同时使用源语言和目标语言单语数据,本文提出了一种基于集束搜索的正向翻译和基于最优N随机采样的反向翻译的组合方法.具体地,将该方法应用于第十七届全国机器翻译大会(CCMT 2021)汉英和英汉新闻领域的翻译评测任务,实验结果表明,与其他常用的单语数据增强方法相比,该方法可以更有效地提升神经机器翻译模型的翻译质量.此外,在使用该方法之前,先进行领域知识迁移还可以进一步取得翻译质量的提升. 相似文献

9.

统计机器翻译中实例短语对研究

李强李沐张冬冬朱靖波《北京大学学报(自然科学版)》2016,52(1):113-119

针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题, 在基于短语的统计机器翻译系统中, 通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作, 生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上, 与基线系统相比, 该方法在多个测试集上明显提高了翻译系统的翻译质量, 在部分测试集上BLEU 值可提高1%左右。相似文献

10.

面向翻译教学的机器翻译系统建构

刘敏贤杨跃《西安联合大学学报》2010,13(3):109-112

信息时代,知识的更新换代进一步加快,对翻译人才的要求越来越高,翻译课的传统模式以及方法已不能适应新的需要。随着机器翻译技术的不断发展,机器翻译、翻译记忆等产品也逐步地以各种方式应用到了翻译教学当中。构建一个面向翻译教学的机器翻译系统,整体、系统地将机器翻译技术应用于翻译教学,提高翻译教学的质量,全面提高学生的翻译能力。相似文献