首页 | 本学科首页   官方微博 | 高级检索  
     

基于CSGAN的多模型融合蒙汉神经机器翻译研究
引用本文:武子玉,侯宏旭,白天罡,吉亚图,乌尼尔,郭紫月,王雪姣,孙硕. 基于CSGAN的多模型融合蒙汉神经机器翻译研究[J]. 江西师范大学学报(自然科学版), 2020, 44(2): 153-159. DOI: 10.16357/j.cnki.issn1000-5862.2020.02.07
作者姓名:武子玉  侯宏旭  白天罡  吉亚图  乌尼尔  郭紫月  王雪姣  孙硕
作者单位:1.内蒙古大学计算机学院,内蒙古 呼和浩特 010021; 2.内蒙古自治区蒙古文信息处理技术重点实验室,内蒙古 呼和浩特 010021
基金项目:内蒙古自治区科技成果转化蒙古文机器翻译与辅助翻译云平台建设与推广资助项目;内蒙古自治区自然科学基金
摘    要:由于低资源语料稀少而导致的语义捕获不充分现象已成为影响机器翻译质量的主要因素.为此,该文在预处理的基础上利用CNN和门控机制来改进Transformer模型,通过对抗训练的方式来引导模型参数的优化,同时通过加入命名实体识别来提高模型对实体的翻译性能.此外,通过多模型融合的方式将来自多个机器翻译的输出经过改进、重组、合并转变为一个单一的改进的翻译结果.通过3组对比实验表明,该方法优于基准方法.

关 键 词:蒙汉机器翻译  数据稀疏  系统融合  命名实体

The Research on Multi-Model Fusion for Mongolian-Chinese Neural Machine Translation Based on CSGAN
WU Ziyu1,HOU Hongxu2,BAI Tiangang2,JI Yatu2,WU Nier2,GUO Ziyue2,WANG Xuejiao2,SUN Shuo2. The Research on Multi-Model Fusion for Mongolian-Chinese Neural Machine Translation Based on CSGAN[J]. Journal of Jiangxi Normal University (Natural Sciences Edition), 2020, 44(2): 153-159. DOI: 10.16357/j.cnki.issn1000-5862.2020.02.07
Authors:WU Ziyu1  HOU Hongxu2  BAI Tiangang2  JI Yatu2  WU Nier2  GUO Ziyue2  WANG Xuejiao2  SUN Shuo2
Affiliation:1.College of Computer Science,Inner Mongolia University, Hohhot Inner Mongolia 010021,China; 2.Inner Mongolia A.R. Key Laboratory of Mongolian Information Processing Technology,Inner Mongolia University,Hohhot Inner Mongolia 010021,China
Abstract:The phenomenon of insufficient semantic capture due to the scarcity of low-resource corpus has become a major factor affecting the quality of machine translation.Therefore,based on the pretreatment,the paper improves the transformer model by using CNN and gating mechanism and guides the optimization of model parameters using confrontation training.At the same time,named entity recognition is added to improve the translation performance of model entities.Reorganize and merge the output from multiple machine translations into a single improved translation result through multi-model fusion.The Mongolian-Chinese translation experiments show that the proposed method is superior to the benchmark method.
Keywords:Mongolian-Chinese machine translation  data sparsity  fusion system  named entity
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《江西师范大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《江西师范大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号