融合数据增强与多样化解码的神经机器翻译 |
| |
引用本文: | 张一鸣,刘俊鹏,宋鼎新,黄德根.融合数据增强与多样化解码的神经机器翻译[J].厦门大学学报(自然科学版),2021(4):670-674. |
| |
作者姓名: | 张一鸣 刘俊鹏 宋鼎新 黄德根 |
| |
摘 要: | 基于神经机器翻译模型Transformer,提出一种融合数据增强技术和多样化解码策略的方法来提高机器翻译的性能.首先,对训练语料进行预处理和泛化,提高语料质量并缓解词汇稀疏的现象;然后,基于数据增强技术使用单语句子构造伪双语数据,扩充双语平行语料以增强模型;最后,在解码阶段融合检查点平均、模型集成、重打分等策略以提高译...
|
关 键 词: | 神经机器翻译 数据增强 多样化解码 |
本文献已被 CNKI 等数据库收录! |
|