融入汉字笔画序列的神经机器翻译 |
| |
引用本文: | 谭新,邝少辉,张龙印,熊德意.融入汉字笔画序列的神经机器翻译[J].厦门大学学报(自然科学版),2019(2). |
| |
作者姓名: | 谭新 邝少辉 张龙印 熊德意 |
| |
作者单位: | 苏州大学计算机科学与技术学院 |
| |
摘 要: | 神经机器翻译(NMT)因其在多个语言对上的翻译效果都远超传统的统计机器翻译(SMT)而逐渐成为机器翻译方向的主流.然而,这种NMT系统在将向量化的词语作为输入时只考虑了词语整体的语义信息,忽略了构成词语的汉字本身所包含的信息.为此,针对汉字给出了一种融入汉字笔画序列的NMT系统.该系统在将词语的词向量作为输入的同时又将向量化的汉字笔画序列作为额外输入,既考虑了中文词语整体的语义信息,又考虑了构成词语的汉字本身的内部语义信息和外部形态信息.实验结果表明,提出的融入了汉字笔画序列的NMT系统更加有效,其翻译结果更加准确流畅,与传统的NMT系统相比机器双语互译评估(BLEU)值能够提高1.21个百分点.
|
本文献已被 CNKI 等数据库收录! |
|