基于集成机器翻译的双语平行语料无监督质量评价 |
| |
引用本文: | 王琳,刘伍颖.基于集成机器翻译的双语平行语料无监督质量评价[J].山西大学学报(自然科学版),2023(3):528-536. |
| |
作者姓名: | 王琳 刘伍颖 |
| |
作者单位: | 1. 上海外国语大学贤达经济人文学院;2. 广东外语外贸大学语言工程与计算实验室 |
| |
摘 要: | 围绕双语平行语料质量评价问题,提出基于集成机器翻译的无监督质量评价思路,从翻译方向和翻译系统两个视角分别设计实现了单引擎和多引擎无监督评价框架和算法。实验结果表明单引擎无监督评价算法能够集成同一个机器翻译系统不同翻译方向的差异,多引擎无监督评价算法能够集成不同机器翻译系统之间的差异,采用最基本的莱文斯坦字符串形态相似度计算方法和线性加权集成方法能够实现高效工业级语料质量评价。
|
关 键 词: | 语料质量 无监督评价 集成机器翻译 双语平行语料 形态相似度 |
|
|