基于信息熵的双语词聚类算法 |
| |
引用本文: | 张振昌.基于信息熵的双语词聚类算法[J].厦门大学学报(自然科学版),2014(6):804-809. |
| |
作者姓名: | 张振昌 |
| |
作者单位: | 福建农林大学计算机与信息学院; |
| |
基金项目: | 国家林业局“948”项目(2013-4-65) |
| |
摘 要: | 基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上,提出了双语层次聚类的算法;另外,又结合2种算法的思想,提出一种新的混合算法.使用信息熵作为评价标准,结果显示混合算法的聚类效果有3.4%~5.0%的改进.
|
关 键 词: | 双语词聚类 对齐模板 信息熵 |
本文献已被 CNKI 等数据库收录! |
|