首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于信息熵的双语词聚类算法
引用本文:张振昌.基于信息熵的双语词聚类算法[J].厦门大学学报(自然科学版),2014(6):804-809.
作者姓名:张振昌
作者单位:福建农林大学计算机与信息学院;
基金项目:国家林业局“948”项目(2013-4-65)
摘    要:基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上,提出了双语层次聚类的算法;另外,又结合2种算法的思想,提出一种新的混合算法.使用信息熵作为评价标准,结果显示混合算法的聚类效果有3.4%~5.0%的改进.

关 键 词:双语词聚类  对齐模板  信息熵
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号