首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于KL准则层次文本聚类
引用本文:曲皎,李白桦.基于KL准则层次文本聚类[J].辽宁师范大学学报(自然科学版),2008,31(1):17-20.
作者姓名:曲皎  李白桦
作者单位:1. 辽宁师范大学,数学学院,辽宁,大连,116029
2. 辽宁师范大学,计算机与信息技术学院,辽宁,大连,116029
摘    要:聚类已经被用来提高文本检索或文本分类效率和效果的一种手段,我们在本文中提出层次聚类算法是依据KL测度构造一组聚类,其实质是最小条件熵聚类,通过用结构α-熵代替香农熵推广最小条件熵准则,当α=2时,基于结构α-熵最小熵测度与最近邻方法的误差率相等.实验结果表明,HKLC算法比其它算法在文本聚类中具有良好性能.

关 键 词:文本聚类  KL测度
文章编号:1000-1735(2008)01-0017-04
收稿时间:2007-06-10
修稿时间:2007年6月10日

KL-based criterion hierarchical text clustering
QU Jiao,LI Bai-hua.KL-based criterion hierarchical text clustering[J].Journal of Liaoning Normal University(Natural Science Edition),2008,31(1):17-20.
Authors:QU Jiao  LI Bai-hua
Abstract:
Keywords:NMI
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号