首页 | 本学科首页   官方微博 | 高级检索  
     

基于聚类质量的两阶段集成算法
作者姓名:闫晨  杨有龙  刘原园
作者单位:西安电子科技大学数学与统计学院
基金项目:陕西省自然科学基础研究计划项目(批准号:2021JM-133);
摘    要:针对现有的集成聚类算法通常默认使用K-means算法作为基聚类生成器,虽能确保聚类成员的多样性,却忽视了差的基聚类可能会对最终聚类结果造成极大干扰的问题,提出一种基于聚类质量的两阶段集成算法.鉴于K-means算法运行高效但聚类质量较粗糙,提出首先在生成阶段采用K-means算法生成基聚类成员,然后通过群体一致性度量筛选出兼具高质量和强多样性的聚类成员,形成候选集成;其次,进一步在集成阶段应用信息熵知识构建基聚类加权的共协矩阵;最后应用一致函数得到最终聚类结果.采用3个指标在10个真实数据集上进行对比实验,实验结果表明,该算法在有效提升聚类结果准确度的同时,能保持较好的鲁棒性.

关 键 词:集成聚类  聚类质量  群体一致性  信息熵  一致函数
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号