一种基于数据关联的聚类集成方法 |
| |
作者姓名: | 谷鹏花 杨燕 王红军 |
| |
作者单位: | 西南交通大学信息科学与技术学院 |
| |
基金项目: | 国家自然科学基金资助项目(61170111;611734002;61003142);中央高校基本科研业务费专项资金资助项目(SWJTU11ZT08) |
| |
摘 要: | 聚类集成是集成学习中的一个重要分支,其目标是解决无监督聚类分析中聚类算法的选择性、偏差性与数据特殊性等导致聚类结果不理想的问题。文章提出了一种基于数据关联的聚类集成方法(CEBDR),该算法先提取出在聚类成员中体现有关联关系的数据对象来组成新的类,然后对这些类进行二次聚类得到最终的集成结果。文中选用了一些标准数据集,采用CEBDR算法、已有的基聚类和聚类集成算法来进行对比实验,实验结果表明,该算法能够有效地提高聚类质量。
|
关 键 词: | 聚类集成 数据关联 聚类质量 |
本文献已被 CNKI 等数据库收录! |
|