基于Spark的三支聚类集成方法 |
| |
作者姓名: | 于洪 陈云 |
| |
作者单位: | 重庆邮电大学计算机科学与技术学院; |
| |
摘 要: | 针对大规模不确定性数据聚类,提出一种新的基于Spark的三支聚类集成方法.该方法包括3个步骤:首先,将现有的聚类算法进行基于Spark的分布式处理;然后,以第1个聚类成员的聚类结果作为参照划分,对剩余聚类成员中的类簇做标签对齐;最后,利用投票法以及三支决策规则对标签对齐后的聚类成员进行集成,得到最终的三支聚类结果.实验结果显示,本方法能够有效处理大规模不确定性数据,相比传统基于Spark的聚类算法效率更高.
|
本文献已被 CNKI 等数据库收录! |
|