首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于核方法的分类型属性数据集模糊聚类算法
引用本文:伍忠东,高新波,谢维信.基于核方法的分类型属性数据集模糊聚类算法[J].华南理工大学学报(自然科学版),2004,32(9):23-28.
作者姓名:伍忠东  高新波  谢维信
作者单位:1. 西安电子科技大学,电子工程学院,陕西,西安,710071
2. 深圳大学,信息工程学院,广东,深圳,518060
基金项目:国家自然科学基金资助项目 (6 0 2 0 2 0 0 4 )
摘    要:针对分类型属性数据的聚类问题.将核方法的思想推广到快速、高效率的模糊c-均值算法,构造了基于核函数的模糊核c-均值聚类算法.该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息,并且避免了模糊k-modes算法中每次迭代均要直接计算类中心的缺点,提高了聚类的精确度和稳定性.同时该算法对模式(类中心)的初始值选择不敏感.时实际的线性可分的和线性不可分的分类型属性数据集的仿真实验证明了该算法的有效性.

关 键 词:分类型属性数据  聚类  数据挖掘  模糊c-均值  核方法
文章编号:1000-565X(2004)09-0023-06
修稿时间:2003年12月10

A New Fuzzy Clustering Algorithm of Categorical Data Set Based on the Kernel Method
Wu Zhong-dong Gao Xin-bo Xie Wei-xin.A New Fuzzy Clustering Algorithm of Categorical Data Set Based on the Kernel Method[J].Journal of South China University of Technology(Natural Science Edition),2004,32(9):23-28.
Authors:Wu Zhong-dong Gao Xin-bo Xie Wei-xin
Institution:Wu Zhong-dong1 Gao Xin-bo1 Xie Wei-xin2
Abstract:Aiming at the clustering of the categorical data a nd by extending the kernel method to the fast efficient fuzzy c -means clustering algorithm, a fuzzy kernel c -means (FKCM) clustering algorithm based on the kernel function was constructed. In this algorithm, the empirical kernel matrix is applied in order to fully utilize the dissimilarity information among the data. Unlike the fuzzy k -mode algorithm, the modes in the new algorithm need not be directly calculated in each iteration, thus improving the precision and stability of the clustering algorithm and making the new algorithm insensitive to the selection of mode(centroid) initialization. A simulation was finally carried out on the actual linearly and nonlinearly separable categorical data sets, which demonstrates the effectiveness of the proposed algorithm.
Keywords:categorical data  clustering  data mining  fuzzy  c  -means  kernel method
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号