首页 | 本学科首页   官方微博 | 高级检索  
     检索      

混合属性数据聚类融合算法
引用本文:赵宇,李兵,李秀,刘文煌,任守榘.混合属性数据聚类融合算法[J].清华大学学报(自然科学版),2006,46(10):1673-1676.
作者姓名:赵宇  李兵  李秀  刘文煌  任守榘
作者单位:清华大学,自动化系,国家CIMS工程研究中心,北京,100084
摘    要:混合属性数据集是现实世界特别是商业金融数据库中最普遍的数据集类型,但适用于这类数据集的聚类算法极少。该文根据聚类融合的方法体系,针对混合属性数据集的特点,提出了基于聚类融合的混合属性特征聚类算法(CEM C),建立了算法框架,列出了算法目标函数和算法主要步骤,并分析了算法复杂度。该算法可以有效处理混合属性海量数据集。用真实数据集验证了算法,并将此算法应用于实际的客户关系管理数据分析中,得到了较好效果。

关 键 词:聚类融合  混合属性  客户关系管理
文章编号:1000-0054(2006)10-1673-04
修稿时间:2005年9月15日

Cluster ensemble method for databases with mixed numeric and categorical values
ZHAO Yu,LI Bing,LI Xiu,LIU Wenhuang,REN Shouju.Cluster ensemble method for databases with mixed numeric and categorical values[J].Journal of Tsinghua University(Science and Technology),2006,46(10):1673-1676.
Authors:ZHAO Yu  LI Bing  LI Xiu  LIU Wenhuang  REN Shouju
Abstract:Real-world intelligent databases always have mixed numeric and categorical values which are difficult to cluster.An ensemble-based mixed attribute cluster model was developed for mixed numeric and categorical databases based on the cluster ensemble method.The objective function and the methodology are described in the paper.The method has excellent scalability.Experimental results on real datasets show that the clustering accuracy is better than existing mixed numeric and categorical data clustering algorithms.
Keywords:cluster ensemble  mixed numeric and categorical  customer relationship management
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号