首页 | 本学科首页   官方微博 | 高级检索  
     

一种适用于数据仓库环境的增量聚类方法
引用本文:王春才,杨华民,张彩虹,郭威,韩贵东. 一种适用于数据仓库环境的增量聚类方法[J]. 河北大学学报(自然科学版), 2010, 30(2)
作者姓名:王春才  杨华民  张彩虹  郭威  韩贵东
作者单位:长春理工大学计算机科学技术学院,吉林,长春,130022
基金项目:吉林省科技发展计划重点项目(20090304)
摘    要:聚类分析要求较高聚类质量和快速响应能力,各行业数据仓库中的大量、高维数据对算法的效率提出了更大的挑战.CURE算法能够提供高质量聚类结果但不满足联机聚类要求.结合数据仓库数据不定期批量、增量更新的特点,提出了一种新的增量式CURE聚类算法——InCURE,利用对象的互连性和近似度,保持原算法的动态聚类特性的同时大大缩短聚类时间.5维、20维、50维的大量数据实际测试表明无论低维还是高维数据,InCURE都比CURE具有更高的效率,适合数据仓库环境下的增量式聚类分析.

关 键 词:聚类  数据仓库  增量聚类  CURE

A Incremental Clustering Algorithm in Data Warehouse Environment
WANG Chun-cai,YANG Hua-min,ZHANG Cai-hong,GUO Wei,HAN Gui-dong. A Incremental Clustering Algorithm in Data Warehouse Environment[J]. Journal of Hebei University (Natural Science Edition), 2010, 30(2)
Authors:WANG Chun-cai  YANG Hua-min  ZHANG Cai-hong  GUO Wei  HAN Gui-dong
Affiliation:1.College of Computer Science and Technology;Changchun University of Science and Technology;Changchun 130022;China
Abstract:Data warehouse is a challenging field of application for data mining tasks such as clustering.Clustering online requires good result and fast-response ability at the same time.The CURE algorithm can get high-quality clusters but efficiency is relatively low.In this paper,a novel incremental CURE algorithm-InCURE is proposed,after investigating CURE and updates mode of data warehouse.CURE keeps nicely the dynamic clustering characteristic of the original algorithm,while shortens the clustering time consumedl...
Keywords:clustering  data warehouse  incremental clustering  CURE  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号