首页 | 本学科首页   官方微博 | 高级检索  
     

基于时间衰减的分布式数据流聚类算法
引用本文:陈春燕,吕俊龙,郭有强. 基于时间衰减的分布式数据流聚类算法[J]. 太原师范学院学报(自然科学版), 2013, 0(2): 87-90
作者姓名:陈春燕  吕俊龙  郭有强
作者单位:[1]蚌埠医学院,安徽蚌埠233000 [2]蚌埠学院计算机科学技术系,安徽蚌埠233000
基金项目:安徽省优秀青年人才基金项目(2010SQRL126); 安徽省自然科学基金项目(11040606M151); 蚌埠学院自然科学基金项目(2011ZR11)
摘    要:为了发现分布式数据流环境下的微簇,针对数据流的遗忘特性,提出一种基于时间衰减的数据流聚类算法.根据衰减模型增量式的处理局部站点,将局部模型发送给中心站点.中心站点对局部站点的微簇进行合并,生成全局聚类模型.通过真实数据和仿真数据的实验表明,该算法能够得到较好的聚类质量,并且有较好的伸缩性.

关 键 词:分布式数据流  聚类  时间衰减  滑动窗口

Time-Attenuation-Based Distributed Data Stream Clustering Algorithm
Chen Chunyan Lv Junlong Guo Youqiang. Time-Attenuation-Based Distributed Data Stream Clustering Algorithm[J]. Journal of Taiyuan Normal University:Natural Science Edition, 2013, 0(2): 87-90
Authors:Chen Chunyan Lv Junlong Guo Youqiang
Affiliation:Chen Chunyan Lv Junlong Guo Youqiang (1. BengBu Medical College,Bengbu 233000; 2. Department of Computer Science and Technology,Benghu College,Benghu 233000 ,China)
Abstract:To find the clusters under the distributed data stream environment,in allusion to amnesic features of data stream, this paper proposed the time-attenuation-based data stream clustering algorithm. The algorithm updates incremental local model by attenuation function. Center site receives local summary structure and merges clusters from local site to get eventual clustering model. The experimental results on real and synthetic datasets demonstrate that the al- gorithm can get better clustering quality,and has good scalability.
Keywords:distributed data stream  clustering  time-recession  sliding windows
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号