首页 | 本学科首页   官方微博 | 高级检索  
     

基于共享最近邻密度的演化数据流聚类算法
引用本文:高兵,张健沛,邹启杰. 基于共享最近邻密度的演化数据流聚类算法[J]. 北京科技大学学报, 2014, 0(12): 1703-1711
作者姓名:高兵  张健沛  邹启杰
作者单位:1. 哈尔滨工程大学计算机科学与技术学院,哈尔滨150001; 大连东软信息学院计算机系,大连116023
2. 哈尔滨工程大学计算机科学与技术学院,哈尔滨,150001
基金项目:国家自然科学基金资助项目
摘    要:现有的基于密度的数据流聚类算法难于发现密度不同的簇,难于区分由若干数据对象桥接的簇和离群点.本文提出了一种基于共享最近邻密度的演化数据流聚类算法.在此算法中,基于共享最近邻图定义了共享最近邻密度,结合数据对象被类似的最近邻对象包围的程度和被其周围对象需要的程度这两个环境因素,使聚类结果不受密度变化的影响.定义了数据对象的平均距离和簇密度,以识别离群点和簇间的桥接.设计了滑动窗口模型下数据流更新算法,维护共享最近邻图中簇的更新.理论分析和实验结果验证了算法的聚类效果和聚类质量.

关 键 词:数据流  聚类算法  最近邻  离群点  数据挖掘

Evolving data stream clustering algorithm based on the shared nearest neighbor density
GAO Bing,ZHANG Jian-pei,ZOU Qi-jie. Evolving data stream clustering algorithm based on the shared nearest neighbor density[J]. Journal of University of Science and Technology Beijing, 2014, 0(12): 1703-1711
Authors:GAO Bing  ZHANG Jian-pei  ZOU Qi-jie
Affiliation:GAO Bing;ZHANG Jian-pei;ZOU Qi-jie;College of Computer Science and Technology,Harbin Engineering University;Department of Computer,Dalian Neusoft Information College;
Abstract:
Keywords:data streams  clustering algorithms  nearest neighbors  outliers  data mining
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号