首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向数据密集型计算环境的聚类算法
引用本文:钱鑫,张龙波,田爱奎,邓齐志,汪金苗. 一种面向数据密集型计算环境的聚类算法[J]. 济南大学学报(自然科学版), 2013, 0(1): 11-15
作者姓名:钱鑫  张龙波  田爱奎  邓齐志  汪金苗
作者单位:山东理工大学计算机科学与技术学院
基金项目:山东省自然科学基金(ZR2011FL013)
摘    要:针对数据密集型计算环境下数据具有海量、分布、异构、高速变化等特点,分析传统的基于密度的分布式聚类(Density Base Distributed Clustering,DBDC)算法,借助MapReduce编程模型,提出一种新的分布式聚类算法,采用局部和全局的方式处理海量、异构数据,解决具有以上特点的数据密集型计算环境下数据的分析挖掘问题。得出算法的复杂度为O((nlog2n)/p),实验验证在数据量与节点数变化时算法具有较高的稳定性和可伸缩性,与原算法对比该算法具有较高的准确度。

关 键 词:数据密集型计算  分布式聚类  基于密度的分布式聚类算法

A Clustering Algorithm for Data-Intensive Computing Environments
QIAN xin,ZHANG Longbo,TIAN Aikui,DENG Qizhi,WANG Jinmiao. A Clustering Algorithm for Data-Intensive Computing Environments[J]. Journal of Jinan University(Science & Technology), 2013, 0(1): 11-15
Authors:QIAN xin  ZHANG Longbo  TIAN Aikui  DENG Qizhi  WANG Jinmiao
Affiliation:(School of Computer Science and Technology, Shandong University of Technology,Zibo 255000,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号