首页 | 本学科首页   官方微博 | 高级检索  
     检索      

MapReduce框架下基于抽样的分布式K-Means聚类算法
引用本文:杨杰明,吴启龙,曲朝阳,杨烁,阚中峰,高冶.MapReduce框架下基于抽样的分布式K-Means聚类算法[J].吉林大学学报(理学版),2017,55(1):109-115.
作者姓名:杨杰明  吴启龙  曲朝阳  杨烁  阚中峰  高冶
作者单位:1. 东北电力大学 信息工程学院, 吉林 吉林 132012; 2. 国网吉林供电公司 信息通信分公司, 吉林 吉林 132000
摘    要:提出一种MapReduce框架下基于抽样的分布式K-Means聚类算法,解决海量数据环境下并行执行K-Means算法时,时间开销较大的问题.该算法使用抽样方法,在保证数据分布不变的前提下,对数据集的规模进行约减,并在MapReduce框架下对聚类算法进行优化.实验结果表明,该算法在保持良好聚类效果的同时,能有效缩短聚类时间,对大规模数据集具有较高的执行效率和较好的可扩展性.

关 键 词:抽样  MapReduce  分布式计算  K-Means聚类算法  
收稿时间:2016-05-18
本文献已被 CNKI 等数据库收录!
点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号