MapReduce框架下基于抽样的分布式K-Means聚类算法 |
| |
引用本文: | 杨杰明,吴启龙,曲朝阳,杨烁,阚中峰,高冶.MapReduce框架下基于抽样的分布式K-Means聚类算法[J].吉林大学学报(理学版),2017,55(1):109-115. |
| |
作者姓名: | 杨杰明 吴启龙 曲朝阳 杨烁 阚中峰 高冶 |
| |
作者单位: | 1. 东北电力大学 信息工程学院, 吉林 吉林 132012; 2. 国网吉林供电公司 信息通信分公司, 吉林 吉林 132000 |
| |
摘 要: | 提出一种MapReduce框架下基于抽样的分布式K-Means聚类算法,解决海量数据环境下并行执行K-Means算法时,时间开销较大的问题.该算法使用抽样方法,在保证数据分布不变的前提下,对数据集的规模进行约减,并在MapReduce框架下对聚类算法进行优化.实验结果表明,该算法在保持良好聚类效果的同时,能有效缩短聚类时间,对大规模数据集具有较高的执行效率和较好的可扩展性.
|
关 键 词: | 抽样 MapReduce 分布式计算 K-Means聚类算法 |
收稿时间: | 2016-05-18 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息 |
| 点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文 |
|