基于云计算的并行k-means算法研究 |
| |
引用本文: | 林长方,黄仲开,曾少俊.基于云计算的并行k-means算法研究[J].齐齐哈尔大学学报(自然科学版),2014(5). |
| |
作者姓名: | 林长方 黄仲开 曾少俊 |
| |
作者单位: | 漳州卫生职业学院信息技术部; |
| |
基金项目: | 福建省教育厅基金项目(JB12312) |
| |
摘 要: | 针对传统k-means聚类算法面对海量数据存在时间复杂度急剧增加的问题,结合云计算的优势,提出基于MapReduce编程框架来实现k-means聚类算法的并行化处理。Map函数完成每个样本记录到聚类中心的距离计算并标记其所属聚类类别,Reduce函数汇总中间结果并计算出新的聚类中心,供下一轮迭代使用。通过实验表明:基于MapReduce的并行化k-means聚类算法具有较好的加速比和良好的扩展性。
|
关 键 词: | 云计算 数据挖掘 并行k-means MapReduce |
本文献已被 CNKI 等数据库收录! |
|