首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Hadoop的分布式聚类算法研究
引用本文:吴德超,刘晓红,曲志坚.基于Hadoop的分布式聚类算法研究[J].山东理工大学学报,2018(4).
作者姓名:吴德超  刘晓红  曲志坚
作者单位:山东理工大学计算机科学与技术学院
摘    要:基于工业领域广泛用到的Hadoop分布式计算平台,使用Canopy+K-means算法对手写数字进行聚类研究.针对传统Canopy算法初始阈值的确定问题,引入"最大最小化原则"确定初始阈值,计算得到K-means算法所需的初始聚类中心点.实验结果表明,Canopy算法能够较大程度地提高K-means算法的正确率.

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号