首页 | 本学科首页   官方微博 | 高级检索  
     

基于K-Means算法的混合聚类算法研究
引用本文:叶飞,李欣冉. 基于K-Means算法的混合聚类算法研究[J]. 阜阳师范学院学报(自然科学版), 2012, 29(2): 66-68,85
作者姓名:叶飞  李欣冉
作者单位:1. 合肥工业大学信息工程学院,安徽合肥230002 六安职业技术学院信息工程系,安徽六安237005
2. 合肥工业大学机械与汽车工程学院,安徽合肥,230002
基金项目:安徽省高校省级自然科学研究项目
摘    要:在使用K-Means进行文本聚类的研究中,针对K-Means算法缺点,提出了利用DBSACN算法确定参数K的方法,将基于密度的聚类算法应用于特征选取上,使得K值计算有了一定的确定性,从而提高了聚类质量。这种将多种算法混合运用的方法,为文本聚类算法的设计提供一个新的方向。

关 键 词:数据挖掘  文本聚类  聚类算法  K-Means  DBSCAN

Research on Hybrid clustering algorithm based on K-Means algorithm
YE Fei,a,LI Xin-ran. Research on Hybrid clustering algorithm based on K-Means algorithm[J]. Journal of Fuyang Teachers College:Natural Science, 2012, 29(2): 66-68,85
Authors:YE Fei  a  LI Xin-ran
Affiliation:1b(1a.School of Computer and Information,1b.School of Mechanical and Automotive Engineering, Hefei University of Technology,Hefei Anhui 230002,China; 2.Department of Information Engineering,Lu’an College of Professional Technology,Lu’an Anhui 237005,China)
Abstract:In the K-Means document clustering for the shortcomings of the K-Means algorithm Document Clustering,it is proposed to use DBSCAN algorithm to determine the constant K,the density-based clustering algorithm in feature selection,making the determination of the K value no longer in randomness,thereby improving the quality of the clustering.The idea of this hybrid clustering algorithm provides a new direction for design of text clustering algorithm.
Keywords:Data Mining  Document Clustering  Clustering algorithm  K-Means  DBSCAN
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号