首页 | 本学科首页   官方微博 | 高级检索  
     

基于半监督K-means的K值全局寻优算法
引用本文:孙雪,李昆仑,胡夕坤,赵瑞. 基于半监督K-means的K值全局寻优算法[J]. 北京交通大学学报(自然科学版), 2009, 33(6)
作者姓名:孙雪  李昆仑  胡夕坤  赵瑞
作者单位:河北大学,电子信息工程学院,河北,保定,071002;河北大学,工商学院,河北,保定,071000
基金项目:国家自然基金资助项目,河北省科技支撑计划项目资助,河北省教育厅科研计划项目资助 
摘    要:提出一种基于半监督K-means的K值全局寻优算法,该算法打破传统方法中采用样本类别作为K值的限定,利用少量标记数据即可指导和规划大量无监督数据.结合数据集自身的分布特点及聚类后各个簇内的监督信息,根据投票方法来指导簇中数据集的类别标记.实验表明,本文所提出的方法可以有效的寻找适合数据集的最佳K值和聚类的中心,提高聚类性能.

关 键 词:半监督聚类  constrained-K均值  K均值算法  投票  阈值

Global Optimising K Value for Semi-Supervised K-means Algorithm
SUN Xue,LI Kunlun,HU Xikun,ZHAO Rui. Global Optimising K Value for Semi-Supervised K-means Algorithm[J]. JOURNAL OF BEIJING JIAOTONG UNIVERSITY, 2009, 33(6)
Authors:SUN Xue  LI Kunlun  HU Xikun  ZHAO Rui
Affiliation:SUN Xue1,LI Kunlun1,HU Xikun2,ZHAO Rui1(1.College of Electronic , Information Engineering,Hebei University,Baoding Hebei 071002,China,2.Industral & Commercial College,Baoding Hebei 071000,China)
Abstract:In this paper,we propose a global optimising K value for semi-supervised K-means algorithm.It has broken the limits that traditional methods have in selecting samples as the K value.It can direct and plan a great amount of supervision data by using only a small amount of labled data.Combining the distribution characteristics of data sets and monitoring information in each cluster after clustering,we use the voting rule to guide the cluster labeling in the data sets.The experiments show that the method propo...
Keywords:semi-supervised clustering  constrained-Kmeans  K-means  voting  threshold
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号