首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于功效散度和成对约束的半监督聚类算法(PD-s SC)将相对熵推广到功效散度(PD)族,剔除了目标函数中不同惩罚熵项之间的干扰,提高了惩罚项系数的选择效率。但当成对约束数目相对较大时,PD-s SC算法聚类效果不够理想。为了解决这个问题,提出了一种基于闭包准则的成对约束打包算法(CCPC),该算法利用must-link约束对原样本组进行打包,再利用各个包的中心点替代整个包,从而得到一组新样本,最后利用PD-s SC算法对新样本进行聚类分析。实验结果表明,无论成对约束数目是大还是小,CCPC算法都有很好的表现。  相似文献   

2.
聚类通常被认为是一种无监督的数据分析方法,在聚类搜索过程中充分利用先验信息会显著提高聚类算法的性能。本文通过成对约束来调整点与点之间的相似矩阵,然后对其优化,并结合谱聚类算法,得到一种很有效的聚类算法——基于成对约束的半监督谱聚类算法(SSCA)。实验表明,该算法有很好的聚类效果。  相似文献   

3.
一种基于半监督降维的聚类算法   总被引:1,自引:1,他引:0  
半监督聚类通过利用少量有标号样本或成对约束等监督信息来提高聚类性能.在此提出一种新颖的基于半监督降维的聚类算法,首先用半监督降维方法对原始数据进行降维,然后在降维后的空间中进行半监督聚类.由于在降维和聚类两个阶段中都利用了监督信息,从而使得算法的聚类性能得到进一步提升.在UCI标准数据集、yale人脸库以及文本数据集上的实验结果验证了该算法的有效性.  相似文献   

4.
提出了一种混合约束的半监督聚类算法HCSCAP,综合考虑了已标号点和成对点约束信息,使2类先验信息在聚类的过程中能发挥各自的作用.通过调整相似性矩阵添加成对点约束,已标号点以宏结点的方式添加到相似性矩阵.给出了具体的算法步骤并进行了测试,实验表明:HCSCAP比只利用成对点约束信息的SAP算法和只利用标号点的SS-CA...  相似文献   

5.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.  相似文献   

6.
针对中智C-均值聚类算法抗噪能力弱的问题,提出基于隐马尔科夫随机场的半监督中智聚类分割算法.利用隐马尔科夫随机场模型的先验信息描述图像像素邻域关系,将其与隶属度相结合作为监督因子,嵌入现有中智聚类并构造半监督中智聚类目标函数;将欧式空间样本通过非线性变换用核函数映射至高维特征空间,增强图像的抗干扰能力;最后采用最优化方法获得隐马尔科夫随机场的半监督核空间中智聚类分割的迭代表达式.对灰度图像添加高斯和椒盐噪声进行分割测试,以验证算法性能.测试结果表明:所建立的分割算法相比基于隐马尔科夫随机场的模糊C-均值聚类等分割算法的抗噪性能有了显著提高.  相似文献   

7.
针对半监督聚类算法中监督信息使用不充分,监督信息中信息含有量低的问题,提出一种结合主动学习的半监督聚类算法.首先结合使用数据的类别标记和成对约束信息,指导Kmeans聚类过程,设计出一种基于Seeds集和成对约束的半监督聚类算法SC-Kmeans;其次将主动学习算法引入到SC-Kmeans中,以尽量小的代价选取信息含有量更高的监督信息,提高SC-Kmeans算法的聚类精度;最后在UCI标准数据集上进行仿真实验.实验结果表明,该算法取得了较好的聚类效果,有效提高了聚类准确率.  相似文献   

8.
传统模糊C-means聚类(FCM,fuzzy C-means)在处理非平衡数据集时,由于相异类中所含样本数量差异较大,导致类间权值不平衡和"均匀效应",从而易产生聚类错误.另外,FCM属于无监督方法,无法更好地利用已知的部分类标记信息引导聚类.为解决这两方面问题,提出一种半监督的平衡化模糊C-means聚类(SBFCM,semi-supervised balanced fuzzy C-means)方法.SBFCM在FCM目标函数的基础上加入了对聚类模糊隶属度矩阵的近似正交约束和半监督约束,从而得到了新的聚类目标函数.实验结果表明,相比于FCM,SBFCM能有效缓解由"均匀效应"导致的聚类错误现象,并能有效地利用部分先验类标记信息,从而可获得更好的聚类效果.  相似文献   

9.
研究了基于偶对约束的半监督模糊聚类,将马氏距离引入到半监督模糊聚类SCAPC(semi-supervised fuzzy clustering algorithm with pairwise constraints)中,获得了一种新的半监督模糊聚类目标函数,通过求解优化问题,提出了一种基于偶对约束和马氏距离的半监督模糊聚类算法M-SCAPC(Modified-SCAPC).针对选择的标准数据集和人工数据集,对提出的算法M-SCAPC进行了实验研究,并与FCM(fuzzy C-means)、AFCC(active fuzzy constrained clustering)和SCAPC算法的聚类性能进行了比较,表明了提出的算法M-SCAPC在收敛速度和正确率方面的有效性.  相似文献   

10.
层次聚类算法是运行复杂度较高的聚类算法,基于不相似性测度的层次聚类算法不适合稀疏高维数据.结合核函数特点,提出了一种基于核函数的层次聚类算法.利用该算法,对稀疏高维数据进行了层次聚类对比,实验结果表明,该算法提高了层次聚类的准确率.  相似文献   

11.
基于模糊模式识别原理和核方法特性,提出了基于核的模糊聚类算法,用核目标函数取代模糊C均值中的目标函数,选用高斯核函数实例研究了模糊核聚类在遥感影像分类中 的应用。结果表明:与传统的模糊聚类算法相比,模糊核聚类算法能够有效改善遥感影像分类效果,从而拓宽了模糊模式识别的应用范围。  相似文献   

12.
为了提高对未知样本的使用率,充分发挥出半监督聚类算法的优势,ISFCA算法将约束项引入到竞争聚类算法(CA算法)的目标函数中。但在ISFCA算法的隶属度函数中,存在迭代的非必要信息,增加了算法的复杂度。改进了ISFCA算法的隶属度函数,提取出迭代的必要项uCA″rs和非必要项uCA′rs,从而简化隶属度迭代计算过程,使样本的聚类更加合理。实验结果表明,优化后的ISFCA算法对阀门的故障诊断是行之有效的。  相似文献   

13.
本文提出一种纠错式主动学习成对约束的方法,探讨了主动学习的停止条件,在较少的约束下可得到较好的聚类结果.通过在UCI基准数据集以及人工数据集的实验表明,在该学习策略下,半监督聚类算法的性能好于对比算法;在停止条件下,每个数据集的聚类结果都是可接受的.  相似文献   

14.
为获得分布式数据集上用户所期望的聚类结果,提出了基于约束信息的并行k-means聚类算法.在分析并行k-means能够有效实现对水平分布式数据集进行聚类的基础上,修改并行k-means算法的目标函数,设计约束并行k-means算法,将站点用户的约束信息以chunklet的形式引入到分布式聚类过程,从而引导算法执行有偏搜...  相似文献   

15.
利用少量的标记数据和约束辅助聚类过程,提出一种基于半监督聚类的入侵检测模型.实验结果表明,与基于监督和非监督学习的入侵检测算法相比,基于半监督聚类的入侵检测算法可以更加有效地检测出未知攻击.  相似文献   

16.
为了解决大量高维数据分类的问题,给出一种基于半监督判别最大熵模糊的聚类算法.该算法不仅继承了已有FLDA-MEFCA算法的降维优势,而且可以充分利用监督信息来提高聚类性能.实验证明该算法的总体性能优于最大熵模糊聚类算法、FLDA-MEFCA和经典FCM类算法.  相似文献   

17.
考虑到?1范数度量比?2范数平方度量更鲁棒,基于?1度量提出了一种更鲁棒的半监督图聚类模型,针对该模型中非光滑目标函数不易优化的问题,利用Majorization-Minimization框架提出了一种新的求解算法并证明了其收敛性.实验结果表明,在监督信息有噪声或错误时,所提出的模型能提高半监督聚类的鲁棒性和有效性.  相似文献   

18.
聚类是机器学习和数据挖掘中的重要课题。近年来,深度神经网络(Deep Neural Networks,DNN)在各种聚类任务中受到广泛关注。特别是半监督聚类,在大量无监督数据中仅引入少量先验信息即可显著提高聚类性能。然而,这些聚类方法忽略了定义的聚类损失可能破坏特征空间,从而导致非代表性的无意义特征。针对现有半监督深度聚类的特征学习过程中局部结构保持有所欠缺的问题,本文提出一种改进的半监督深度嵌入聚类(Improved Semi-supervised Deep Embedded Clustering,ISDEC)算法,采用欠完备自动编码器在特征表达学习的同时,保持数据的内在局部结构;通过综合聚类损失、成对约束损失和重构损失,对聚类标签分配和特征表达进行联合优化。在包括基因数据在内的若干高维数据集上的实验结果表明,本方法的聚类性能比现有方法更好。  相似文献   

19.
为了避免陷入梯度法局部极值以提升模糊聚类算法聚类性能,提出PSO高斯诱导核模糊C均值聚类算法(PSO Gauss-induced kernel fuzzy C-means clustering algorithm,PSO-GIKFCM)。首先将高斯核函数应用于模糊C聚类算法(FCM)目标函数,得到高斯核模糊聚类目标函数。然后在高斯核特征空间和输入空间利用梯度法得到两空间聚类中心,将特征空间聚类中心与样本的内积核矩阵代入输入空间聚类中心,从而得到高斯诱导核的聚类中心。最后在解空间利用粒子群算法(PSO)对模糊隶属度进行寻优估计,并结合目标函数和聚类中心构成PSO-GIKFCM参数估计迭代流程。PSO-GIKFCM算法基于粒子群算法保证其收敛性,聚类中心仅为模糊隶属度的函数,PSO生物进化算法在解空间全局寻找优解,且将模糊指标扩展为大于0的情况。通过仿真实验验证了所提出算法的有效性。  相似文献   

20.
为了提高降雨量插值精度,充分挖掘降雨变量信息,利用模糊熵聚类分析算法,对流域内雨量站进行模糊熵聚类研究,通过基于可能性分布和距离判定的聚类有效性函数确定模糊熵系数和聚类数,从而得到模糊聚类结果,改进原有的插值方法。以淮河流域蚌埠站以上区域99个雨量站雨量数据,分别在一般情况下和模糊熵聚类情况下做交叉验证,结果显示,模糊熵聚类分析在反距离平方插值法中对降雨精度有所提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号