首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于聚类算法的选择性神经网络集成   总被引:11,自引:0,他引:11  
为了提高集成个体的差异度,提出了一种利用聚类算法去除冗余个体的选择性集成方法,该方法通过使用神经网络作为基学习器,并在多值分类数据集上进行实验.结果表明,该技术计算效率高,精度与稳健性也与基于遗传算法的选择性集成方法相当甚至占优.  相似文献   

2.
柳炳祥 《科学技术与工程》2013,13(19):5536-5542
提出了一种新的基于双重采样的选择性集成学习算法。针对集成学习要求学习器个体的差异性分布在样本空间的不同部分,对得到的聚类个体学习器输出进行重采样,以此来计算聚类个体的差异性。针对集成学习要求得到的个体学习器具有一定的精确性,对所有得到的学习器个体集合进行重采样来评估聚类个体精确性。在此基础上选择出集成学习所需的个体集合。以谱聚类算法作为基学习器,用聚类集成策略部分解决了谱聚类算法存在的尺度参数敏感问题,在UCI数据集上的仿真实验验证了算法的有效性。  相似文献   

3.
聚类集成是聚类分析中的一个重要技术手段,能有效地提高聚类结果的准确性、鲁棒性和稳定性。利用现有的聚类准则提出了一个新的评价指标,用于基聚类结果的有效性评估,并把评估值作为基聚类结果的权重来进行加权聚类集成。在UCI真实数据集上对提出的基于聚类准则融合的加权聚类集成算法进行了测试,实验表明新提出的算法比已有的集成聚类算法具有更高的准确率和回收率,可以得到更好的集成聚类结果。  相似文献   

4.
聚类集成的目的是通过集成多个不同的基聚类来生成一个更好的聚类结果,近年来研究者已经提出多个聚类集成算法,但是目前仍存在的局限性是这些算法大多把每个基聚类和每个簇都视为同等重要,使聚类结果很容易受到低质量基聚类和簇的影响.为解决这个问题,研究者提出一些给基聚类加权的方法,但大多把基聚类看作一个整体而忽视其中每个簇的差异....  相似文献   

5.
基于图的标签传播算法是半监督学习中的研究热点之一,其性能很大程度依赖于图的质量.为了应对这一问题,文章提出了基于聚类的标签集成传播算法.该算法对样本集进行多次聚类,在每次聚类产生的簇中,利用互补熵度量簇内样本标签的混乱程度,并在混乱程度较小的簇中进行标签传播,当一个未标记样本获得某个标签的次数与聚类次数的比值大于50%...  相似文献   

6.
一种基于灰色聚类和模糊聚类的集成方法   总被引:2,自引:0,他引:2  
根据灰色聚类,模糊聚类,关联系数原理,提出一种新的综合集成方法,利用灰色关联系数将灰色聚类与模糊聚类集成,使聚类结果不仅反映了各聚类对象所属灰类的信息,还有效显化了各个对象间的相互关系的信息.  相似文献   

7.
赵晖 《科学技术与工程》2012,12(23):5797-5800
为了进一步提高网络入侵检测的效果,提出一种基于聚类集成的入侵检测算法。首先利用Bagging算法从训练集中生成多个训练子集。然后调用模糊C均值聚类算法训练并生产多个基本聚类器。然后利用信息论构造适应度函数。采用粒子群算法从上述聚类集体中获得一个具有最优性能的集成聚类器。仿真实验结果表明,该算法能有效的提高入侵检测的精度,具有较高的泛化性和和稳定性。  相似文献   

8.
针对大规模不确定性数据聚类,提出一种新的基于Spark的三支聚类集成方法.该方法包括3个步骤:首先,将现有的聚类算法进行基于Spark的分布式处理;然后,以第1个聚类成员的聚类结果作为参照划分,对剩余聚类成员中的类簇做标签对齐;最后,利用投票法以及三支决策规则对标签对齐后的聚类成员进行集成,得到最终的三支聚类结果.实验结果显示,本方法能够有效处理大规模不确定性数据,相比传统基于Spark的聚类算法效率更高.  相似文献   

9.
深度聚类在高维较大数据集中应用广泛,得益于神经网络强大的数据特征提取能力,但目前的深度聚类特征提取一般集中在神经网络的中间层,忽略了浅层特征的有用信息.为解决上述问题,提出一种基于神经网络多层特征提取的集成聚类算法(Deep Ensemble Clustering Based on Multi-Level Features,DCMLF),使用三个只有卷积层数不同而其他参数相同的网络结构提取同一个输入的不同层次特征,并进行集成聚类.通过不同层次特征组合实验验证浅层特征对聚类结果的影响,并证明该算法同经典的传统聚类算法以及经典的深度聚类算法相比,聚类性能有所提升.  相似文献   

10.
研究了基于聚类技术提高分类器差异性的方法.通过Bootstrap技术与分类器学习算法训练分类器模型,利用分类器在验证集上的分类结果作为聚类的数据对象;然后应用聚类算法对这些数据聚类,并在每个簇中选择分类器代表模型,以此构成集成学习的成员;最后应用融合方法实验研究了基于聚类技术提高差异性的集成学习性能,并与集成学习方法bagging,adaboost进行了实验比较.  相似文献   

11.
针对现有的集成聚类算法通常默认使用K-means算法作为基聚类生成器,虽能确保聚类成员的多样性,却忽视了差的基聚类可能会对最终聚类结果造成极大干扰的问题,提出一种基于聚类质量的两阶段集成算法.鉴于K-means算法运行高效但聚类质量较粗糙,提出首先在生成阶段采用K-means算法生成基聚类成员,然后通过群体一致性度量筛选出兼具高质量和强多样性的聚类成员,形成候选集成;其次,进一步在集成阶段应用信息熵知识构建基聚类加权的共协矩阵;最后应用一致函数得到最终聚类结果.采用3个指标在10个真实数据集上进行对比实验,实验结果表明,该算法在有效提升聚类结果准确度的同时,能保持较好的鲁棒性.  相似文献   

12.
启发式聚类算法的搜索空间中布满了局部极小值"陷阱",从而使得算法容易过早收敛而无法获得高质量聚类结果.文章给出了一种噪声启发式聚类算法NHCA (Noising Heuristic Clustering Algorithm),该算法在搜索空间中增加一组由强至弱的噪声来扩大启发式搜索的局部范围,以保持搜索空间的多样性,达到避免局部极小值影响和提高聚类质量的目的.大量实验结果表明,噪声法对提高启发式聚类算法质量是十分有效的.  相似文献   

13.
将基聚类与原数据看作一个混合型数据,提出了一种基于混合型数据表示的聚类集成算法.该算法通过不断迭代更新以获得更好的基聚类,且结果保持了对原数据类结构和基聚类的一致性.与其他聚类集成算法进行了比较,结果表明,基于混合型数据表示的聚类集成算法是有效的.  相似文献   

14.
聚类集成是集成学习中的一个重要分支,其目标是解决无监督聚类分析中聚类算法的选择性、偏差性与数据特殊性等导致聚类结果不理想的问题。文章提出了一种基于数据关联的聚类集成方法(CEBDR),该算法先提取出在聚类成员中体现有关联关系的数据对象来组成新的类,然后对这些类进行二次聚类得到最终的集成结果。文中选用了一些标准数据集,采用CEBDR算法、已有的基聚类和聚类集成算法来进行对比实验,实验结果表明,该算法能够有效地提高聚类质量。  相似文献   

15.
谱聚类是利用样本数据集的相似性矩阵中特征向量的性质对样本数据集进行聚类.而随着数据规模的增加,谱聚类算法所耗时间会因为大规模的特征分解而明显增大.采用抽样方法可以有效降低算法所耗时间,但是简单随机抽样子集之间关联性太弱,通常无法准确反映数据集的分布特征.基于此,设计了一种新的抽样策略,利用该方法进行多次抽样,生成多个既具有关联性又具有差异性的数据子集.在每个数据子集上分别利用NJW算法(由Ng A Y、Jordom M I和Weiss Y提出)进行谱聚类,并根据最近邻原则将聚类结果映射到全体数据集,生成若干基聚类,最后,将聚类结果集成,得到最终的聚类划分.实验证明,该方法与传统NJW算法以及简单抽样集成算法相比,算法的效率及有效性有了一定的提高.  相似文献   

16.
收集大量网站的包含30个特征属性的数据,用k-means属性聚类方法将特征属性划分为不同类别,利用不同类别中的属性数据训练基础分类器,通过集成各基础分类器的结果对未知网站进行预测.采用简单投票和贝叶斯投票对结果进行组合预测,结果表明,k-means属性聚类方法大大增加了基础分类器的差异性,提高了分类检测的精度,其中基于贝叶斯投票策略的集成模型具有很高的检测精度.  相似文献   

17.
基于集成学习的思想,提出一种分布式聚类模型.该模型的分布式处理过程分为2个阶段:先在局部站点局部聚类,然后在全局站点全局聚类.局部站点的局部聚类看作是一种基于数据子集的学习过程,所有的局部聚类结果组成了聚类集成系统的个体学习器,全局聚类采用平均法对局部结果进行集成,并定义了一个准则函数来度量集成的精度.把K-means算法推广到分布式环境,提出一种基于该模型的分布式K均值算法DK-means,该算法对局部数据的分布有较强的伸缩性.实验结果表明,DK-means在同等条件下能达到集中式聚类的精度水平,是有效可行的,从而验证了基于集成学习的分布式聚类模型的有效性.  相似文献   

18.
当前,情感识别已经成为情感计算中一个重要研究问题。传统的情感识别方法有人工神经网络(ANN)的 情感识别、模糊集的情感识别、支持向量机的情感识别和隐马尔可夫模型(HMM)的情感识别等。将选择性集成的 方法应用到情感识别中,该方法通过训练数据集的随机数抽取、训练,得到一批候选分类器,并通过差异性计算,挑选出大于平均差异性水平的分类器用来做最终情感识别。实验表明,该方法比传统的识别方法以及bagging集成 方法的效果都好,能有效地提高情感识别的精度。  相似文献   

19.
为同时保证基分类器的准确性和差异性, 提出一种基于聚类和AdaBoost的自适应集成算法. 首先利用聚类算法将训练样本分成多个类簇; 然后分别在每个类簇上进行AdaBoost训练并得到一组分类器; 最后按加权投票策略进行分类器的集成. 每个分类器的权重是自适应的, 且为基于测试样本与每个类簇的相似性及分类器对此测试样本的分类置信度计算得到. 实验结果表明, 与AdaBoost,Bagging(bootstrap aggregating)和随机森林等代表性集成算法相比, 该算法可取得更高的分类精度.  相似文献   

20.
启发式聚类算法具有收敛速度快、易实现等优点,但初始解敏感,严重影响了聚类算法的质量。针对这一问题,提出了一种烟花搜索导向的多路启发式聚类算法。该算法通过多次调用经典启发式聚类算法,产生多个局部最优解;在搜索空间中以多个局部最优解为搜索起点,采用烟花搜索进行多路搜索;基于信息熵浓度设计烟花选择算子确定搜索方向;再经过变异、映射、偏移算子变换局部最优中心点,以发现质量更好的搜索起点;直至算法收敛获得新的搜索起点;最终以新的搜索起点调用经典启发式聚类算法获得高质量聚类结果。实验结果表明,烟花搜索导向的多路启发式聚类算法在不同数据集上的聚类质量明显高于对比其他聚类算法的聚类质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号