首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
基于集成学习的思想,提出一种分布式聚类模型.该模型的分布式处理过程分为2个阶段:先在局部站点局部聚类,然后在全局站点全局聚类.局部站点的局部聚类看作是一种基于数据子集的学习过程,所有的局部聚类结果组成了聚类集成系统的个体学习器,全局聚类采用平均法对局部结果进行集成,并定义了一个准则函数来度量集成的精度.把K-means算法推广到分布式环境,提出一种基于该模型的分布式K均值算法DK-means,该算法对局部数据的分布有较强的伸缩性.实验结果表明,DK-means在同等条件下能达到集中式聚类的精度水平,是有效可行的,从而验证了基于集成学习的分布式聚类模型的有效性.  相似文献   

2.
针对现有的集成聚类算法通常默认使用K-means算法作为基聚类生成器,虽能确保聚类成员的多样性,却忽视了差的基聚类可能会对最终聚类结果造成极大干扰的问题,提出一种基于聚类质量的两阶段集成算法.鉴于K-means算法运行高效但聚类质量较粗糙,提出首先在生成阶段采用K-means算法生成基聚类成员,然后通过群体一致性度量筛选出兼具高质量和强多样性的聚类成员,形成候选集成;其次,进一步在集成阶段应用信息熵知识构建基聚类加权的共协矩阵;最后应用一致函数得到最终聚类结果.采用3个指标在10个真实数据集上进行对比实验,实验结果表明,该算法在有效提升聚类结果准确度的同时,能保持较好的鲁棒性.  相似文献   

3.
聚类集成的目的是通过集成多个不同的基聚类来生成一个更好的聚类结果,近年来研究者已经提出多个聚类集成算法,但是目前仍存在的局限性是这些算法大多把每个基聚类和每个簇都视为同等重要,使聚类结果很容易受到低质量基聚类和簇的影响.为解决这个问题,研究者提出一些给基聚类加权的方法,但大多把基聚类看作一个整体而忽视其中每个簇的差异.受到信息熵的启发,提出一种基于信息熵加权的聚类集成算法.算法首先对每个簇的不稳定性进行衡量,然后提出一种基于信息熵的簇评价指标,进而从簇层面进行加权,在对加权矩阵进行划分后得到最终的聚类结果 .该算法有两个主要优点:第一,提出了一个有效的簇评价性指标;第二,从比基聚类层面更细化的簇层面进行加权.一系列的实验证明了该算法的有效性和鲁棒性.  相似文献   

4.
针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法.算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度值与实际物理坐标的双重影响,以避免参考点分类不明确;根据每个测试点的匹配参考点之间实际距离的均值和标准差设置阈值,动态选择K值.实验结果证明,改进K-means聚类的自适应加权K近邻算法相较于传统室内定位算法定位精度提高了44%,可为相关应用提供更精确的定位服务.  相似文献   

5.
基于K均值的带变异粒子群聚类算法   总被引:1,自引:0,他引:1  
针对K均值算法的搜索结果依赖于初始聚类中心以及粒子群算法早熟收敛的缺点,提出了一种基于K均值的带变异粒子群聚类算法.该算法通过粒子群算法来弥补K均值算法的不足,根据粒子的收敛情况判断K均值操作的时机,提高了搜索性能,并采用变异操作来跳出局部极值.分别用K均值算法、PSO-K均值算法和该算法对3种实际数据进行了聚类测试,...  相似文献   

6.
基于局部线性嵌入的半监督仿射传播聚类算法   总被引:1,自引:0,他引:1  
针对运用半监督仿射传播聚类算法处理高维数据时聚类精度低和计算量大的问题,提出一种基于局部线性嵌入的半监督仿射传播聚类算法.该算法首先通过LLE算法将高维输入数据集映射到低维空间得到低维数据集,计算低维数据集的相似度矩阵,再用半监督算法调整相似度矩阵,最后用仿射传播聚类算法对低维数据进行聚类分析.仿真结果表明,本文提出的算法与半监督仿射传播聚类算法相比,在处理高维数据时聚类效果更好,精度更高,迭代次数更少.  相似文献   

7.
基于免疫粒子群的K均值聚类算法   总被引:2,自引:0,他引:2  
粒子群算法是一类高效求解连续函数优化的随机搜索算法,在K均值聚类算法中得到广泛应用,但是在群体进化后期容易陷入局部极值,针对算法缺点,提出了一个新的聚类算法--基于免疫过程的粒子群K均值聚类算法,并将此算法与K均值聚类算法和粒子群K均值聚类算法进行比较.理论分析和数据实验证明,该算法有较好的全局收敛性,不仅能有效的克服传统的K均值聚类陷入局部极小值的缺点,而且全局收敛能力优于基于粒子群的K均值聚类算法.  相似文献   

8.
为了解决传统K均值算法在处理大规模数据时的局限性,在近似K均值算法(AKM)基础之上,利用对聚类中心进行分类的思想,提出了快速近似K均值算法(FAKM).该算法舍去了在AKM聚类结果中只获得少数样本的聚类中心,并充分利用类内样本密集稳定的聚类中心,使得迭代过程中待聚类样本数和类别数逐步减少,达到了提高算法速度及精简聚类结果的目的.将FAKM算法运用于实际的图像检索系统中,实验结果表明,系统在检索准确率、检索时间和聚类时间方面都得到了很好的改善.  相似文献   

9.
针对K均值聚类算法易陷入局部最小的缺点,提出了一种多种群协同进化的微粒群和K均值混合聚类算法,它将整个种群分解为多个子种群,各子种群独立进化,周期性地更新共享信息.同时将此算法与现有的基于遗传算法的K均值聚类算法进行了比较.实验结果证明,该算法能有效地克服传统的K均值算法易陷入局部极小值的缺点,同时全局收敛能力优于基于遗传算法的K均值聚类算法.  相似文献   

10.
在K均值算法中, 对于随机的初始值选取可能会导致不同的聚类结果,甚至存在着无解的情况;还有该算法是基于梯度下降的算法,因此不可避免地常常陷入局部极优.针对K均值聚类算法存在的缺点,提出了一种新的聚类算法--基于粒子群的K均值聚类算法,理论分析和实验表明该算法有较好的全局收敛性,能有效地克服传统的K均值算法易陷入局部极小值的缺点,采用改进后聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持.  相似文献   

11.
手写数字识别中组合式神经网络的构建方法   总被引:3,自引:0,他引:3  
将聚类技术和遗传算法相结合, 提出一种基于相似度传播算法和遗传算法的神经网络集成方法应用于手写数字识别问题. 先分别利用主成分分析和Fisher线性判别分析对数据集进行特征提取, 得到两类特征数据集, 再利用Bagging方法分别为这两类特征数据集训练简单的BP神经网络, 然后采用相似度传播算法对这些BP神经网络进行聚类, 找到作为类簇中心的网络(中心网络), 最后利用遗传算法对所有中心网络的权值进行训练, 将中心网络进行加权线性集成作为最终分类器. 在标准手写数字数据集MNIST上进行测试的实验结果表明, 该方法的识别率优于单个神经网络的识别率, 并兼顾了分类效率.  相似文献   

12.
基于粗糙集理论的聚类融合加权迭代模型   总被引:1,自引:0,他引:1  
针对聚类融合问题,考虑了聚类成员的质量和噪声对聚类结果的影响,提出一种加权迭代的聚类融合模型,利用粗糙集理论中的决策表属性重要性的信息熵来衡量聚类成员的重要性,迭代更新聚类成员的权重。该文在模拟和真实数据集上进行了校验。结果表明,该模型能较好地处理聚类成员间的质量差异,并能有效地消减噪声对融合的影响,从而得到更好的聚类融合结果。  相似文献   

13.
针对战场环境下通信质量较低的问题,提出了一种基于加权的具有相同移动特性的车载自组网分簇算法。首先通过对移动节点的速度相似度和距离相似度进行计算,将具有相同移动特性且距离相近的节点分为同一个簇,并设置每个分簇中簇成员的最大阈值;计算移动节点的速度因子、距离因子和平均链路维持率,并在分簇中对每个移动节点的这3个因素进行加权,选取权值最大的作为首要簇头,权值第二大的作为次要簇头,首要簇头失效时次要簇头充当主要簇头角色,且主要簇头给每个成员分配了TDMA时隙,提高了通信质量。仿真实验结果表明:与WCA算法和WBACA算法相比,该分簇算法在簇结构的稳定性和分组投递率方面都有较大的改善。  相似文献   

14.
为同时保证基分类器的准确性和差异性, 提出一种基于聚类和AdaBoost的自适应集成算法. 首先利用聚类算法将训练样本分成多个类簇; 然后分别在每个类簇上进行AdaBoost训练并得到一组分类器; 最后按加权投票策略进行分类器的集成. 每个分类器的权重是自适应的, 且为基于测试样本与每个类簇的相似性及分类器对此测试样本的分类置信度计算得到. 实验结果表明, 与AdaBoost,Bagging(bootstrap aggregating)和随机森林等代表性集成算法相比, 该算法可取得更高的分类精度.  相似文献   

15.
传统-means聚类算法的性能依赖于初始聚类中心的选择.本文将复杂网络节点的属性值作为节点的度、聚集度与聚集系数的加权值,通过计算所有节点的加权综合聚集特征值,选取综合聚集特征值高,并且彼此之间无高聚集性特征的K个节点作为聚类的初始聚类中心,然后进行聚类迭代过程.实验结果表明,新算法对初始聚类中心的选取更迅速有效,避免了传统K-means算法初始聚类节点选取的敏感性,进而提高K-means算法的聚类质量.  相似文献   

16.
加权数据融合算法及其应用举例   总被引:10,自引:3,他引:10  
建立了一种基于格罗贝斯(Grubbs)准则和聚类分析的加权数据融合算法,即先用格罗贝斯准则剔除所测数据中的疏失误差数据,再用聚类分析的方法对剔除疏失误差数据后的测量数据进行聚类,并由此确定各类别的权数(加权因子),最后利用所得权数进行加权融合得出被测对象的融合估计值。实验证明,该算法简单有效,且适合计算机编程。  相似文献   

17.
针对利用遗传算法解决参数维度高、 计算复杂, 且适应度依赖于其他工具的问题, 提出一种加快遗传算法收敛速度的聚集算子. 该算子首先利用AP(affinity propagation)聚类对种群进行划分, 然后通过主成分分析(PCA)对每个聚簇降维, 再利用加权最小二乘法在低维空间下将种群分布拟合成二次曲面, 并将计算极值点作为优势个体返回到原始空间. 实验结果表明, 相比于传统遗传算法, 聚集算子在保证优化精度的同时可有效提高收敛速度.  相似文献   

18.
陈宇  张勇  陈实 《北京理工大学学报》2021,41(11):1188-1192
针对平面管理结构在大规模卫星集群网络中的缺点,提出了一种自适应分布式加权分簇算法(adaptive distributed weighted clustering algorithm,ADWCA),该算法根据卫星网络运行的可预测性,在初始化阶段由地面计算各卫星节点综合权值并划分簇首和成员节点,完成之后上注到星上,之后集群中卫星节点根据邻居及自身信息完全分布式地执行维护进程.仿真分析表明,与最小标识优先分簇算法和最大连接度优先分簇算法相比,该算法生成的簇结构具有更少的簇数量、良好的稳定性,且能够有效均衡簇头节点的负载.   相似文献   

19.
在AdaBoost集成方法的基础上,研究了一种产生式与判别式模型组合的方法。该算法在每轮中同时学习一个产生式分类器和一个判别式分类器,选择误差率较小的作为个体分类器,然后对所有个体分类器采用加权的方法得到最终分类器。实验结果表明,该方法在准确率和收敛速度上都具有很好的效果。  相似文献   

20.
基于提供的11种聚类外部指标来组合多个聚类,通过单个对象的簇标记变化递增地更新目标函数来求出共识聚类,并利用模拟退火优化算法框架来解决局部最优问题。在UCI和TREC数据库中选取10个数据集进行几种算法的外部指标聚类性能评估实验,从实验数据的归一化角度和排序角度评估不同外部指标的聚类性能,结果表明:MSS3指标从整体性能表现上最适合用于引导聚类集成,可以作为算法默认的共识函数;基于模拟退火优化算法的聚类集成算法在7个数据集上优于其他聚类方法,而DBSCAN、MCLA、Kmearns算法则在其余3个数据集上表现最好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号