首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
一种改进的全局K-均值聚类算法   总被引:3,自引:0,他引:3  
将快速K中心点聚类算法确定初始中心点的思想应用于全局K-均值聚类算法,对其选取下一个簇的最佳初始中心的方法进行改进,提出选取下一个簇的最佳初始中心的一种新方法.该新方法选择一个周围样本分布相对密集,且距离现有簇的中心比较远的样本为下一个簇的最佳初始中心,得到一种改进的全局K-均值聚类算法.改进后的算法不仅可以避免将噪音点作为下一个簇的最佳初始中心点,而且在不影响聚类效果的基础上缩短了聚类时间.通过UCI机器学习数据库数据以及随机生成的人工模拟数据实验测试,证明改进的全局K-均值聚类算法与全局K-均值聚类算法及快速全局K-均值聚类算法相比在聚类时间上更优越.  相似文献   

2.
基于改进K-均值聚类的图像分割算法研究   总被引:3,自引:0,他引:3  
为了实现彩色图像的准确分割,研究了在HLS颜色空间中基于优化初始中心的加权K-均值彩色图像聚类算法.首先对大样本的目标颜色进行数理统计,获取优化的初始聚类中心,从而实现准确分类和避免K-均值容易陷入局部最优的问题;然后在HLS颜色空间中引入加权欧氏距离来度量对象间的相关性,通过调整系数使对象不同的颜色属性内在特征得以充分利用.实验证明,该算法在保持K-均值聚类简洁、收敛速度快的同时能产生更好的聚类效果,实现彩色图像的快速准确分割.  相似文献   

3.
针对K-均值聚类算法存在的不足,提出了一种新的整合粒子群优化算法(PSO)和K-均值算法的聚类算法.在新算法中,首先结合使用粒子群优化算法和K-均值算法搜索全局最优解的位置,然后再用K-均值算法在全局最优解附近的局部空间内快速寻找最优聚类中心.通过对4个数据集的实验测试,将此算法与K-均值算法、基于粒子群的K-均值算法进行了比较.实验结果表明,新算法的聚类质量比后两个算法更优.  相似文献   

4.
针对传统K-均值方法不能有效处理动态变化的数据聚类的问题,本文提出了一种改进的数据流聚类技术——流式K-均值聚类(Streaming K-means Clustering,SKC).该方法首先对数据流中已经产生的初始数据块进行K-均值聚类,当数据流的新数据块到来时,通过衡量已经得到的聚类结果与新进入样本块的距离,对样本进行初步简单归类,并计算聚类结果的性能,若聚类结果性能在可接受范围内,则该数据块聚类结束,否则采用K-均值方法对新类进行深层次聚类.采用SKC的流式数据聚类方法处理数据流的聚类问题,对于整个数据流中的多数数据块都进行简单归类,只有少数数据块进行K-均值聚类,有效提高了数据流聚类的效率.实验结果表明,流式K-均值聚类方法能够有效处理数据流的聚类问题.  相似文献   

5.
基因聚类分析中数据预处理方式和相似度的选择   总被引:6,自引:0,他引:6  
聚类分析是基因表达数据分析研究的主要技术之一.选择恰当的数据预处理方式和相似性度量,是获得高质量聚类结果的前提.采用具有外部标准的基因表达数据集,分别以Pearson相关系数和Euclidean距离为相似度,以校正的Rand 指数比较了使用分层聚类、K-均值聚类和SOMs聚类算法对经过行标准化、列标准化和对数化处理后数据的基因聚类质量.结果表明:K-均值聚类和SOMs聚类质量显著优于分层聚类,SOMs聚类质量稍好于K-均值聚类.而且,分层聚类偏好于Pearson相关系数准则和行标准化处理,而应用K-均值聚类和SOMs算法时,则最好是对数据进行对数化处理、并以Euclidean距离为相似性度量准则.上述研究结论将为基因表达聚类分析的实施提供有价值的参考依据.  相似文献   

6.
目的利用粒子群优化算法和K-均值方法研究彩色图像的量化问题。方法针对K-均值聚类量化算法对初始值比较敏感,易陷入局部极小值从而使得算法得不到全局最优解,为局部搜索算法,以及粒子群优化算法是一种全局寻优方法的特征,把K-均值聚类方法和粒子群优化算法结合起来,将K-均值聚类方法中的聚类函数作为粒子群优化算法中的粒子适应度函数,对彩色图像进行聚类量化。结果实验表明新算法在峰值信噪比和均方根误差评判准则下可以得到更好的量化结果。结论新方法有效地克服了K-均值聚类方法和粒子群优化算法的不足。  相似文献   

7.
基于SOFM网络的改进K-均值聚类算法   总被引:1,自引:0,他引:1  
针对传统的K-均值聚类算法中随机选取初始聚类中心的缺陷,提出一种改进的K-均值聚类算法,利用自组织特征映射网络(SOFM)自动获得初始聚类中心.实验结果表明,改进的K-均值聚类算法能有效改善聚类性能,提高聚类的准确率.  相似文献   

8.
K-均值算法是一种传统的聚类分析方法,具有思想与算法简单的特点,因此成为聚类分析的常用方法之一。但K-均值算法的分类结果过分依赖于初始聚类中心的选择,对于某些初始值,该算法有可能收敛于一般次优解,在分析K-均值算法和粒子群算法的基础上,提出了一种基于邻域影响的改进的粒子群算法的聚类算法,通过对粒子群算法的改进来优化与K-均值结合的聚类算法。该算法将局部搜索能力强的K-均值算法和全局搜索能力强的粒子群算法结合,提高了K-均值算法的局部搜索能力、加快收敛速度,有效阻止了早熟现象的发生,达到那些离群的孤立点。实验表明该聚类算法有更好的收敛效果,一方面聚类所用的时间更短,另一方面聚类的准确率更高。  相似文献   

9.
对于多平台数据融合模式下的航迹关联问题,使用了聚类关联的方法进行解决.采用基于地心坐标系的最小二乘方法对航迹数据进行配准,对航迹间的距离使用Hausdorff距离进行衡量.使用了K-均值算法对各平台侦测的航迹进行关联,并将初始聚类中心设定为相距最远的航迹,有效降低了经典K-均值算法过于依赖初始聚类点带来的错误.仿真数据证实,能在目标密度大且航迹存在交错的场景下保持较高的关联正确率,具有较好的可用性.  相似文献   

10.
为了有效提高文本聚类的质量,用聚类过程不断反馈的信息熵改进向量空间模型中特征词权重的计算,构造以文本相似性为基础的抗体-抗原亲和力和抗体浓度计算方法,提出用亲和力和抗体浓度控制的抗体克隆和变异策略寻找聚类中心,并将文本归入与聚类中心相似度最大的类簇.实验表明,该算法可得到聚类质量较高并且稳定性较好的聚类结果.  相似文献   

11.
一种基于生物免疫原理的识别算法   总被引:6,自引:1,他引:6  
提出了一种人工免疫识别算法.该算法将所识别的数据作为抗原,利用抗体、抗原的亲和作用,通过刺激/抑制有关抗体的活动建立一个抗体记忆集合,识别和表示数据结构组织,它具有识别多样性、自我调节功能等特点.通过对二维实数空间的数据和Iris数据进行实验,结果表明该方法聚类效果好,识别率高,且具有较好的泛化能力.  相似文献   

12.
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。  相似文献   

13.
车间流程的免疫调度算法   总被引:6,自引:0,他引:6  
为了高效地解决车间流程(Flow Shop)问题,提出了一种利用免疫算法求解Flow Shop调度问题的方法.该算法是根据人或者其他高等动物的免疫系统机理设计的,将调度目标和约束条件作为抗原,将问题的解作为抗体,对抗体采用按工件加工顺序进行自然数编码,并把最大流程时间的倒数作为适应度函数,新抗体的繁殖是通过部分匹配交叉算子和按工件顺序互换的变异算子实现的,对抗体产生的刺激和抑制通过抗体浓度来调节,而抗体浓度通过计算抗体之间的最大亲和力获得.通过对Flow Shop问题的基准测试表明,该算法不仅在求解问题的规模上具有很好的可伸缩性,而且在运算时间上也低于遗传算法和模拟退火算法.  相似文献   

14.
将声道模型视为全极点模型,采用具有定点运算性质的Schur算法求得部分相关系数,利用LPC对数倒谱分析求得语音识别系统中采用的待识特征量——倒谱.本系统以倒谱作为特征参数,采用加权倒谱距离求得待识量与以K-均值聚类所得的参数库之间的特征距离,利用最小距离原则进行识别.经验证,本文所采用的方法取得了较好的实验结果  相似文献   

15.
针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法.该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心值组成第一个初始聚类中心点.其次,通过计算与第一个初始聚类中心点的欧式距离,对剩余候选初始聚类中心点进行优化选择,保证所有的聚类中心点均匀地分布在数据集密度较大的空间上,以此减少聚类过程中的迭代次数和提高聚类算法效率.最后,基于UCI(University of California,Irvine)中多个数据集,进行聚类算法对比实验.结果表明,在不降低聚类效果的前提下,该聚类算法的迭代次数平均降低到50%,所需的时间降低平均达10%,由实验结果还能推出,当点集的数目越多时,该算法就能表现出越明显的聚类优势效果.  相似文献   

16.
RNN(相互最近邻)算法是一种基于层次的聚类算法,它比其他传统的层次聚类算法聚类更快.由于利用RNN算法对同一个数据集聚类,若选择不同簇间距离度量方式,那么聚类结果就会不同.因此在分析聚类结果对距离度量方式依赖性的基础上,采用用聚类聚集的思想,找出一种新的聚类方式,从而使得聚类效果更好.  相似文献   

17.
模糊C均值算法(FCM)是图像分割最常用的算法之一,这种方法需要提前确定初始聚类中心和聚类数.为此,提出了一种新的自适应模糊聚类算法(AFCM),AFCM算法中构造的观察矩阵、判断矩阵和集合划分可以自动确定合适的聚类数.为了得到更好的图像分割效果,采用核距离作为相似性度量,提出了一种鲁棒性自适应模糊C均值算法(RAFCM).实验结果表明,与FCM算法相比,AFCM和RAFCM算法不仅能自动地确定聚类数目,还可以得到更好的图像分割质量.  相似文献   

18.
针对密度峰值聚类(density peak clustering, DPC)算法不能根据数据集自适应选取聚类中心和截断距离dc,从而不能自适应聚类的问题,提出了一种自适应的密度峰值聚类(adaptive density peak clustering, ADPC)算法.首先,提出了一个综合考虑局部密度ρi和相对距离δi的参数μi,根据μi的排列顺序及下降趋势trend自动确定聚类中心.然后,基于基尼系数G对截断距离dc做了自适应选择.最后,对ADPC算法做出了实验验证,并与DPC算法和K-means算法进行了对比.实验结果表明,ADPC算法具有较高的ARI,NMI和AC值,具有较好的聚类效果.  相似文献   

19.
使用标准模板匹配识别算法对图像中的字符进行识别时,图像中的背景噪声会导致识别准确率较低.为了提高识别准确率,提出一种基于分布加权的模板匹配识别算法,在获取图像与模板在对应的各个像素点上的匹配情况后,根据点间距分别对匹配点和不匹配点进行聚类,将聚集在一起的点划分到同一个分组中,根据聚类结果对不同组内的点设置不同的权重值,再计算图像与各个模板的匹配度,将匹配度最高的模板代表的字符作为识别的结果.实验结果证明,此算法提高了对有背景噪声的字符图像进行识别的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号