首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
K-means 算法中的k 值优化问题研究   总被引:36,自引:0,他引:36  
在空间聚类中,最佳聚类数K求解的关键是构造合适的聚类有效性函数.典型K-平均算法中的聚类数K必须是事先给定的确定值,然而,实际中K很难被精确地确定,使得该算法对一些实际问题无效.文章提出距离代价函数作为最佳聚类数的有效性检验函数,建立了相应的数学模型,并据此设计了一种新的K值优化算法.同时,给出了K值最优解KOPT及其上界KMAX的条件,在理论上证明了经验规则KMAX≤N的合理性,实例结果进一步验证了新方法的有效性.  相似文献   

2.
基于多维伪F统计量的基因表达动态聚类分析方法研究   总被引:2,自引:1,他引:2  
K-均值聚类分析算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通过指定类别数K-基于给定的聚类目标函数,并采用迭代更新的方法,使得最终的聚类结果的目标函数值为极小值,达到较优的聚类效果。针对K-均值聚类分析算法存在参数依赖性强,且在整个聚类过程中类的数目无法改变的缺点,引入动态调整聚类个数的思想和多维伪F统计量,提出了一种基于多维伪F统计量的基因表迭动态K-均值聚类算法。实验结果表明该算法可以动态调整聚类个数,给出最佳聚类数目,从而获得较好的聚类质量.  相似文献   

3.
一种新的混合聚类算法   总被引:3,自引:2,他引:3  
聚类是数据挖掘的主要技术之一,是一种无导师监督的模式识别方式。聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同子类。K-平均算法是经典的聚类算法。蚂蚁聚类算法是近来涌现的新的聚类算法,它通过模拟蚁群的智能行为进行聚类分析,已经在数据挖掘中得到应用。通过分析蚂蚁聚类算法和K-平均算法两种不同聚类算法的基本思想,将两种算法结合得到混合聚类算法,仿真实验证明混合聚类算法的算法性能优于蚂蚁算法和K-平均算法。  相似文献   

4.
针对一种可快速搜索和寻找到聚类密度峰值点聚类算法的缺陷,利用线性回归与残差分析的方法进行改进,可自动、快速地确定聚类中心且优化样本点密度值。算法利用样本点的近邻信息重新度量点的密度值,提高聚类中心点位置稳定性;利用一元线性回归与残差分析,快速、自动地选出聚类中心点,去除了人为选择的主观性。通过理论分析以及在人工数据集和真实数据集的对比实验表明,提出的基于线性回归分析的快速搜索聚类中心算法能够克服原有算法的缺陷,并且在聚类效果和计算时间上优于原有算法、基于密度的带有噪声的空间聚类算法(density based spatial clustering of applications with noise, DBSCAN)以及K-means算法。  相似文献   

5.
针对决策者权重和准则权重信息不完全确定,且评价信息为语言值的多准则聚类问题,提出了一种新的求解方法。首先通过证据推理算法,将方案集的群体多准则语言评价信息转化为方案集模式样本,该模式样本是决策者权重和准则权重的不确定信息的非线性函数,然后根据K-均值方法,利用惯性粒子群算子对模式样本集进行聚类,得到最优聚类中心和方案集的最优聚类。最后实例说明该方法的可行性和有效性。  相似文献   

6.
具有不同到达时间的差异工件批调度问题的蚁群聚类算法   总被引:2,自引:0,他引:2  
研究具有不同到达时间的差异工件在单机环境下的批调度问题.通过引入工件单元的概念并对分批约束进行松弛,提出了该问题的一个新的下界,证明了该下界的有效性.将蚁群算法和聚类算法相结合,提出了一种基于多阶段聚类的蚁群聚类算法ACC(Ant colony clustering).算法首先利用K-均值聚类将工件分簇,在簇内部通过蚁群算法搜索分批,最后提出一个全局优化算法对局部分批结果进行合成和优化.克服了蚁群算法随着工件规模增大求解时间过长的问题,适合于求解大规模算例.实验结果表明:与现有的启发式规则LPTBFF(Longest processing time batchfirst fit)和HGA(Hybrid Genetic algorithm)算法相比,该算法求解效果更好.  相似文献   

7.
目前对全球导航卫星系统(global navigation satellite system, GNSS)三频组合观测值优选的研究,主要集中在全球定位系统(global positioning system, GPS)和北斗二号(beidou navigation satellite system, BDS-2)上,对BDS-3的研究相对较少。为克服以往聚类优选算法中存在的仅适用于类球形簇、聚类数目和初始聚类中心的确定主观性强、对离群点敏感、易陷于局部最优等不足,提出一种改进的核模糊C均值聚类算法,引入核函数与抑制离群点的新距离度量,基于多类广义核极化准则优化核参数,用改进爬山法确定聚类数目与初始聚类中心。然后,以模糊C均值聚类算法为对照进行了对比实验,在短、长两种基线下分别解算组合模糊度。通过对优选所得代表性组合的模糊度固定成功率进行对比分析,验证了该算法的可行性与算法改进的有效性。  相似文献   

8.
提出了一种进化多目标软子空间聚类(EMOSSC)算法,用于提升商业银行信贷审批过程中企业客户的信用风险识别和管理水平.考虑到信用数据高维、类不平衡的特征,将聚类算法中单一的聚类有效性指标转化为了一个四目标函数,并采用进化算法对该函数进行优化和求解.结果表明,EMOSSC算法不仅在信用风险识别准确率、稳健性以及结果显著性等方面显著优于对比算法,还能通过对指标权重大小的排序,揭示商业银行企业客户信用风险的关键影响因素,为商业银行的信用风险识别和管理提供有益参考.  相似文献   

9.
基于最优划分的K-Means初如聚类中心选取算法   总被引:1,自引:0,他引:1  
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率.实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高.  相似文献   

10.
基于粒子群的K均值聚类算法   总被引:43,自引:0,他引:43  
针对K均值聚类算法存在的缺点,提出了一种新的聚类算法———基于粒子群的K均值聚类算法,并将此算法与现有的基于遗传算法的K均值聚类算法进行比较.理论分析和数据实验证明,该算法有较好的全局收敛性,不仅能有效地克服传统的K均值算法易陷入局部极小值的缺点,而且全局收敛能力优于基于遗传算法的K均值聚类算法.  相似文献   

11.
基于粒子群优化算法的稀疏信号盲分离   总被引:2,自引:1,他引:2  
把粒子群优化算法应用于稀疏信号盲分离中,采用基于粒子群优化算法的聚类算法来估计混合矩阵;然后利用粒子群优化算法在求解具有线性约束优化问题时,只需在初始化时粒子满足线性约束条件,无须做其它处理的特点来求解稀疏源信号,从而给出了一种基于粒子群优化算法的稀疏信号盲分离算法。该算法计算量小,精度较高。仿真结果表明该算法是有效的,具有良好的分离性能。  相似文献   

12.
针对雷达实际侦察过程中会侦收到大量样本库中所没有的未知雷达信号,设计了一种基于粒子群优化的具有噪声的密度聚类算法和半监督条件生成对抗网络的单脉冲未知雷达信号处理方法.通过粒子群优化算法得到具有噪声的密度聚类算法的最优输入参数后,对未知雷达信号进行聚类,在聚类算法输出的簇中采用距离筛选算法筛选出更为可信的样本将其扩展到雷...  相似文献   

13.
基于加权k-均值聚类与粒子群优化的多航迹规划   总被引:1,自引:0,他引:1  
针对复杂环境下的无人机多航迹规划问题,提出了将粒子群优化(particle swarm optimization, PSO)算法与加权k-均值聚类算法相结合的规划方法。每个粒子表示一条航迹,采用加权k-均值聚类算法对粒子进行分类,得到多个粒子子群,在每个子群内部进行一条可行航迹的优化,最终得到多条不同的可行航迹。对传统k-均值聚类算法进行改进,采用排挤机制产生初始聚类中心,针对实际环境中突发威胁的分布不均性,在聚类过程中,对航迹节点按照所在区域突发威胁的出现概率进行加权,提出了加权k-均值聚类算法。仿真实验表明,所提出的方法能够有效地得到无人机的多条可行航迹。  相似文献   

14.
提出了一种基于模式识别技术的彩色图像量化的新算法—基于最小距离最大的快速统计聚类算法(FSCAMMD)。本算法克服了SCA算法对聚类中心初始值选取的不足,给出了最大频度与类内最小距离最大相结合的方法—初始值优选法。实验结果表明,本算法可较大幅度地减少图像量化后的总方差以及颜色失真度,量化效果优于SCA和其它一些聚类量化算法。  相似文献   

15.
针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法-基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise, QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial clustering of applications with noise, DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。  相似文献   

16.
针对支持向量机(support vector machine, SVM)预测过程中影响因素选择、输入特征集优化、核函数选择及参数优化方面存在的问题,提出了一种全过程优化方法。首先使用频繁模式增长关联规则分析和模糊贝叶斯网络组合模型来解决影响因素选择中存在的主观性问题,然后使用在异常值处理和类内距离与类间距离方面进行改进的模糊C均值聚类算法优化输入特征集,减小支持向量机预测模型冗余度及训练样本集过修正度,通过比较各核函数的特点选择径向基核函数作为SVC的核函数,改进了粒子群优化算法中微粒速度和位置函数及惯性权重值算法,使用该方法优化SVM参数并建立预测模型。最后,通过案例运算和分析,证明该文方法具有更高的预测精度。  相似文献   

17.
基于模糊投影寻踪聚类的洪灾评估模型   总被引:1,自引:0,他引:1  
针对洪水灾害样本集的复杂性、随机性以及差异性,本文将模糊聚类迭代理论与投影寻踪技术进行互补融合,构建了模糊投影寻踪聚类模型.该模型采用投影值标准差和投影值欧氏距离平方和来构造投影指标函数,避免了传统投影寻踪模型由于经验性选取密度窗宽导致过于主观的问题;将高维数据低维化后进行模糊聚类运算,再通过对最优投影方向的寻优进行投影寻踪聚类运算,降低了模糊聚类迭代的运算量,实现了两种模型的双重迭代聚类.误差分析及聚类有效性评价表明,互补融合后模糊聚类与投影寻踪聚类的双重迭代聚类使得聚类精度和效果也得到了较大提高;此外,除优化算法初始化参数外,模型无需预设其它参数,也不依赖于随机训练样本,可客观依据历史样本集内在规律来进行洪灾聚类评估.实例研究和方法比较表明,提出的模型计算简洁,且能有效处理洪灾评估中的随机、模糊等主客观不确定性,能够为洪灾风险管理提供科学的决策支撑.  相似文献   

18.
基于遗传算法的动态聚类方法   总被引:4,自引:0,他引:4  
针对常规动态聚类方法对初始聚类中心的敏感性以及聚类结果与样本输入次序有关等问题,本文另辟蹊径,提出了一种基于GA 的动态聚类方法,并将它应用到数据库的数据分析中. 计算结果表明,该方法是一个具有全局最优解的动态聚类方法,其结果明显好于K-均值聚类算法.  相似文献   

19.
天然林空间结构包含林木的空间位置信息,影响着林木的生长、竞争、林分的稳定及森林的发展,其优化是个多目标规划问题。提出一种蜂群-粒子群(ABC-PSO)混合算法,该算法在初始粒子产生机制、随蜂数量及循环机制上对蜂群算法做了改进,并将其应用到天然林空间结构多目标优化中,最终建立能够兼顾林木分布格局、林木大小分割、林木竞争的优化模型。仿真实验表明,蜂群-粒子群算法提升了森林健康等级,解决了森林空间结构多目标优化问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号