首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
一种基于区间数多指标信息的聚类方法   总被引:3,自引:0,他引:3  
针对一类特征指标值及指标权重均为区间数的多指标信息聚类问题,给出了一种最大树聚类分析方法·首先对区间数多指标信息聚类问题进行了描述;然后依据传统的基于数值信息的最大树模糊聚类分析方法的基本思路,给出了解决区间数多指标信息聚类问题的计算步骤·最后,通过给出一个算例说明了所给出的聚类方法·  相似文献   

2.
针对一类特征指标值和指标权重均为语言评价信息的聚类问题,提出了一种新的聚类分析方法.首先对基于多指标语言评价信息的聚类问题进行了描述;然后依据传统的基于数值信息的编网模糊聚类分析方法的基本思路,在将语言短语转换成三角模糊数的基础上,给出了解决多指标语言评价信息聚类问题的计算步骤.最后,通过给出一个算例说明了所提出的聚类分析方法.该聚类方法拓宽了编网聚类分析方法在解决基于多指标语言评价信息聚类方面的应用.  相似文献   

3.
针对特征权重未知且具有直觉模糊数的特征信息的聚类分析问题,提出一种改进的基于直觉模糊集的模糊C均值聚类算法.首先,定义区域密度参数,选择高密度区域中相距最远的样本为初始聚类中心;然后,利用直觉模糊熵计算聚类样本的特征权重,对样本特征值进行加权处理.给出改进的FCM聚类算法的具体步骤,并进行了算例验证.研究结果表明,该算法不仅克服了FCM算法易陷入局部极小值的问题,同时大大减少迭代次数,加快了收敛速度,提高了聚类性能.  相似文献   

4.
基于模糊聚类方法的海工结构耐久性评估   总被引:1,自引:1,他引:0  
考虑海工结构耐久性评估的模糊性特点,提出一种新的耐久性评估方法.基于模糊数学原理对待估样本进行聚类分析,利用MATLAB模糊工具箱实现对海工构件耐久性的模糊评估;建立样本对于类别的不确定性描述,给出每个样本隶属于某一聚类中心的模糊隶属度.结果表明:采用的模糊聚类方法避免了传统硬划分对构件耐久性评估的不合理性,符合客观实际;基于软划分的模糊c-均值聚类的MATLAB编程法避免了主观因素对评估结果的影响,可对多个样本及多个评价指标的待评估事物进行模糊聚类分析,评估结果形象且动态反映了样本的耐久性状况.  相似文献   

5.
对不平衡数据进行聚类分析时,K-means聚类方法可能会错误地将分布在较小区域类别中的样本划分到大区域类别中;谱聚类算法,虽然可以有效优化数据结构,并很好地识别不同形状的样本,但却难以处理大规模数据.针对这些问题,提出一种改进地标点采样的不平衡数据聚类算法.该算法首先对不平衡数据进行预聚类以获得初始类标签,然后基于数据密度对数据进行采样.在此基础上,通过对采样数据执行K-means聚类,并将聚类中心作为地标点,对数据进行谱聚类分析.实验结果显示,该方法在处理不平衡数据时,不仅能够有效提高样本的聚类准确率,而且能够保证聚类结果的稳定性和精度.  相似文献   

6.
提出了一种拓展的半监督模糊聚类模型,给出求解这个模型的迭代公式.这种半监督聚类能够合理、有效地利用部分已标识样本的类别信息对未标识样本产生影响,从而提高半聚类算法的聚类效果.其隶属度和聚类中心的迭代公式具有和FCM算法一样简洁的表示.在黄瓜数据集上的聚类分析表明,新提出的半监督聚类优于未改进的两种半监督算法、FCM算法和线性判别方法.  相似文献   

7.
模糊聚类迭代模型在洪水灾害度划分中应用   总被引:6,自引:0,他引:6  
介绍了陈守煜的模糊聚类迭代模型.利用该模型的计算结果可对聚类样本作进一步的排序.即先求各个类对模糊划分的相对隶属度,以此相对隶属度为权重,根据各聚类样本对各类以相对隶属度加权,求得样本对模糊概念的类别特征值,并根据其大小对聚类样本进行排序.将其应用于"96.7"洪水灾害分析,较清晰地划分出了各受灾地受灾程度的轻重.  相似文献   

8.
基于广义加权支持向量机的焊接缺陷分类方法   总被引:1,自引:0,他引:1  
提出了一种广义加权支持向量机(GWSVM)的焊接缺陷分类算法。首先为克服由于样本数量不平衡性引起的小样本类别精度差的问题,引入由于样本差异的权重;然后为解决不同类别的重要性要求,根据经验人工确定不同类别重要性的权重。针对样本重要性的影响,采用有监督模糊聚类方法来确定样本重要性权重。测试结果表明:广义加权支持向量机在噪声影响较大及样本类别相差较大时,能够提高重要的、数量少的缺陷检测精度。  相似文献   

9.
在运用误差反向传播(BP)神经元网络确定巷道围岩稳定性判定各特性指标权重的基础上,采用自适应共振(ART)神经元网络对巷道围岩稳定性的聚类分析问题进行了研究.结果表明,神经元网络是用于解决采矿工程中权重评价、模式聚类问题的有效方法,对于解决采矿工程中相关问题有着广泛的应用前景.  相似文献   

10.
采用结合模糊聚类和广义神经网络回归聚类分析的方法,对5种网络入侵行为模式进行有效的聚类.首先用模糊 c 均值聚类算法将入侵数据分为5类,再将聚类的结果中最靠近每类中心的样本作为广义神经网络的聚类训练样本进行数据训练,训练输出的结果即为该个体所属的入侵类别.实验结果表明:新算法对网络入侵途径的分类精度更高,可为预防网络入侵提供更可靠的数据支持  相似文献   

11.
为了在多维聚类分析中运用有效距离度量方法表征数据对象的邻近度,提出一种协方差测距(covariance distance measure analysis,CDM)算法,首先,采用模糊C均值(fuzzy c-means,FCM)方法对数据对象赋予权值,得到每个样本点相对类别特征的隶属度,再依据隶属度计算每个样本的差异度;其次,为了使类别分离最大化,用样本点同关联类别的协方差距离度量代替模糊聚类中欧式距离度量作为优化问题的第一个标准,使相似数据对象更为接近;最后,用样本点间的协方差距离度量作为第二个优化标准,使相异数据相互隔开,交替固定变量迭代计算最优解,使聚类指标和距离度量学习参数同时得到优化,获得更好的聚类结果。在不同数据集上的实验结果表明,与FCM-Sig和UNCA算法相比,CDM算法在聚类准确性和算法收敛性方面均有更好表现。  相似文献   

12.
基于Normalized Cut的基因表达数据聚类   总被引:1,自引:0,他引:1  
利用基因表达数据进行聚类分析可提高肿瘤诊断的正确率,对生物医学研究具有重要意义.该文将Normalized Cut应用于基因表达数据的聚类中,将样本映射为高维空间的点,利用亲近矩阵和度矩阵构造正规Laplacian矩阵,经SVD分解得到反映原始样本类别信息的指示向量,利用指示向量各分量的符号差异实现基因表达数据的聚类.通过对白血病和结肠癌数据集的实验,证明了该文方法的有效性.  相似文献   

13.
提出了加权的系统聚类方法.该方法通过对不同的客户特征赋予不同的权重,达到对客户的聚类结果更符合企业经营目标的目的.为分析客户特征的权重,利用线性回归挖掘企业的历史数据,得到物流企业对客户各个特征的重视程度,并把重视程度作为权重进行客户聚类.实验分析表明,与传统的系统聚类相比,加权的系统聚类方法可以发现隐藏在一般客户中的重要客户,从而使物流企业对本公司的重要客户提供优质服务.  相似文献   

14.
一种广义加权模糊聚类算法   总被引:2,自引:0,他引:2  
提出了一种广义的加权模糊聚类新算法来处理具有不同特征贡献和不同数据分布的混合属性数据.分别利用样本概率密度思想和ReliefF算法为每一个样本和每一维特征分配权值,通过样本和特征的加权,将模糊c均值算法、模糊c-modes算法、模糊c-原型算法以及样本加权聚类算法统一为一个通用的框架.不同测试数据集的实验结果证明,这种广义的模糊聚类新算法对于处理不同分布以及具有不同特征贡献的大数据集是相当有效的.  相似文献   

15.
传统模糊C-means聚类(FCM,fuzzy C-means)在处理非平衡数据集时,由于相异类中所含样本数量差异较大,导致类间权值不平衡和"均匀效应",从而易产生聚类错误.另外,FCM属于无监督方法,无法更好地利用已知的部分类标记信息引导聚类.为解决这两方面问题,提出一种半监督的平衡化模糊C-means聚类(SBFCM,semi-supervised balanced fuzzy C-means)方法.SBFCM在FCM目标函数的基础上加入了对聚类模糊隶属度矩阵的近似正交约束和半监督约束,从而得到了新的聚类目标函数.实验结果表明,相比于FCM,SBFCM能有效缓解由"均匀效应"导致的聚类错误现象,并能有效地利用部分先验类标记信息,从而可获得更好的聚类效果.  相似文献   

16.
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高.针对这个不足,提出一种特征加权的K-means算法进行优化.首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其...  相似文献   

17.
聚类分析的一种改进方法   总被引:5,自引:0,他引:5  
为了削减由于指标变量不同量纲、不同权重及其相关性对聚类效果造成的影响,把权重引入马氏距离计算公式, 定义了加权马氏距离,并证明了其在理论上的有效性. 最后,采用加权马氏距离对一个具体算例进行聚类分析,得到了较为理想的、更符合实际的分类结果,表明了该定义在应用上的有效性.  相似文献   

18.
覆盖聚类算法   总被引:9,自引:0,他引:9  
首先比较几类主要的聚类算法,给出每类算法的基本概念、原理、每类的代表性算法,及这些算法的主要特征。在此分析基础上,提出一种新的聚类算法———覆盖聚类算法,该算法采用覆盖的概念将比较集中的样本聚合在一起,从而发现隐含在样本集中的类,对于周围稀疏的样本结合最短距离法,获得聚类效果,并用实验数据对分层聚类方法、LBG方法与覆盖聚类算法进行比较,证明了覆盖聚类算法的可行性和有效性。最后给出了算法的研究方向。  相似文献   

19.
针对传统K-均值方法不能有效处理动态变化的数据聚类的问题,本文提出了一种改进的数据流聚类技术——流式K-均值聚类(Streaming K-means Clustering,SKC).该方法首先对数据流中已经产生的初始数据块进行K-均值聚类,当数据流的新数据块到来时,通过衡量已经得到的聚类结果与新进入样本块的距离,对样本进行初步简单归类,并计算聚类结果的性能,若聚类结果性能在可接受范围内,则该数据块聚类结束,否则采用K-均值方法对新类进行深层次聚类.采用SKC的流式数据聚类方法处理数据流的聚类问题,对于整个数据流中的多数数据块都进行简单归类,只有少数数据块进行K-均值聚类,有效提高了数据流聚类的效率.实验结果表明,流式K-均值聚类方法能够有效处理数据流的聚类问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号