首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
针对模糊C均值聚类(FCM)算法聚类原型最适合于球状类型簇的特点,提出了基于类间分离度和类内紧缩度加权的冗余聚类中心的FCM算法,即先将大簇或者延伸形状的簇(非凸)采用加权FCM算法分割成多个小类(冗余类),从而规避FCM算法对初始聚类中心敏感的弱点.由于隶属度划分矩阵的元素是每个样本隶属于各冗余类的隶属度值,因此将其作为各冗余类的类特征,通过对应分析得到冗余类的新特征,再次采用加权FCM算法进行冗余类合并,最后达到分类效果.以代表曲线分割和曲面分割分类问题的3个典型数据集为算例,结果表明该方法能够识别不规则的簇,解决了FCM算法对初始聚类中心敏感的缺陷.  相似文献   

2.
加权模糊聚类及其在电力变压器故障诊断中的应用   总被引:3,自引:0,他引:3  
理论分析和实践表明,电力变压器绝缘故障与油中特征气体组分含量及特征气体组分比值密切相关.融合上述两类信息,对充油电力变压器DGA数据进行分析,提出针对特征气体组分含量和组分比值的规格化及提升与压缩数据处理方法,使用权值表示各类数据对于故障划分的相对重要程度,完成故障聚类,并设计出一种加权模糊聚类算法,该算法可实现故障聚类,计算故障聚类原型,完成权值的计算和优化.  相似文献   

3.
为解决电主轴转子不平衡故障的可视化智能识别问题,提出了一种对称极坐标图像和模糊C均值(FCM)聚类相结合的失衡故障诊断新方法。首先对转子时域振动信号进行经验模态分解降噪,按对称极坐标方法将其转化为二维雪花图像,通过灰度共生矩阵,提取雪花图像二维特征参数;然后对已知样本信号的特征参数组建故障特征向量,标准化后作为FCM输入,得到分类矩阵和聚类中心;最后计算待测样本和已知故障样本聚类中心贴进度,实现失衡故障识别和分类。在某电主轴系统平台上完成了1 800 r/min时转子3种不同失衡状态的诊断试验,在对45组小样本识别中该方法的分类准确率达到73%。  相似文献   

4.
[目的]针对协同训练算法在视图分割时未考虑噪声影响和两视图分类器对无标记样本标注不一致问题,提出了基于加权主成分分析和改进密度峰值聚类的协同训练算法.[方法]首先引入加权主成分分析对数据进行预处理,通过寻求初始有标记样本中特征和类标记之间的依赖关系求得各特征加权系数,再对加权变换后的数据进行降维并提取高贡献度特征进行视图分割,这一策略能较好地过滤视图分割时引入的噪声,同时保证数据中的关键特征能均衡划分到两个视图,从而更好地实现两个分类器的协同作用;同时,在密度峰值聚类上提出一种"双拐点"法来自动选择聚类中心,利用改进后的密度峰值聚类来确定标记不一致样本的最终类别,以降低样本被误分类的概率.[结果]与对比算法相比,所提算法在分类准确率和算法稳定性上有较大提升.[结论]通过加权主成分分析能有效地过滤掉视图分割中的噪声特征,同时改进后的密度峰值聚类减少了样本被误标记的概率.  相似文献   

5.
为了提高基于油中溶解气体分析(dissolved gas analysis, DGA)的变压器故障诊断正确率,弥补单子空间特征提取的局限性,提出了基于双子空间特征提取的变压器故障分层诊断模型.首先,将DGA测试样本在一个子空间内进行特征提取后,为避免核函数及其参数的选择难题,以及利用多核支持向量机(multiple-kernel support vector machine, MKSVM)鲁棒性强和精度高的特点,采用MKSVM作为分类器对测试样本进行预测.依据预测结果将测试样本分为难分类和易分类样本,对易分类样本直接进行分类识别;对难分类样本则将该样本再次投影到另一子空间进行特征提取后,同样采用MKSVM作为分类器对难分类样本进行预测,综合两次预测结果进行分类识别,实现两分类MKSVM的双子空间特征提取算法.最后,根据故障特征,建立基于双子空间特征提取算法的变压器故障分层诊断模型.诊断实例表明,该模型具有较高的诊断正确率和推广能力.  相似文献   

6.
传统Kmeans聚类算法的性能易受初始类簇中心随机性和类簇中心计算的迭代过程中边缘点和离群点反复计入的影响,为了避免这些影响,该文提出一种基于反向K近邻和密度峰值初始化的加权Kmeans聚类算法。通过样本的近邻信息计算每个样本的反向K近邻,针对不同规模、不同密度分布数据集,可以自适应地搜索密度峰值点作为初始类簇中心;自适应设定相对簇半径,并通过样本加权进行类簇中心迭代,在不同数据分布下可以有效降低边缘点和离群点对聚类结果的影响。试验结果证明,该算法在聚类性能提升的同时迭代次数大幅降低,随着入侵行为类型和数据规模的增加,该文聚类算法仍体现出较好的性能,且在发现未知攻击类型上效果显著。  相似文献   

7.
针对滚动轴承早期微弱故障识别率偏低的问题,提出一种基于EEMD、邻域粗糙集和模糊C均值聚类(FCM)算法相结合的滚动轴承特征提取方法.该方法将滚动轴承的原始信号进行EEMD分解得到若干个IMF分量,通过均方差和欧氏距离两个评价指标选取出敏感特征分量,构造原始特征数据集,对处理后的原始特征集属性进行NRS约简,剔除冗余属信息,最后将剩余属性的特征数据集作为模糊C均值聚类的输入,实现滚动轴承故障识别.为了对比本文方法对于滚动轴承的故障识别效果,分别添加了FCM、NRS-FCM和EEMD-FCM三种方法进行故障辨识,利用划分系数(PC)和划分熵(CE)对聚类结果进行评价与对比.通过实验表明:邻域粗糙集对于改进滚动轴承的故障识别效果十分明显,具有良好的应用前景.  相似文献   

8.
模糊C均值(FCM)聚类是一种常用的聚类方法,在工业应用时,常因数据的强噪声和非线性导致聚类效果不够理想。提出了一种密度加权、核理论和可能性模糊C均值聚类(PFCM)相结合的聚类方法。该方法采用核函数,将数据映射到线性空间进行聚类分析,消除非线性影响;通过引入点密度概念,加快算法迭代,增强可分性,提高聚类准确率。将该聚类算法用于污水处理过程的故障检测,结果表明该方法不仅能解决非线性问题,而且能有效加快收敛速度。  相似文献   

9.
利用基于阈值聚类算法首先对带类标记的样本数据集进行有指导性聚类,其主要目的是压缩训练数据集,解决KNN分类算法的样本选择问题以及孤立点的发现,用少量的更具代表性的聚类中心替代KNN算法中巨大的样本集,然后利用聚类密度改进KNN分类算法,从而提高KNN分类检测的准确度和速度.  相似文献   

10.
基于GA和FCM的岩体结构面的混合聚类方法   总被引:7,自引:0,他引:7  
提出了一种基于遗传算法(GA)和模糊C均值(FCM)算法的岩体结构面混合聚类方法.利用GA的全局搜索性能,求得初始聚类中心:在此基础上利用FCM算法,根据精度要求再作进一步求解.该方法避免了人为划定分类界限的主观性,消除了FCM聚类算法的局部最优的弱点,解决了采用普通遗传算法聚类时搜索速度和聚类精度的矛盾.结合实测数据,对应用该方法进行结构面组识别的步骤、参数选取、分组有效性、优势方位的判定进行了分析和讨论.  相似文献   

11.
支持向量机在电力变压器故障诊断中的应用   总被引:6,自引:1,他引:6  
利用支持向量机的学习方法,构建了电力变压器故障诊断模型.该模型将变压器故障分为放电性和过热性两大类,通过统计分析寻求特征量区分类间的故障类型,采用支持向量机识别类内的故障类型,利用基于交叉验证的网格搜索法来确定支持向量机的参数.考虑到变压器油中溶解气体特征空间的紧致性原理,利用模糊C均值聚类算法对所获取的样本进行预选取,有效地解决了确定模型参数时耗时巨大的问题,并一定程度提高了模型的推广能力.实例验证表明,该模型在有限样本情况下,能达到较高的变压器故障判断率,放电性故障样本正确判断率为90.5%,过热性故障样本正确判断率为85.9%,说明该模型具有很好的分类效果和推广能力.  相似文献   

12.
对不平衡数据进行聚类分析时,K-means聚类方法可能会错误地将分布在较小区域类别中的样本划分到大区域类别中;谱聚类算法,虽然可以有效优化数据结构,并很好地识别不同形状的样本,但却难以处理大规模数据.针对这些问题,提出一种改进地标点采样的不平衡数据聚类算法.该算法首先对不平衡数据进行预聚类以获得初始类标签,然后基于数据密度对数据进行采样.在此基础上,通过对采样数据执行K-means聚类,并将聚类中心作为地标点,对数据进行谱聚类分析.实验结果显示,该方法在处理不平衡数据时,不仅能够有效提高样本的聚类准确率,而且能够保证聚类结果的稳定性和精度.  相似文献   

13.
针对特征权重未知且具有直觉模糊数的特征信息的聚类分析问题,提出一种改进的基于直觉模糊集的模糊C均值聚类算法.首先,定义区域密度参数,选择高密度区域中相距最远的样本为初始聚类中心;然后,利用直觉模糊熵计算聚类样本的特征权重,对样本特征值进行加权处理.给出改进的FCM聚类算法的具体步骤,并进行了算例验证.研究结果表明,该算法不仅克服了FCM算法易陷入局部极小值的问题,同时大大减少迭代次数,加快了收敛速度,提高了聚类性能.  相似文献   

14.
针对高维数据聚类分析中数据之间具有多种非线性特征关系,导致数据分布不均、传统相似性度量失效及结果类中心难以精准表征等问题,提出了一种基于核主元分析(KPCA)与密度聚类(DBSCAN)的高维非线性特征数据聚类分析技术。首先,为有效提取高维数据的非线性特征,利用KPCA理论将原始数据映射到更高维数据空间,利用主元分析获得数据变化的方向集合,并进行降维分析;然后,通过重新定义数据样本在主元空间的相似性距离对传统DBSCAN聚类方法进行改进,并利用3δ统计理论对各簇中心的进行表征,从而实现高维数据的精确分类与类中心知识表达。以实际高血压患者群体聚类问题为例对方法进行了有效性验证,实验表明,所提方法可以有效获取原始数据的非线性特征,实现患者个体特征群体的有效划分及簇类中心知识的表达,解决传统DBSCAN聚类方法对高维数据不适用的问题。  相似文献   

15.
张青  赵静  王群  刘嫘  王雪梅 《湖州师专学报》2011,(1):127-130,140
大学生心理压力是一个受到广泛关注的问题.在抽样调查的基础上,首先利用FCM均值聚类法对样本进行聚类,得到聚类中心,然后利用有序加权算子对聚类中心进行信息集结,得到了一种进行心理压力预测的新方法.利用该模型,能使大学生尽早发现自己的心理健康状况,进而自身进行合理调节.  相似文献   

16.
欠定盲源分离问题中,针对传统FCM算法(fuzzy C-means,FCM)需要预先设定聚类数目和初始聚类中心,以及聚类结果易受噪点干扰的问题,提出一种基于密度结构分析的改进FCM聚类算法,并利用改进后的算法实现混合矩阵估计.这一改进算法首先用OPTICS(ordering points to identify the...  相似文献   

17.
多阶段聚类—朴素贝叶斯的异常检测   总被引:1,自引:0,他引:1  
针对异常检测手段用来标定数据集中明显的不同于其他数据的对象,提出多阶段聚类旨在解决噪声数据的引入和缺失属性样本的处理,并改变传统的贝叶斯分类的被动学习为主动学习的方式来构造性能优越的分类器。在数据预处理阶段,利用密度聚类滤去噪声点,密度聚类的输出作为下一阶段的K-means聚类的输入,提高了K-means的分类准确率。K-means负责对缺失属性的样本进行处理。在分类阶段,利用adaboost学习算法优化朴素贝叶斯分类器,使其获得较好的分类效果。  相似文献   

18.
相比其它聚类算法,密度峰值点快速搜索聚类算法(clustering by fast search and find of density peaks,DPC)只需较少的参数就能达到较好的聚类结果,然而当某个类存在多个密度峰值时,聚类结果不理想.针对这一问题,提出一种基于簇边界划分的DPC算法:B-DPC算法.改进算法首先利用一种新的去除噪声准则对数据集进行清理,再调用DPC算法进行首次聚类.最后搜索并发现邻近类的边界样本,根据边界样本的数量和所占比例,对首次聚类结果进行二次聚类.实验证明,B-DPC算法较好地解决了多密度峰值聚类问题,能够发现任意形状的簇,对噪声不敏感.  相似文献   

19.
模糊c-均值聚类(FCM)的算法是在硬c-均值算法(HCM)发展而来的,虽然改进了硬c-均值算法的聚类效果,但带来了时间复杂度的增加.提出了一种基于协议分析分类的并行入侵检测模型,根据协议分析将大的数据集进行分类,构成不同的数据集,先对各个数据集进行FCM聚类,然后对每个FCM聚类的结果再次进行FCM聚类,构成并行处理系统.采用协议分析技术结合高速数据包捕捉、协议解析等技术来进行分布式入侵检测,可以提高入侵检测的速度.  相似文献   

20.
一种新的密度加权粗糙K-均值聚类算法   总被引:1,自引:0,他引:1  
为了克服粗糙K-均值聚类算法初始聚类中心点随机选取,以及样本密度函数定义所存在的缺陷,基于数据对象所在区域的样本点密集程度,定义了新的样本密度函数,选择相互距离最远的K个高密度样本点作为初始聚类中心,克服了现有粗糙K-均值聚类算法的初始中心随机选取的缺点,从而使得聚类结果更接近于全局最优解。同时在类均值计算中,对每个样本根据定义的密度赋以不同的权重,得到不受噪音点影响的更合理的质心。利用UCI机器学习数据库的6组数据集,以及随机生成的带有噪音点的人工模拟数据集进行测试,证明本文算法具有更好的聚类效果,而且对噪音数据有很强的抗干扰性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号