首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 640 毫秒
1.
针对传统K均值算法需要提前指定聚类数目且易陷入局部最优的问题,提出了一种采用万有引力定律自动确定类数的K均值算法(Gravity K均值算法,GK均值算法)。所提算法利用正交设计方法在数据空间均匀投放若干探测器,探测器根据万有引力定律移动,当两个探测器的距离小于给定阈值时合并为一个,当探测器处于稳定状态时,探测器的个数就是聚类的数目。将得到的探测器作为K均值算法的初始中心点,有效地避免了K均值算法陷入局部最优。实验结果表明:相比传统K均值算法,本文提出的方法可以自动确定聚类数目,并给出较好的初始中心,算法的迭代次数至少减少了25%,聚类正确率平均提高了14%,DB(Davies and Bouldin)聚类评价指标平均降低了0.19。  相似文献   

2.
采用两阶段策略模型(KTSVM)的P2P流量识别方法   总被引:2,自引:0,他引:2  
针对识别加密P2P网络流量比较困难的问题,提出一种基于K均值和直推式支持向量机(TSVM)的半监督学习模型———两阶段策略模型(KTSVM,k-means based transductive supportvector machine),以提高P2P流量的识别精度.该模型首先使用K均值半监督聚类算法计算训练集中正例样本的数目,然后根据正例样本的数目来训练TSVM分类模型,提高了TSVM模型的稳定性和准确性.该模型的优势是可以使用未标注样本和标注样本共同训练分类模型,非常适合于识别标注比较困难的P2P流量.实验结果表明,在标注样本较少的情况下,该模型的识别精度和稳定性均优于TSVM模型和SVM模型.  相似文献   

3.
基于硬聚类算法的几种有效性指标,即Hubert统计量、Davies—Bouldin指标、Dunn’S指标以及Dunn's指标的推广,提出了相应的适用于模糊聚类算法的有效性指标.实验证明,这些改进的有效性函数对模糊C-均值算法而言同样有效.  相似文献   

4.
【目的】针对在标准协同训练中不具有充分冗余的视图分割,致使分类器错误累计过多,以及一对基分类器标记样本类别不一致的问题,提出了基尼指数结合K均值聚类的协同训练算法。【方法】该算法首先计算已标记样本中各特征的基尼指数,将该指数升序排列后均等划分到两个视图,然后在基分类器所标记的样本中,运用K均值聚类确定标记不一致样本的类别后加入标记样本。【结果】通过9个UCI数据集在3组实验上的结果表明,所提算法相较于对比算法提升了分类效果。【结论】运用基尼指数均等划分关键特征于两个视图,有利于改善视图分割不充分冗余的缺陷;K均值聚类法对分类不一致样本进行重新标记,降低了协同训练算法中的误标记率。  相似文献   

5.
利用K均值聚类和增量学习算法扩大训练样本规模,提出一种改进的mRMR SBC.一方面,利用K均值聚类预测测试样本的类标签,将已标记的测试样本添加到训练集中,并在属性选择过程中引入一个调节因子以降低K均值聚类误标记带来的风险.另一方面,从测试样本集中选择有助于提高当前分类器精度的实例,把它加入到训练集中,来增量地修正贝叶斯分类器的参数.实验结果表明,与mRMR SBC相比,所提方法具有较好的分类效果,适于解决高维且含有较少类标签的数据集分类问题.  相似文献   

6.
针对传统的随机森林算法(RF)在对高维特征数据集计算速度慢、聚类效果不佳的缺陷,提出了一种基于高维特征聚类的随机森林算法(HDFC-RF),首先用传统RF方法对初始高维数据集聚类后,使用K均值聚类(KM)和模糊C-均值(FCM)结合,计算样本相似度,并对聚类特征划分族群,最后通过计算DBI指标,并与相关性阈值δ比较和排序,得到最终的高维特征序列。将HDFC-RF算法应用于高维特征数据集Colon Tumor,与传统的RF和FSRF算法比较。实验结果表明,HDFC-RF算法对于高维特征的数据集具有更好的聚类效果、训练速度也更快,具备良好的可行性。  相似文献   

7.
【目的】针对协同训练算法不能直接应用于单视图数据,且在迭代过程中加入的无标记样本隐含有用信息不够的问题,提出基于核均值漂移聚类的改进局部协同训练算法。【方法】该算法先在有标记样本集中利用改进局部协同训练算法训练一个完整视图分类器h1,同时挑选出价值高的特征子集来训练局部视图分类器h2,然后在无标记样本集中采用核均值漂移算法选择聚类过程中指定带宽范围内的样本,交由分类器h2标记类别后再加入分类器h1的训练中,以此来优化分类模型。【结果】在UCI数据集上的3组对比实验证明了该算法的有效性,实验结果表明该算法具有更高的模型评价能力。【结论】改进局部协同训练算法将数据集划分为局部视图和完整视图,解决了单视图数据的视图划分问题。利用核均值漂移算法选出较好表现数据空间结构的无标记样本,降低了无标记样本带来的误差。  相似文献   

8.
有杆抽油系统工况极其恶劣,发生故障的概率较高。针对有杆抽油系统的特点及其故障诊断目前存在的问
题,提出基于示功图的有杆抽油系统故障递阶诊断法,该方法分为故障分辨和故障识别两个阶段,即首先在故障分辨
阶段根据正常(或平稳状态)样本的统计规律把示功图分为故障类和非故障类;然后采用基于示功图的有杆抽油系统
故障识别的搜索树方法,对故障样本进行故障类型的识别。它提高了故障诊断系统的故障诊断性能,且不需要建立和
求解有杆抽油系统力学模型,也不存在训练集问题,并能反映出有杆抽油系统自身的基本特征。故障分辨过程包括:
在训练阶段,t 检验剔除异常数据后,通过X2拟合优度检验确定样本的随机分布形式及其参数,进而计算出正常区域
和故障区域;在分辨阶段,根据测试样本是否有特征量落入故障区域来判断其分类。实例表明故障分辨过程能从大量
的数据中筛选出故障样本,分辨的正确率比较高;训练样本的统计规律能反映油井实时的生产状况。  相似文献   

9.
解的稀疏性的丧失——所有的训练样本均作为支持向量,是最小二乘支持向量机的缺点之一,针对导致模型复杂度提高和模型训练、识别速度降低的问题,从数据挖掘和支持向量的几何分布含义两个方面出发,提出了一种新的支持向量预选取算法。一方面对原数据集的每类数据分别进行K均值聚类,将所有的类中心作为原始数据的表征集;另一方面对原数据集用K最近邻方法提取原数据集的边界样本;最后将这两种方法提取的所有样本点的并集作为预选支持向量进行训练和预测。UCI数据库的实验表明:该方法充分融合了K均值和K最近邻预选取算法的优点,能有效的预选取出支持向量,同时保持较高的识别率,而且稀疏效果更稳定,稀疏性能优于经典的迭代剪枝算法。  相似文献   

10.
K均值算法利用K个聚类的均值作为聚类中心,通过对比样本到各聚类中心的距离,将样本划分到距离最近的聚类中,从而实现样本的聚类.分析了K均值算法的基本原理和实现步骤,并将其应用于数据聚类和图像分割,取得了较好的聚类效果.最后,针对K均值算法的不足之处,提出了改进措施,提高了K均值算法的聚类性能.  相似文献   

11.
当被识别的样本包含有未确知性的灰信息时,传统的SVDD算法无法对其类别作出判别.针对这一问题,并考虑到SVDD算法是一种基于样本间距离测度的判别方法,提出了一种针对灰信息样本进行判别的支持向量域数据描述算法-GSVDD算法,该算法利用区间数对未确知性的灰信息进行表达,将区间运算引入到SVDD算法中,以区间距离取代原来的确定性距离,从而对灰信息目标样本进行识别.理论分析和实验结果均表明,该算法是有效和可行的.  相似文献   

12.
实现轴承故障的精确诊断,采用特征排列的方法分析轴承振动的数值特征,通过贝叶斯超参数优化方法调整神经元数量来拟合轴承振动特征,并用Dropout解决过拟合问题,提出一种基于贝叶斯超参数优化方法的浅层神经网络轴承故障诊断方法。实验表明,在各种阈值下,采用该方法的轴承故障诊断综合评价指标AUC达到998%,性能指标高于传统故障诊断方法。  相似文献   

13.
针对轴承故障样本少导致识别精度低的问题,提出一种基于无监督迁移成分分析(unsupervised transfer component analysis,UTCA)和深度信念网络(deep belief network,DBN)的故障诊断方法。首先利用UTCA的核函数将不同工况样本特征映射到一个共享再生核Hilbert空间中,使得源域和目标域样本集更加相似,并通过最大均值偏差嵌入法(maximum mean discrepancy embedding,MMDE)判断能够迁移的源域数据,将源域样本迁移到目标域中,为深度学习提供充足的训练样本,解决了实际故障样本较少的问题;然后采用DBN模型对源域样本进行训练,再对映射后无标记的目标域样本进行故障诊断分析。利用不同工况下的滚动轴承实验数据进行算法验证,结果表明,与普通DBN、SVM、BPNN以及传统机器学习-UTCA融合方法相比,本文方法对滚动轴承故障的诊断精度更高。  相似文献   

14.
15.
针对轴承故障诊断问题,提出一种基于相关度分析与网格搜索算法(GS)优化支持向量机(SVM)的轴承故障诊断方法。采用GS算法对SVM的惩罚参数c和核函数参数g进行寻优,以此建立分类器用于识别轴承故障类型。在模型建立方面巧妙地加入了分层的思想,通过相关度分析之后采用多层GS-SVM模型使轴承的故障诊断准确率相对于近年来的研究得到了明显的提升。最后,采用凯斯西储大学轴承数据中心的滚动轴承故障数据进行了分类识别实验。实验表明,研究提出的轴承故障诊断方法在直接作用于原信号的基础上不仅能够有效的识别轴承正常状态、内圈故障、外圈故障以及滚珠故障,而且还对每一类故障的严重程度有很好的区分,提高了故障类样本的诊断正确率,具有较强的实用性。  相似文献   

16.
为实现工艺流程识别及阀门操作合理性诊断和可视化监测,利用半实物仿真系统采集的温度、流量信息建立了基于支持向量数据描述(SVDD)的工艺流程识别模型。对工艺流程识别进行了半实物仿真实验,对阀门操作进行了可视化监测和合理性判别,提出了基于数字滤波的改进工艺流程识别性能的方法。实验结果表明:无故障样本条件下建立的工艺流程识别模型能够准确地识别出相应的工艺流程,模型输出可以直观地反映阀门开度偏离设定工况的程度,为无故障样本条件下的阀门操作合理性诊断和可视化监测提供了一种新的技术手段。  相似文献   

17.
针对滚动轴承振动信号在强噪声环境下出现非线性、非平稳、强干扰特性,进而导致故障特征难以提取及故障诊断准确率低的问题,提出变分模态分解(VMD)-多尺度排列熵(MPE)-核主元分析(KPCA)特征提取与多分类相关向量机(MRVM)相混合的滚动轴承故障诊断方法.该方法首先通过VMD-MPE进行滚动轴承振动信号的高维故障特征提取,其次对提取的故障特征进行KPCA可视化降维,最后将降维后的故障特征输入可实现不同样本概率输出的MRVM进行滚动轴承故障诊断.通过美国西储大学的滚动轴承故障数据集对该方法的有效性进行验证,结果表明提出的VMD-MPE-KPCA特征提取与MRVM相混合的滚动轴承故障诊断方法能够有效提取和识别滚动轴承故障特征,所提出的混合智能故障诊断方法与相关文献报道的故障诊断方法相比较,故障识别准确率达到了99.18%.  相似文献   

18.
提出一种基于改进粒子群算法和支持向量机的滚动轴承故障诊断方法.首先分析基本粒子群算法的不足及其关键参数,提出多方面改进的粒子群算法,利用10种基准测试函数对比多种粒子群算法,证明该改进算法的优势.然后结合支持向量机,建立滚动轴承故障诊断模型,并提取滚动轴承振动信号的时域、频域、小波包节点能量和CEEMDAN分量排列熵四种特征,构成单一特征和组合特征作为诊断模型的输入特征向量.最后利用凯斯西储大学滚动轴承数据进行验证,并与网格算法、遗传算法和多种不同粒子群算法进行对比.试验证明,本改进粒子群算法优化支持向量机模型在滚动轴承故障诊断中更具优势.  相似文献   

19.
简述了恒转速条件下滚动轴承故障信号共振解调的优点和基本原理,通过实验和理论分析研究了变转速轴承故障振动信号的特点.指出了轴承损伤点冲击信号的非周期性、轴承共振频率随转速变化的变频特性,以及故障信号的双变频调制特性.建立了由变频转速信号为调制信号、变频共振衰减信号为载波的滚动轴承故障模型.给出了阶比循环平稳自相关函数的计算方法.利用循环平稳分析对旋转机械振动信号的解调功能,结合连续隐马尔可夫模型(CHMM)对动态信号的识别能力,提出了一种适用于变转速运转条件下的滚动轴承故障诊断方法,通过实验验证了方法的可行性.  相似文献   

20.
目的 在实际应用中采集的原始多模态故障数据通常是包含大量噪声和冗余信息的非线性数据,如何从不同故障模态中提取有效的非线性故障特征仍是一个挑战性的问题。方法 提出了一种鉴别流形敏感的跨模态故障诊断方法,在该方法中首先借助相关分析理论在跨模态故障空间中构建了不同模态间的相关系数,并通过理论推导获得了相关系数的等价优化模型,然后利用局部近邻图构建了鉴别流形敏感散布,进而通过最大化不同模态间的相关性和最小化鉴别流形敏感散布,形成了鉴别流形敏感的跨模态故障诊断模型,并且在理论上推导出了该优化模型的解析解,从而能够从不同模态的故障数据中学习强鉴别力的非线性故障特征。结果 在德国帕德博恩轴承数据集和多模态轴承故障数据集上设计了针对性实验,实验结果显示在少量故障样本用于训练时即可获得良好的诊断准确性。结论 提出的方法是一种有效的跨模态故障诊断方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号