首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对工业过程的非线性和多模态特征,提出了一种基于局部近邻标准化(local neighborhood standard ization,LNS)和主多项式分析(principal polynomial analysis,PPA)结合的故障检测算法。首先,将样本数据通过局部近邻标准化(local neighbor standardization,LNS)算法,对每个样本构建k近邻数据集;然后应用k近邻数据集的均值和方差对当前样本进行标准化处理;最后使用PPA对已经标准化处理后的样本建模,计算出T2和SPE统计量,并确定控制限进行故障检测。LNS算法能够去除数据中的多模态特征,而PPA算法能够有效的处理非线性数据,因此LNS-PPA方法能够提高具有多模态非线性特征的工业过程故障检测能力。将该方法应用于多模态非线性数值例子和田纳西伊斯曼(TE)化工过程,并将测试结果与主元分析法(principal component analysis,PCA)、主多项式分析法进行对比,其结果能够有效验证LNS-PPA的优越性。  相似文献   

2.
针对间歇过程数据的多模态与动态特性共存带来的故障检测问题,提出一种基于加权双近邻标准化(WDNS)的稀疏加权邻域保持嵌入(SWNPE)算法.首先,在寻找样本双层近邻的基础上加权得到加权双近邻集,用加权双近邻集信息标准化样本,将多模态数据处理为单一模态分布,消除多模态中心点差异,解决多模态特性;然后,考虑到NPE算法不能...  相似文献   

3.
使用多模态数据建模可以有效地克服单一模态信息量不足的问题,大大提高模型的性能.但在量化神经网络模型置信度,尤其是对于多模态融合模型方面并没有很多进展.基于此,提出一种基于嵌入的方法,在嵌入空间中通过计算样本间的距离进行局部密度估计,进而计算模型的置信度分数.该方法具备可扩展性,不仅可以用于单一模态模型,还可以用于多模态...  相似文献   

4.
5.
针对多维尺度变换(multidimensional scaling,MDS)方法对高维数据进行维数约简时,新样本缺少映射矩阵无法进行低维嵌入的问题,提出了增量式多维尺度变换(incremental multidimensional scaling,IMDS)方法。首先,引入双重局部近邻标准化(dual local nearest neighbor standardization,DLNS)技术以解决IMDS方法降维后数据仍然具有多中心、方差差异明显等问题;其次,采用Hotelling T2统计量对过程进行监控,组成增量式多维尺度变换和双重局部近邻标准化的故障检测方法(IMDS-DLNS);最后,通过数值模拟过程和青霉素发酵过程,将IMDS-DLNS方法分别与PCA,KPCA和FD-KNN等方法作对比分析。结果表明,IMDS-DLNS对比其他方法有更高的故障检测率。IMDS-DLNS方法对多变量、多模态过程具有良好的故障检测能力,能够保障产品质量和生产的安全性,可为工业过程故障检测研究提供参考。  相似文献   

6.
具有多模态特性的工业过程的数据分布呈现出与单模态过程不同的特性。在构造监控指标时,不仅要能够概括每个模态内部的数据统计特征,还要充分考虑到不同模态之间的信息。传统的T~2和SPE统计量在多模态过程中可能无法实现这一目标。提出了一种融合多模态统计信息的全局监控统计量,在贝叶斯推论的框架下,通过对每个模态的局部马氏距离赋予相应权重来实现对多模态数据的描述。通过多模态的连续反应搅拌釜(CSTH)仿真实验,验证了全局监控指标的有效性和灵敏性。  相似文献   

7.
多模态过程中各个模态均有不同的特征,因此模态数据的局部特征比全局特征更能有效、合理地表征实际化工过程。为利用多模态数据的局部特征,提出了基于数据局部特征的多模型方法(LFMM)用于多模态过程的监控。首先,离线阶段考虑到数据间的时序信息以及数据特征,利用不同时间窗内数据的变异系数(CV)完成多模态数据集的聚类;然后,考虑到不同模态的数据在空间分布上具有不同的疏密性特征,建模阶段利用局部离群因子(LOF)算法计算数据在其模态数据集中的局部密度,监控时将在线数据的局部密度作为统计特征,并构造全局概率指标用于多模态过程监控;最后,通过田纳西伊斯曼(TE)过程验证了本文方法的有效性。  相似文献   

8.
针对工业过程中存在的动态特性和多模态特性问题,提出一种动态加权差分主成分分析法(dynamic weighted differential principal component analysis,DWDPCA)。首先通过设置合理的时间窗描述系统的时序特性;其次对时间窗内的样本寻找第一近邻和第一近邻的近邻集,使用加权差分法对数据进行处理,解决数据中心漂移问题;最后利用处理好的数据建立主成分分析(principal component analysis,PCA)模型进行故障检测。该方法可解决数据动态、中心漂移问题。使用该方法对数值例子和TE(tennessee eastman)过程进行故障检测验证所提出方法的有效性。  相似文献   

9.
为解决数据流分类中概念漂移和噪声问题,提出一种基于互近邻的多源迁移学习方法。该方法存储多源领域上训练得到的分类器,求出目标领域数据块中每个样本的互近邻样本集合,然后计算源领域分类器对目标领域数据块中每个样本的互近邻样本集合的局部分类精度,最后将局部分类精度最高的源领域分类器和目标领域分类器进行加权集成,从而将多个源领域的知识迁移到目标领域。在仿真数据集上的实验结果表明,该方法能够有效避免伪近邻现象,与基于K-近邻的多源在线迁移学习方法相比,具有更好的分类准确率和抗噪稳定性。  相似文献   

10.
为了详细地分析文本单模态预训练模型RoBERTa和图文多模态预训练模型WenLan文本嵌入的差异,提出两种定量比较方法,即在任一空间中,使用距离一个词最近的k近邻词集合表示其语义,进而通过集合间的Jaccard相似度来分析两个空间中词的语义变化;将每个词与其k近邻词组成词对,分析词对之间的关系。实验结果表明,图文多模态预训练为更抽象的词(如成功和爱情等)带来更多的语义变化,可以更好地区分反义词,发现更多的上下义词,而文本单模态预训练模型更擅长发现同义词。另外,图文多模态预训练模型能够建立更广泛的词之间的相关关系。  相似文献   

11.
基于凸包的k局部超平面距离分类方法,通过改进k近邻算法在处理小样本问题时的决策边界而显著提高分类性能.但是,该方法对噪声和类的数目敏感,并且在一类样本"包围"另一类样本时,由于外围类凸包与内部样本的距离为零而导致分类错误.针对上述问题,提出了k子凸包分类方法,该方法融合了k近邻分类和凸包技术的优点,首先寻找测试样本的k近邻,然后在该邻域中计算测试样本到相应类的子凸包的距离,并根据距离大小来确定该测试样本的类别,有效克服了k局部超平面距离分类存在的不足.大量实验表明,文章提出的k子凸包分类方法在分类性能上具有显著的优势.  相似文献   

12.
多模态图像是同一目标的多种图像,面向多模态图像的子空间投影是机器视觉领域的热门研究课题,然而已有的多模态子空间投影仅仅利用投影方向来实现测试样本的子空间投影,忽略了测试和训练样本间的近邻关系,这种关系能够有效增强识别性能。为此,基于相关分析理论和图的光滑性准则,提出了一种新的广义辅助相关投影方法,即多模态广义辅助相关分析,该方法能够从多模态训练样本中学习每个模态对应的相关投影方向,并利用光滑性辅助的广义优化模型,显示地嵌入了测试和训练样本之间的局部结构信息,从而有效增强了相关特征的鉴别力。大量的实验结果已经展示了该方法的优越性。  相似文献   

13.
针对半导体工业过程多工序、变量非线性、非高斯分布等特征,提出一种基于扩散映射的K近邻(DMKNN)故障检测方法.充分利用扩散映射(DM)降维,提取低维流行特性,保留数据集内在非线性结构特性,应用改进的KNN故障诊断方法在低维流行特征空间进行检测.研究结果表明:与传统K近邻技术的统计方法相比,DMKNN的故障检测率高于其他算法,提升了对数据样本关联性信息的有效提取能力,保持了K近邻处理非线性、多模态检测问题的性能,验证了该方法的有效性.  相似文献   

14.
提出一种基于属性和距离加权的K近邻特征选择方法.该方法在计算样本类别时既考虑每个特征的重要程度,又考虑近邻样本的距离,使用遗传算法搜索最优特征权重向量.将该方法与已有的3种特征选择方法MIFS、DISR和CIFE在6个公开的数据集上进行比较,实验结果表明该方法是有效的,且可以提高分类性能.  相似文献   

15.
针对降维算法局部线性嵌入算法LLE(Local Linear Embedding)未能充分保留高维数据中邻域之间的结构的问题,提出了一种新的融合邻域分布属性的局部线性嵌入算法。该算法通过计算每个样本数据的邻域分布以及KL(Kullback-Leibler)散度度量不同邻域点与其中心样本各自的近邻分布差异,并利用其差值优化重构的权重系数,从而获得更精确的低维电机数据。通过可视化、 Fisher测量和识别精度3个评价结果验证了该算法挖掘电机轴承检测数据高维结构的有效性。  相似文献   

16.
对密度峰值聚类算法进行有效改进,计算各样本点之间的距离和各样本点局部密度,选择两者中较大的样本点作为聚类中心点,根据其余样本点与各中心点的距离设定样本点所属类别;引入K近邻算法对密度峰值聚类算法进行优化,求解各样本点的距离时只需要考虑其周围由邻近值决定的若干样本点,实现距离阈值的自动选取;根据距离矩阵计算样本点的密度,绘制决策图并选择簇内中心点,将剩余点根据密度值分配给离中心点距离最近的类;最后将K近邻-密度峰值聚类算法部署至Hadoop云计算平台,用于解决大规模数据聚类的问题。仿真结果表明,通过合理设置K近邻算法的近邻值k,K近邻-密度峰值聚类算法具有较好的大数据样本聚类性能,与常用聚类算法相比,该算法具有更高的聚类准确率和聚类效率,适用于大数据样本聚类。  相似文献   

17.
针对多模态过程数据密度不规则性提出的一类基于密度的方法,大多是以欧式距离为基础来比较彼此间的相似性,从而检测过程是否发生故障。然而多模态数据密度在较小范围内变化较大,采用欧式距离很难获得全面的数据信息。本文提出了一种新的基于加权距离选择邻居的策略,该策略首先对距离进行合理的加权,再根据新的加权距离重新选择样本点的邻居,能有效地避免数据信息不全面的问题。在仿真实验中,首先通过比较基于传统的欧式距离和基于本文加权距离选取的邻居,说明本文策略的优越性;进而将该策略与局部离群因子(Local Outlier Factor,LOF)结合用于TE过程,对TE过程的仿真结果表明该策略在应用于基于密度的检测方法上获得了的良好效果。  相似文献   

18.
针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on shared neighbors, SN-WLLE)算法,并用于滚动轴承故障诊断.该算法首先使用余弦距离划分样本邻域;其次计算样本邻域对相似度用以评估样本共享近邻信息,并结合样本的6种邻居分布修正局部结构挖掘,提高多共享近邻的k近邻重构准确性;接着从多流形的角度评估样本点与近邻点间的稀疏分布一致性,以获得样本的重要性指标,并在低维空间保持该信息,进而提取准确的鉴别特征;最后结合KNN分类器构建出完备的轴承故障诊断模型.采用凯斯西储大学轴承数据集和实验室测试平台轴承数据集,从可视化评估、定量聚类评估、故障识别精度评估及鲁棒性评估等方面进行分析.结果表明:SN-WLLE算法的F值保持在108以上水准,平均故障识别精度最低可达0.973 4,不仅具有较好的类内紧致性与类间可分性,还对近邻参数k具有低敏感性.  相似文献   

19.
目的 在实际应用中采集的原始多模态故障数据通常是包含大量噪声和冗余信息的非线性数据,如何从不同故障模态中提取有效的非线性故障特征仍是一个挑战性的问题。方法 提出了一种鉴别流形敏感的跨模态故障诊断方法,在该方法中首先借助相关分析理论在跨模态故障空间中构建了不同模态间的相关系数,并通过理论推导获得了相关系数的等价优化模型,然后利用局部近邻图构建了鉴别流形敏感散布,进而通过最大化不同模态间的相关性和最小化鉴别流形敏感散布,形成了鉴别流形敏感的跨模态故障诊断模型,并且在理论上推导出了该优化模型的解析解,从而能够从不同模态的故障数据中学习强鉴别力的非线性故障特征。结果 在德国帕德博恩轴承数据集和多模态轴承故障数据集上设计了针对性实验,实验结果显示在少量故障样本用于训练时即可获得良好的诊断准确性。结论 提出的方法是一种有效的跨模态故障诊断方法。  相似文献   

20.
针对网络入侵检测系统中的一般聚类算法速度较慢和精度较低的问题,提出了一种基于简化群优化的最优路径森林聚类算法(SSO-OFC).首先,将数据集解析为图,将其节点作为样本;然后,将每个样本连接到其给定特征空间中的k-近邻,图的节点由它们的概率密度函数(pdf)值加权得到;最后,通过样本及k-近邻之间的距离计算得到pdf值.提出的算法主要贡献是快速估计最佳k值,并将最优路径森林聚类应用于网络入侵检测.在5个公开的数据集上进行实验.结果表明,SSO-OFC的精度非常稳定,除了KddCup数据集,其他数据集上的精度都在95%以上,相比基于数据聚类的SSO和自组织映射更加稳定有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号