期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于PCA-KLFDA的小样本故障数据集降维方法 总被引：1，自引：0，他引：1

《华中科技大学学报(自然科学版)》2015,(12)

针对小样本故障数据集降维问题,提出一种基于主元分析(PCA)和核局部费歇尔判别分析相结合的子空间降维方法.该方法首先应用PCA提取数据集中的关键信息并实施降维,然后将该子空间通过高斯核方法映射至高维线性空间,并在高维空间基于局部费歇尔判别分析训练出一个最有辨别力的低维分类特征集.用双跨转子实验台的一组故障特征数据集进行验证,结果表明:该方法能有效应对小样本的降维问题,达到增大不同故障样本集合间距离、使同类故障样本间的类内距离减小的效果,为基于数据驱动途径实现智能故障辨识技术中涉及的小样本故障数据集类别划分问题提供了一种新方法. 相似文献

2.

基于互信息可信度的主成分分析数据降维

《湖北民族学院学报(自然科学版)》2019,(4)

数据降维就是将数据集从高维特征空间向低维特征空间的映射.传统的主成分分析(PCA)算法是一种常用的线性数据降维算法.但是耗时太长,降维结果不够好,同时不能满足实际分类要求.为此,通过引入互信息可信度,提出了一种基于互信息综合可信度的主成分分析(MIS-PCA)数据降维算法.该算法首先介绍互信息(MI)、相对互信息可信度(MIR)和绝对互信息可信度(MIA)的思想;然后根据MIA和MIR求解互信息综合可信度(MIS),利用互信息综合可信度进行特征筛选;最后再运用PCA算法对处理后的数据进行降维,并将降维后的数据采用KNN、SVM算法进行分类.对比PCA、E-PCA算法,通过试验表明该方法的降维结果较好、分类精确度较高. 相似文献

3.

结合PCA的t-SNE算法的并行化实现方法

下载免费PDF全文

徐旸王佳斌彭凯《华侨大学学报(自然科学版)》2022,(5):685-692

为了提高大数据环境下高维非线性数据的处理速度和精确度,提出一种结合主成分分析(PCA)的基于t分布的随机近邻嵌入(t-SNE)算法.首先,通过主成分分析法对原始数据进行预处理,去除噪声点;然后,结合t-SNE算法,构建K最邻近(K-NN)图,以表示高维空间中数据的相似关系;最后,在Spark平台上进行并行化运算,并在BREAST CANCER,MNIST和CIFAR-10数据集上进行实验.结果表明:文中算法完成了高维数据至低维空间的有效映射,提升了算法的效率和精确度,可应用于大规模高维数据的降维. 相似文献

4.

一种自适应局部线性嵌入与谱聚类融合的故障诊断方法 总被引：4，自引：1，他引：3

张育林庄健王娜王孙安《西安交通大学学报》2010,44(1)

针对数据维数高、非线性且从高维观测空间分析数据模式困难的问题,将改进的流形学习算法引入到数据聚类中,提出了一种结合自适应局部线性嵌入和递归调用规范切融合的新方法.采用自适应局部线性嵌入对原始数据进行非线性降维,应用递归调用规范切对低维空间数据进行聚类,通过对3组UCI标准测试数据集的仿真实验表明,新方法能够将高维数据有效地映射到低维本质空间,克服了传统方法对数据集结构的依赖性,从而显著提高了谱聚类算法分类的准确性和稳定性.同时,对于田纳西-伊斯曼过程的数据实验,表明了该方法对故障模式识别的可行性和有效性. 相似文献

5.

基于t-SNE算法的ICN缓存容量分配机制

《郑州大学学报(理学版)》2019,(3)

针对现有ICN中节点负载不均衡、重要节点缓存利用率低、缓存开销大等问题,面向互联网主干网节点,提出了基于t-SNE算法的ICN缓存容量分配机制.首先,收集网络拓扑信息和流量特征信息并建立高维数据集;然后,通过构造K-近邻表征相似性的方式改进t-SNE算法,对数据集进行降维并对网络节点进行聚类划分;最后,基于聚类结果,将有限的缓存容量合理地分配给不同节点以平衡节点负载.仿真结果表明,本设计的缓存容量分配机制和基准机制相比,在保证路由成功率维持在约95%的前提下,缓存命中率提升了3%～4%,平均缓存开销减少了13. 5%～23. 4%. 相似文献

6.

基于t分布随机邻域嵌入算法的工业过程故障分类

陶飞苗爱敏李鹏曹敏李维《南京理工大学学报(自然科学版)》2020,44(3)

针对在工业过程中数据普遍存在的非线性特性,基于数据的局部相关关系对分类的影响,提出一种基于t分布随机邻域嵌入(t-SNE)的数据特征提取和故障分类方法。利用t-SNE算法非线性、非参数降维的优势,与费舍判别分析(FDA)、支持向量机(SVM)分类器相结合建立故障分类模型。利用t-SNE算法对故障数据进行非线性特征提取,获取数据的关键区分特征。用FDA和SVM算法实现故障分类和识别。通过田纳西-伊士曼(TE)过程获得的实验数据进行实验仿真分析,并分别与基于核主元分析法(KPCA)、拉普拉斯特征映射(LE)构建的KPCA-FDA、LE-FDA、KPCA-SVM、LE-SVM 4种故障分类模型进行比较。定量评估结果表明:即使基于不同分类器,相较于其他2种方法,该文方法的分类准确率分别提升了2%和7%,且其平均分类准确率能保持在97%以上。相似文献

7.

基于多元图形特征融合原理的降维方法研究 总被引：1，自引：0，他引：1

孟辉洪文学宋佳霖王立强《燕山大学学报》2008,32(5)

降维是将高维模式映射到低维子空间的过程.在降维后的低维子空间进行分类往往能得到更好的效果.本文以高维数据为研究对象,采用多元描述图对高维数据进行可视化表达,采用多元图图形特征融合的方法对高维数据进行降维,用K邻分类器进行分类效果评价.与Fisher线性判别及其他一些常用非线性降维方法相比,本文所提方法在数据的可视化以及分类精度等方面均有较好效果. 相似文献

8.

基于GSRDPGE算法的转子故障数据集降维方法研究

周宏飞赵荣珍《兰州理工大学学报》2023,(4):35-41

针对旋转机械故障数据集因高维和信息冗余而导致故障分类困难的问题,提出有效降低数据维数的组稀疏残差判别保持图嵌入算法.首先,该算法改进了类间稀疏编码的方式,得到了更具判别性的类间稀疏权重矩阵;然后,通过加权的方式清除特征集中离群点对稀疏编码的影响;最后,以类内重构散度最小、类间重构散度最大为目标计算最优判别投影矩阵.通过Iris仿真数据集和双跨转子系统的故障数据集对所提算法进行验证,并与其他几种典型降维算法对比,证明该算法能够同时兼顾数据分布状态的全局性和局部性,使故障类别之间差异性更突出,并能够提高故障模式识别准确率.研究表明,该算法可为转子故障智能诊断提供参考依据. 相似文献

9.

面向高维数据PCA-ReliefF的EP模式分类算法

程玉胜胡飞程百球《安庆师范学院学报(自然科学版)》2015,21(4):28-32

针对高维数据集,文中提出一种PREP( PCA-ReliefF for EP)算法:首先采用PCA和ReliefF算法实现特征降维;然后利用EP模式思想,构造精度更高、规模更小的EP模式分类器;最后利用标准数据集对文中的方法进行测试.实验结果表明,在对高维数据进行分类时,该方法构造的分类器在预测精度和运行时间上均有较大幅度的提升. 相似文献

10.

基于小波变换和改进PCA的人脸特征提取算法

张颖马承泽杨平王新民《吉林大学学报(理学版)》2021,59(6):1499-1503

针对在人脸图像高维数据降维时单纯使用主成分分析(PCA)算法的提取精度和速度受限问题, 提出一种基于小波变换和改进PCA的混合特征提取算法. 该方法首先对人脸图像进行小波分解, 选取低频分量对人脸图像进行特征提取;然后利用改进的PCA算法进行主成分提取, 获得代表人脸特征的特征向量; 最后将该算法应用于Olivetti Faces人脸库数据集的图像分类. 实验结果表明, 经过该混合算法处理后的图像特征数据, 由卷积神经网络(CNN)算法分类识别时准确率提升10%, 识别速度提高约37%. 相似文献

11.

一种基于非线性特征提取的数据降维算法

《平顶山学院学报》2016,(5):70-73

为了获得良好的图像分类效果,需要采集尽可能多的图像数据特征,进而使得图像原始特征空间的维数越来越高,造成维数灾难.特征提取是通过线性或者非线性映射,将高维特征空间映射到低维空间,从而降低数据维数.现有的特征提取算法往往忽视了数据本身特有的复杂结构以及非线性因素,造成映射方向的模糊以及分类精确度的缺失.充分考虑了图像数据本身的二维特性,通过改进的非线性特征提取方法、流形学习方法来提取图像特征.实验表明,该算法在不影响图像分类效果的前提下可以大大降低数据维数,减少计算复杂度. 相似文献

12.

基于M-WDLS和PCA的转子故障诊断方法

赵荣珍常书源《兰州理工大学学报》2021,47(5):38

针对不同故障特征属性交互重叠导致的故障类别辨识困难问题,提出一种基于Manhattan距离作为特征之间相似度信息测度的权值判别拉普拉斯分值特征选择方法.该方法采用Manhattan距离衡量高维特征矢量之间的相似度,并将数据样本标记信息融入权值计算中以增强权值的判别性,提升了LS算法的敏感特征筛选性能.将M-WDLS和主成分分析相结合,提出基于M-WDLS和PCA的转子故障诊断方法.首先提取原始振动信号的时域、频域、时频域特征构造混合域特征集;然后利用M-WDLS选择敏感特征组成敏感特征矩阵;最后对敏感特征矩阵进行PCA降维处理,并将结果输入到K-近邻分类器中进行模式识别.对比实验的结果表明,该方法能有效提取转子系统振动信号的状态特征,有助于提高故障辨识的准确率. 相似文献

13.

文本分类中基于CHI和PCA混合特征的降维方法

唐加山段丹丹《重庆邮电大学学报(自然科学版)》2022,34(1):164-171

中文文本数据的半结构化甚至非结构化的特点使得其分类存在着特征高维的问题,传统单一的特征降维方法难以满足大数据时代的文本分类需求.基于此,提出了一种基于卡方统计(Chi-square statistics,CHI)和主成分分析(principal component analysis,PCA)的混合特征降维方法(CHI-... 相似文献

14.

改进测度下的模糊C均值三元催化器故障诊断方法

李鹏华刘晶晶冯辉宗米怡《重庆大学学报(自然科学版)》2018,41(1):88-98

针对采用物理建模刻画三元催化器故障演化精确性不足问题,提出一种基于尾气大数据的改进测度模糊C均值(FCM,fuzzy c-means),故障诊断方法。该方法包括分数阶傅里叶变换(FRFT,fractional fourier transform)下的故障特征提取与优化、核熵成分分析(KECA,kernel entropy component analysis)下的分形故障特征降维以及改进相似测度下的FCM故障特征聚类。首先,对不同工况的尾气数据进行FRFT处理,获取三元催化器从时域到频域的精细故障信息,同时利用粒子群算法(PSO,paticle swarm optimization)选取最优的FRFT特征,并由分形算子给出相应精细特征的分形维数;其次,借助KECA对候选的高维分形特征进行维数约简;最后,将获得的故障特征提交给改进测度的FCM故障分类器完成故障诊断。数值实验结果表明,较之采用欧式距离或余弦距离的FCM方法,研究方法的故障诊断精确度更高。相似文献

15.

基于自适应主成分分析维度寻优的脑力负荷识别

曲洪权王飞月庞丽萍《科学技术与工程》2022,22(26):11342-11347

脑力负荷识别对提高作业操作人员工作效率,减少人因事故具有重要意义。然而,由于脑电(electroencephalogram, EEG)信号的采集是由多通道脑电帽采集的,并且分布在各个频带上,因此经过特征提取得到的特征维度过高,造成后续识别模型复杂度过高。对此,通常使用主成分分析(principal component analysis, PCA)对高维特征向量进行降维处理,但是降维维度的取值很难确定。提出了一种基于主成分分析的自适应维度寻优方法,将实验数据集中的高维特征使用主成分分析降维到寻优维数范围内的各个维度,并将各个维度的分类精度绘制成维度—分类精度曲线,通过识别该曲线的“肘部”来确定该实验数据集的最优降维维度,并将该维度应用到同实验的其他实验数据上进行脑力负荷识别。结果表明,该方法可以准确识别出在同实验数据集中通用的最优降维维度,有效提高识别效率。相似文献

16.

基于验证集辅助的脑电信号包裹式降维

张杰曲洪权柳长安庞丽萍《科学技术与工程》2023,23(30):12835-12841

当今时代信息技术的高速发展促使人们对人机交互领域投以更多的目光,随时监测操作者脑力负荷情况并依此对操作者的任务工作量进行调整,在当下有着重要意义。有研究表明,脑电信号功率谱密度对于脑力负荷分类任务较为适用,但脑电特征维数较高,极易出现维度灾难。目前机器学习中降维方面应用最广泛的算法为主成分分析(principal component analysis, PCA),针对主成分分析在脑电信号分类上的不适应性和支持向量机(support vector machine, SVM)对特征间关系的敏感性,提出了基于PCA-SVM与逐阶枚举法的包裹式降维方法,在特征工程阶段引入固定验证集概念辅助包裹式降维,以验证集精度为指标调整特征工程方案,以此提高数据降维后的可分性。由于引入了监督学习概念,实验结果表明,基于PCA-SVM与逐阶枚举法降维过后的数据分类精度要普遍高于只依靠传统PCA的降维方式,以此为高维生物电数据降维提供了新思路。相似文献

17.

基于EEMD与模糊信息熵的旋转机械故障诊断方法

赵荣珍张琛邓林峰《兰州理工大学学报》2020,46(3):39

针对旋转机械故障识别率偏低的问题,提出一种基于EEMD与模糊信息熵的旋转机械故障诊断方法.该方法结合EEMD分解和模糊信息熵在特征提取方面的优势,构造出一种能够精细度量不同类别振动信号故障概率复杂度的特征集合.首先将原振动信号进行EEMD分解,获得若干个本征模态函数(IMFs);计算出前5个高频IMF分量的模糊信息熵组成高维特征集;利用LPP对高维特征集进行维数约简剔除冗余不相关特征;最后将约简后的样本集输入到KNN分类器中进行故障识别.用双跨转子实验台采集的数据对所述方法进行验证,并与EMD模糊熵、EMD模糊信息熵、EEMD模糊熵方法进行故障识别率对比,结果表明该方法能够有效提取转子振动信号的故障特征,并且具有更高的故障识别率. 相似文献

18.

基于机器学习的高血压病历文本分类

胡婧刘伟马凯《科学技术与工程》2019,19(33):296-301

为了探讨中文病历文本预处理后高维稀疏性的特点,导致文本分类精度低、算法模型收敛速度慢等性能问题,提出一种基于粗糙集的词袋(BOW)模型结合支持向量机(SVM)的文本分类算法(BOW+SVM)。该算法首先采用BOW模型对特征词提取构建高维度文本空间向量,然后利用粗糙集的属性约简算法对文本特征处理,把模糊的、冗余的属性从决策规则中清除,降低空间向量维数,最后利用所提纯的特征与SVM分类器交叉结合进行文本分类。在Python+TensorFlow环境中设计六种交叉结合的算法仿真对比实验,结果表明:基于BOW+SVM高血压病历文本分类模型精准度可达97%。可见改进后的模型,能够解决样本分部不均,克服高维度稀疏特征空间的问题,有效改善病案管理工作流程。相似文献

19.

基于主成分分析和改进K-means算法的极轨气象卫星数据处理软件分型研究

林曼筠赵现纲皇甫大鹏陈平《北京师范大学学报(自然科学版)》2017,53(6):656-662

提出了一种基于主成分分析方法和改进K-means算法的气象软件分型方法,该方法利用软件运行时资源消耗情况来刻画软件运行特征和对软件分类.首先引入主成分分析方法对软件运行特征进行降维;然后采用改进K-means算法对气象数据处理软件进行分型;最后结合主成分分析结果解释各类软件运行特征的意义.提出了一套指标体系刻画软件,使用该指标体系可以判断极轨气象卫星数据处理的各类软件运行是否正常,通过实验证明,该方法的分类结果与实际情况相符.同时,该指标体系可作为优化软硬件资源分配和提高软件运行效率的依据. 相似文献