首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出一种基于流形距离的局部线性嵌入算法,以流形距离测度数据间的相似度,选择各样本点的近邻域,解决了欧氏距离作为相似性度量时对邻域参数的敏感性.在MDLLE算法中引入最大边缘准则(maximum margin criterion,MMC)来构建最优平移缩放模型,使得算法在保持LLE局部几何结构的同时,具有MMC准则判别能力.通过正交化低维特征向量可消除降维过程中的噪声影响,进而提高算法的监督判别能力.由实验结果得到,所提出的方法具有良好的降维效果,能有效避免局部降维算法对邻域参数的敏感.随机投影独立于原始高维数据,将高维数据映射到一个行单位化的随机变换矩阵的低维空间中,维持映射与原始数据的紧密关系,从理论上分析证明了在流形学习算法中采用随机投影可以高概率保证在低维空间保持高维数据信息.  相似文献   

2.
基于PCA-KLFDA的小样本故障数据集降维方法   总被引:1,自引:0,他引:1  
针对小样本故障数据集降维问题,提出一种基于主元分析(PCA)和核局部费歇尔判别分析相结合的子空间降维方法.该方法首先应用PCA提取数据集中的关键信息并实施降维,然后将该子空间通过高斯核方法映射至高维线性空间,并在高维空间基于局部费歇尔判别分析训练出一个最有辨别力的低维分类特征集.用双跨转子实验台的一组故障特征数据集进行验证,结果表明:该方法能有效应对小样本的降维问题,达到增大不同故障样本集合间距离、使同类故障样本间的类内距离减小的效果,为基于数据驱动途径实现智能故障辨识技术中涉及的小样本故障数据集类别划分问题提供了一种新方法.  相似文献   

3.
对大脑皮层厚度数据进行建模从而实现阿尔茨海默症的诊断.在训练样本少,数据复杂且非线性的情况下,相比于BP神经网络和k最近邻等算法,支持向量机算法表现出更优良的特性.针对支持向量机算法受数据高维度的影响,将t分布随机邻域嵌入算法引入到支持向量机模型.t分布随机邻域嵌入算法既能撷取原始高维数据的局部信息,也能揭示全局结构.t分布随机邻域嵌入算法先将这些非线性数据降维到低维空间,支持向量机算法再将这数据映射到新的高维空间,通过寻找最佳分类超平面的方法,使分类效果达到最佳水平.最后将集成学习算法AdaBoost的思想融入模型,可以使模型的分类准确率得到提升,而且变得鲁棒性更强.  相似文献   

4.
特征选择是从特征集合中选择相关特征子集,方便数据聚类、分类和检索等.现有的无监督特征选择算法是将高维数据映射到低维空间并计算每个特征的得分,选择排名靠前的特征.提出一种基于稀疏聚类的无监督特征选择算法:首先利用流形学习的特征映射思想将高维空间的数据映射到低维空间中,用样本构造近邻图,通过图的嵌入找到低维空间,降维后的空间能保持原始数据集的流形结构.其次,得到的样本嵌入矩阵表示特征的重要性,是区分特征对每一个聚类簇的贡献大小的指标,利用低维空间对高维空间的拟合,构造一个目标函数.最后,目标函数本质是回归问题,求解回归优化问题常用最小角回归算法,使用L_1范数进行稀疏回归计算每个特征的得分,选出得分靠前的特征.在六个现实数据集上的实验结果表明:该算法在聚类精度和互信息上取得了较好的实验结果,能有效地选出重要特征,在降维方面具有良好性能,优于其他对比算法.  相似文献   

5.
文本数据具有高维、稀疏、海量的特性,给传统的聚类算法带来了极大挑战.提出一种基于t-分布随机近邻嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)的文本聚类方法.首先通过t-SNE将高维文本数据嵌入到低维空间,使得高维空间相似度较低的文本对应的映射点距离较远,而相似度较高的文本对应的映射点距离较近;然后根据低维空间映射点坐标,再采用传统的聚类分析算法进行聚类,得到最终的聚类结果.在多个基准文本数据集上进行了实验测试,验证了该方法的有效性.  相似文献   

6.
为了提高大数据环境下高维非线性数据的处理速度和精确度,提出一种结合主成分分析(PCA)的基于t分布的随机近邻嵌入(t-SNE)算法.首先,通过主成分分析法对原始数据进行预处理,去除噪声点;然后,结合t-SNE算法,构建K最邻近(K-NN)图,以表示高维空间中数据的相似关系;最后,在Spark平台上进行并行化运算,并在BREAST CANCER,MNIST和CIFAR-10数据集上进行实验.结果表明:文中算法完成了高维数据至低维空间的有效映射,提升了算法的效率和精确度,可应用于大规模高维数据的降维.  相似文献   

7.
基于等距离映射的非线性动态故障检测方法   总被引:2,自引:0,他引:2  
针对化工过程数据强非线性和动态性的特点,提出了一种基于动态等距离映射(Dynamic Isometric Mapping,DISOMAP)流形学习的非线性过程故障检测方法.该方法首先采用DISOMAP算法提取训练样本的子流形特征,自适应学习近邻点参数,保留了采样数据的流形结构,然后运用线性回归方法得到原空间和降维子流形空间的投影映射,从而将观测数据从原高维空间映射到低维嵌入空间,最后在变换后的低维空间构造统计量T2和SPE进行监控.TE过程的仿真结果表明,所提出的DISOMAP故障检测方法可以比核主元分析(Kernel Principle Component Analysis,KPCA)更为有效地监控过程变化,检测到故障的发生.  相似文献   

8.
数据降维就是将数据集从高维特征空间向低维特征空间的映射.传统的主成分分析(PCA)算法是一种常用的线性数据降维算法.但是耗时太长,降维结果不够好,同时不能满足实际分类要求.为此,通过引入互信息可信度,提出了一种基于互信息综合可信度的主成分分析(MIS-PCA)数据降维算法.该算法首先介绍互信息(MI)、相对互信息可信度(MIR)和绝对互信息可信度(MIA)的思想;然后根据MIA和MIR求解互信息综合可信度(MIS),利用互信息综合可信度进行特征筛选;最后再运用PCA算法对处理后的数据进行降维,并将降维后的数据采用KNN、SVM算法进行分类.对比PCA、E-PCA算法,通过试验表明该方法的降维结果较好、分类精确度较高.  相似文献   

9.
分析了人脸与非人脸之间的本质区别,提出了运用局部线形嵌入(LLE)的非线性降维方法,解决非线性结构的高维数据(图象)低维表示的问题,实现了高维输入数据点映射到一个全局低维坐标系,同时保留了邻接点之间的空间关系(即高维空间的几何结构).此算法不仅能够有效地发现数据的非线性结构,同时还具有平移、旋转不变性.运用LLE算法对图象进行降维,再对降维后的数据运用支持向量机(SVM)分类器进行人脸和非人脸的分类.实验结果表明,该人脸检测方法测率较高,并且不受姿态、表情和光照的影响.  相似文献   

10.
高维数据流形的低维嵌入问题研究   总被引:1,自引:0,他引:1  
Isomap是基于流形理论提出的一种非线性降维方法,用于恢复潜藏于高维空间低维子流形中数据的低维参数。Isomap方法的一个重要前提是假设数据空间与参数空间之间存在等距映射。通过流形学习和对Isomap方法的分析,证明了高维数据空间与参数空间之间存在一般意义下的等距映射,并引用一个基于Isomap的实例说明Isomap算法的有效性。  相似文献   

11.
尹方平 《科学技术与工程》2012,12(34):9390-9395
针对人脸识别问题,提出了一种新的算法。该算法首先用gabor小波对人脸图像进行特征提取。然后采用LLE算法进行降维。最后用FSVM和三叉决策树相结合设计识别分类器进行人脸识别。在降维的过程中,针对高维空间相似性度量函数和自适应参数选取方法上,对LLE算法进行了改进。在ORL人脸数据库的仿真结果表明,该算法能有效提高人脸识别性能,具有较高识别率。  相似文献   

12.
针对传统降维方法难以保持数据集的局部与全局几何结构特征问题,选择测地距离作为度量指标,提出改进t-SNE的故障数据集降维方法D-t-SNE.首先提取消噪振动信号的多域高维故障数据集,在对其进行归一化处理之后,利用GD指标改进后的D-t-SNE算法对高维故障数据集进行降维运算,去除冗余信息,然后通过不同的分类器对低维特征子集进行故障模式辨识.以UCI数据集和双跨转子实验台的模拟故障数据集为实验对象对D-t-SNE算法进行验证,并与SNE和t-SNE算法的各项实现结果进行对比.结果表明,D-t-SNE算法具有通过降低高维故障数据集的维数从而达到降低故障分类难度、提高故障辨识准确率的性能,可为降低旋转机械原始故障特征数据集的规模、降低故障分类的难度与提高故障辨识结果的可视化效果提供理论参考依据.  相似文献   

13.
一种自适应局部线性嵌入与谱聚类融合的故障诊断方法   总被引:4,自引:1,他引:3  
针对数据维数高、非线性且从高维观测空间分析数据模式困难的问题,将改进的流形学习算法引入到数据聚类中,提出了一种结合自适应局部线性嵌入和递归调用规范切融合的新方法.采用自适应局部线性嵌入对原始数据进行非线性降维,应用递归调用规范切对低维空间数据进行聚类,通过对3组UCI标准测试数据集的仿真实验表明,新方法能够将高维数据有效地映射到低维本质空间,克服了传统方法对数据集结构的依赖性,从而显著提高了谱聚类算法分类的准确性和稳定性.同时,对于田纳西-伊斯曼过程的数据实验,表明了该方法对故障模式识别的可行性和有效性.  相似文献   

14.
高维空间的近邻检索是多媒体信息领域的重要研究课题.文章提出一种基于CUDA的高维空间距离检索排序算法,通过并行优化空间距离计算及排序过程,充分利用GPU硬件特性和它的并行运算能力,能极大地提高高维空间的检索速度,并可获取精确的距离排序数据.实验结果表明,该文算法可达到百万级别高维数据的实时检索,极大地拓展了高维检索的应...  相似文献   

15.
如何在高维图像数据库中快速有效地检索相似图像一直是图像检索领域的主要研究课题之一.本文提出一种基于自组织特征映射网络(SOFM)的高速图像检索算法,在保留高维空间距离的前提下将图像特征映射到一维空间,在低维空间的限定范围内完成检索工作.通过Corel图像数据库(51 138幅图像)进行的实验表明该算法既明显地提高了检索...  相似文献   

16.
针对无线传感器网络中通信数据的高维、高冗余现象,基于高维空间往往可以由其低维来本质表示这一特性,提出一种基于广义逆非负矩阵分解的无线传感器网络节能通信(giNMF)算法.首先,采用奇异值分解方法对原始通信数据矩阵进行初始化操作,求出其对应的特征空间;然后,采用非负矩阵分解方法对奇异值分解后的矩阵进行降维操作,利用乘法更新法快速求解出最终降维结果.仿真实验结果表明:giNMF算法能够对通信数据进行有效压缩,从而降低通信能耗,延长网络生命周期,达到节能的目的.  相似文献   

17.
为了获得良好的图像分类效果,需要采集尽可能多的图像数据特征,进而使得图像原始特征空间的维数越来越高,造成维数灾难.特征提取是通过线性或者非线性映射,将高维特征空间映射到低维空间,从而降低数据维数.现有的特征提取算法往往忽视了数据本身特有的复杂结构以及非线性因素,造成映射方向的模糊以及分类精确度的缺失.充分考虑了图像数据本身的二维特性,通过改进的非线性特征提取方法、流形学习方法来提取图像特征.实验表明,该算法在不影响图像分类效果的前提下可以大大降低数据维数,减少计算复杂度.  相似文献   

18.
基于经典等距特征映射(ISOMAP)算法易受噪声干扰和邻域大小影响,采用局部测地距离估计输入数据点的初始邻域,并结合增量学习思想,提出一种基于局部测地距离估计的增量ISOMAP算法进行降维,以提高ISOMAP算法的分类能力.人脸识别试验表明,该算法识别性能优越,对噪声和几何形变具有鲁棒性.
  相似文献   

19.
针对传统的基于距离的离群点识别方法难以直接有效地应用于高维数据且识别效果受参数影响的问题,本文提出了一种自适应的高维离群点识别方法,该方法利用经遗传算法优化的高斯受限玻尔兹曼机将高维数据非线性地映射到低维空间,然后通过自适应的离群点识别方法在低维数据空间进行离群点识别。采用UCI高维数据和中药高维数据进行验证实验,实验结果表明自适应的高维离群点识别方法能自适应地、有效地识别出高维数据中的离群点。  相似文献   

20.
特征匹配是目标识别的基础,文章针对特征描述子在多变复杂场景中的自适应问题,从特征向量的低维度、高稳健、易计算3个方面,结合核主成分降维、匹配核的空间映射以及Power-law归一化等特征处理方法,提出一种面向复杂变换环境的集成低维度的特征匹配算法.首先,采用线性内积核将特征向量映射至高维空间提取特征主成分,然后通过He...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号