首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统近邻保持嵌入算法(NPE)侧重保持样本的局部结构,而没有考虑样本类别信息的不足,提出判别局部近邻保持嵌入算法DLNPE.该算法利用样本点的局部结构构造新定义下的类内类间散布矩阵,并以此作为判别信息引入目标函数.在6个真实数据上进行实验,证明了所提算法的有效性.  相似文献   

2.
高维数据的降维方法研究及其应用   总被引:3,自引:0,他引:3  
讨论了高维数据的降维方法及应用,采用进制分解的方法将数字图像无损转化为二值图像,从而将原图像的处理转化为对二值图像的处理.从理论上,论证了二值图像的无损性,以此为根据对二值图像进行了相应的分析,包括压缩、图像分析、信息融合等.  相似文献   

3.
宋靓 《科技信息》2011,(12):119-120
随着新工具,新技术的产生,人们使用越来越多的变量数据来描述某一现象,即为高维数据。但随着数据变量的增多,产生了前所未有的困难。文章介绍了降维方法来解决这一问题,并通过举例介绍了非线性降维方法在解决降维问题过程中的优势和重要意义。  相似文献   

4.
在许多机器学习的任务中,人们常常使用有标签的数据,但是现实中无标签的数据是大量存在的.提出一种基于半监督学习理论的数据降维方法,为能够发现局部的流形结构,算法寻找一个能够最小化类内距离,同时最大化类间距离的投影,同时在最优化过程中借助无标签数据作为调节因子.多个数据库上测试的结果验证了算法的有效性.图2,参13.  相似文献   

5.
对随机旋转集成方法提出了一种针对降维问题的改进,得到了新的降维算法框架进行随机变换降维,可以显著减少降维过程中造成的信息损失.采用随机变换降维后,训练监督学习算法时可以获得更高的准确率和更好的泛化性能.通过在模拟数据上进行的实验,证明了使用多重共线性数据进行回归分析时,与传统降维算法相比,经随机变换降维处理后可以保留更多的信息,获得更小的均方误差.对随机变换降维在手写数字识别数据集上的表现进行了研究,证明了与一般性的降维算法相比,随机变换降维在图像分类问题上可以获得更高的准确率.  相似文献   

6.
为了构建能反映高维数据本质结构的高质量图,提出了一种新颖的降维方法———基于自适应图的降维方法( DRAG: Dimensionality Reduction based on Adaptive Graphs) 。与其他传统的基于图的降维方法相比,提出的DRAG 避免了传统k 近邻或ε 球准则构图策略中的参数选择问题,考虑了数据的局部信息和噪声,能自适应地构建稀疏的最优图结构,并将其结合在经典的LPP( Locality Preserving Projection) 模型中,学习能有效刻画高维数据本征结构的投影矩阵,从而实现降维的目的。为了评估算法的有效性和可行性,在4 个标准的图像数据库( CMU PIE,Extended YaleB,ORL 和COIL 20) 分别进行了分类与聚类实验,实验结果表明,所提出的方法在分类识别率和聚类准确率上都优于其他对比方法。  相似文献   

7.
传统的基于向量的降维算法需要将图像数据进行向量化处理。然而,向量表示难以考虑数据各维度上的变化,容易丢失有效的结构信息和判别信息。为此,从数据的张量表示出发,将新近提出的稀疏保持投影方法(sparsity preserving projections,SPP)推广到张量空间中,提出了基于张量的稀疏保持投影降维方法。该方法可直接将图像数据作为张量目标进行运算,保留了数据的完整性以及数据的原始结构和判别信息。降维的同时保持了原始张量空间中数据样本的稀疏重构信息。人脸数据库的识别实验结果表明,基于张量的稀疏保持投影降维方法能有效地提高识别率。  相似文献   

8.
以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性与可解释性,提出了基于稀疏正则化的特征抽取模型,为高维特征降维提供了一种新思路.  相似文献   

9.
为了获得良好的图像分类效果,需要采集尽可能多的图像数据特征,进而使得图像原始特征空间的维数越来越高,造成维数灾难.特征提取是通过线性或者非线性映射,将高维特征空间映射到低维空间,从而降低数据维数.现有的特征提取算法往往忽视了数据本身特有的复杂结构以及非线性因素,造成映射方向的模糊以及分类精确度的缺失.充分考虑了图像数据本身的二维特性,通过改进的非线性特征提取方法、流形学习方法来提取图像特征.实验表明,该算法在不影响图像分类效果的前提下可以大大降低数据维数,减少计算复杂度.  相似文献   

10.
准噶尔盆地石炭系火山岩岩性复杂,在某种岩性薄片、岩心等资料数量明显少于其他岩性时,常规方法划分岩性存在困难。为了解决上述问题,提高火山岩岩性识别精度,运用SMOTE算法增加少数岩性类别样本数量,解决数据不均衡问题;通过网格搜索和K折交叉验证法确定最优参数组合,开展基于改进随机森林的火山岩岩性识别研究。通过分析火山岩岩心、薄片、测井响应特征等资料,建立了岩性交会图版,确定了研究区对岩性敏感的测井参数重要性程度。实例资料应用表明,改进的随机森林算法有效的解决了传统随机森林算法受岩性样本类型不均衡及数据量较小的影响,火山岩岩性识别准确率由87%提升到了94%,为不均衡样本情况下火山岩岩性识别提供借鉴。  相似文献   

11.
12.
高燕  杨小远 《河南科学》2014,(8):1451-1456
提出一种基于噪声白化和端元提取的加权仿射变换算法用于高光谱图像数据降维,相比较于基于端元提取的仿射变换算法,通过该算法降维后数据的信噪比更高,同时对原始信息的保存量更大,波段之间的相关性更低,从而表明了该算法的有效性.  相似文献   

13.
为提高三维模型的识别速度以及检索准确率,提出一种基于语义邻域的数据降维方法.通过基于内容的三维模型检索过程中的相关反馈记录,构造一个三维模型的语义邻接图,采用其中任意两点的最短路径长度来近似代替两点在流形空间上的测地距离,再通过多维尺度分析(MDS)算法来构造数据点在低维欧氏空间中的内在表示.对Princeton ShapeBenchmark的实验表明,该方法在数据的低维嵌入中保留了数据之间的语义关系,在三维模型检索中取得了更好的检索效果.  相似文献   

14.
基于哈希表的动态向量降维方法的研究及应用   总被引:1,自引:1,他引:0       下载免费PDF全文
提出并实现了一种简洁的基于哈希表的动态向量降维方法.该方法用哈希表作为文档特征向量的存储数据结构,省去了预先构建向量模板的环节,实现了高维次稀疏特征向量的动态降维,有效减少了分类算法的数据计算量,能够显著提高分类器的性能.  相似文献   

15.
非线性降维在高维医学数据处理中的应用   总被引:9,自引:0,他引:9  
针对非线性高维医学数据降维的困难,引入了一种新的非线性降维方法Isomap,并从算法原理的角度讨论了方法在医学数据处理中的适用性。该文将Isomap应用在两个典型医学数据集(肺癌基因表达数据和乳腺癌病理数据)的分析中,发现它们的本质维数都低于3,因而可以得到在低维投影空间中的可视化表示。实验进一步将Isomap和主成份分析(PCA)的投影结果相比较,并统计类内距离,结果显示Isomap优于传统的线性降维技术。这说明了非线性降维技术在高维医学数据分析中的潜力。  相似文献   

16.
针对缺失数据下线性泛函估计中存在的非参数高维问题和模型参数化后的稳健性问题,提出了线性泛函估计的半参数降维推断方法,通过非参数函数估计来插补线性泛函,井用参数工作函数来降维.所得半参数降维估计具有双稳健的特点,即只要选择概率函数正确参数化或者降维插补指标可以修复线性函数的条件期望,所得估计就是相合的,而且二者都满足时,估计达到最优.  相似文献   

17.
一种新的彩色图像降维方法   总被引:5,自引:1,他引:5  
徐志节  杨杰  王猛 《上海交通大学学报》2004,38(12):2063-2067,2072
基于内容的图像检索(CBIR)是图像检索的重要分支,而基于颜色的特征提取是CBIR的常用方法之一.如果对图像颜色的特征数提取过多、维数过大,则不利于对图像的快速匹配.本文将图像的色彩直方图作为输入向量,然后采用局部线性映射(LLE)算法对原始数据进行降维,并分别在4种色彩空间下对降维后的彩色图像进行分类.实验证明,在处理非线性数据降维时,LLE较主成分分析(PCA)具有明显的优势.  相似文献   

18.
降维是天体光谱数据预处理常用的手段之一,如何利用标号天体光谱数据,克服降维过程中的过分拟合,是提高降维效果的有效途径之一。采用半监督学习,给出了一种天体光谱数据特征降维方法。该方法首先针对具有标号天体光谱数据,建立Fisher判别分析和PCA可变动选择的不确定关系;其次构建其半监督降维的全局最优化形式,通过特征值分解计算降维结果,从而有效地克服了天体光谱降维过程中的过分拟合问题;最后采用高红移类星体和晚型星SDSS天体光谱特征线数据集,实验验证了该方法的有效性。  相似文献   

19.
电法测井中基于遗传算法的非线性数据拟合研究   总被引:2,自引:0,他引:2  
1 电法测井中的非线性数据拟合  电法测井是利用地质层的电特性来测量岩石孔隙度、渗透率以及含水饱和度等储层物理参数.目前电法测井已在区域地质构造勘探、矿藏勘探和石油开采等领域中得到了广泛应用[1~3].对测井数据的后期处理一直是电法测井研究的一个重点和难题,寻求更准确、高效的数据处理方法,可以提高电法测井的准确性,具有重要的经济价值和现实意义.目前常用的电法测井技术有自然电位测井和激发极化电位测井等多种方式[1,2].激发极化电位测井方法于20世纪60年代由苏联引进我国,又称为人工电位测井,已在多个油田得到了实际应用.…  相似文献   

20.
针对传统降维方法难以保持数据集的局部与全局几何结构特征问题,选择测地距离作为度量指标,提出改进t-SNE的故障数据集降维方法D-t-SNE.首先提取消噪振动信号的多域高维故障数据集,在对其进行归一化处理之后,利用GD指标改进后的D-t-SNE算法对高维故障数据集进行降维运算,去除冗余信息,然后通过不同的分类器对低维特征子集进行故障模式辨识.以UCI数据集和双跨转子实验台的模拟故障数据集为实验对象对D-t-SNE算法进行验证,并与SNE和t-SNE算法的各项实现结果进行对比.结果表明,D-t-SNE算法具有通过降低高维故障数据集的维数从而达到降低故障分类难度、提高故障辨识准确率的性能,可为降低旋转机械原始故障特征数据集的规模、降低故障分类的难度与提高故障辨识结果的可视化效果提供理论参考依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号