首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于多元图形特征融合原理的降维方法研究   总被引:1,自引:0,他引:1  
降维是将高维模式映射到低维子空间的过程.在降维后的低维子空间进行分类往往能得到更好的效果.本文以高维数据为研究对象,采用多元描述图对高维数据进行可视化表达,采用多元图图形特征融合的方法对高维数据进行降维,用K邻分类器进行分类效果评价.与Fisher线性判别及其他一些常用非线性降维方法相比,本文所提方法在数据的可视化以及分类精度等方面均有较好效果.  相似文献   

2.
免疫进化的投影寻踪模型在文本分类中的应用   总被引:1,自引:0,他引:1  
投影寻踪是通过寻找最能反映原高维数据的结构或特征的投影方向,把高维数据投影到低维子空间上,从而实现在低维空间上研究分析高维数据的目的.针对文本分类中维数灾难问题,采用投影寻踪模型,将高维的文本数据降到超低维.投影寻踪的关键是构造能够找到最佳投影方向的有效算法,本文根据免疫进化的思想提出了免疫进化的投影寻踪模型,该模型能...  相似文献   

3.
为了增强高维数据在低维子空间中的模式识别能力,假设任意2个类别相同的相似样本其稀疏表示也相似,并基于SPP和LPP思想,提出一种可鉴别稀疏保局投影降维新方法 DSLPP.该方法通过稀疏表示学习和保局部投影,使得在投影子空间中不仅能够保持稀疏表示对数据很好的表达能力,而且较好地获取高维数据所蕴含的本质局部流形结构和自然判别信息,从而增强高维数据在子空间中的表示能力和可鉴别能力.在3个典型的人脸数据集Yale,ORL和PIE29上,将所提出方法 DSLPP与PCA,LPP,NPE和SPP进行对比试验.结果表明DSLPP是一种有效的降维方法,能够较好地改善高维数据在低维子空间中的分类效果.  相似文献   

4.
现有的优秀的聚类算法大多是处理低维数据的,但是对于高维数据,由于其分布特性与低维情形有很大的差异,这些算法失效.为解决高维分类型数据聚类问题,提出了一种基于粗糙集的高维分类型数据子空间聚类算法,基于粗糙集的上、下近似集的类边界描述,确定了类边界范围,然后采用相容度来调整类边界,聚类的过程采用增长子空间的思想,从低维到高维迭代地搜子空间类簇.最后通过在soybean、zoo数据集上的对比实验,实验结果表明了算法不仅可行,而且精度高.  相似文献   

5.
针对常用的降维算法只能可视化高维数据某一方面或某几方面特征的不足,运用参数嵌入算法在低维空间可视化其所有的特征。首先假设数据的类别在嵌入空间服从高斯分布,通过支持向量机分类算法获得训练数据在高维空间类别属性的后验概率,然后运用参数嵌入算法得到测试数据在嵌入空间的坐标和类别属性,从而实现高维数据分类的可视化.在Usps,YaleB,Mini Newsgroups数据集上的实验结果表明,该方法不仅能在低维空间表示高维数据与所属类别的联系,而且能正确揭示出数据集内部和类别集内部的关系,有利于深入研究高维数据分类的性质,参数嵌入算法的可视化效果优于直接应用PCA,ISOMAP等算法得到的低维图形,并且计算复杂度仅是数据类别和相应个数的乘积,非常适合于数据量大,类别数较少的数据分类可视化。  相似文献   

6.
改进了基于参数化间隔的双子支持向量机算法的预处理过程,在数据预处理阶段使用了主成分分析法对数据进行降维,提出了基于主成分分析的参数化间隔双子支持向量机,从而加快了整个算法的训练速度.公共数据库上的实验结果显示了该算法的优秀分类能力,对高维数据集的降维效果也比较成功.最后,将这种算法应用到手写体数字识别技术上,实验结果显示出该算法较好的分类性能.  相似文献   

7.
针对网络安全态势要素获取中大规模复杂攻击样本分类困难的问题,提出一种基于条件变分自编码网络的安全态势要素分类架构。该架构分为编码网络和生成网络两部分,均采用深度神经网络作为其基础框架。编码网络用于对高维数据进行降维,提取其隐含特征;生成网络用于对降维后的样本进行重构,生成新的样本。在生成网络中引入混合密度模型优化其特征提取能力,提高重构数据的准确性。采用训练数据对该架构进行训练,训练后的编码网络作为分类器,识别样本类型;生成网络生成指定类别的样本数据,以平衡复杂样本中各类攻击样本的数量,提高分类精度。仿真结果表明,与其他对比模型相比,所提分类架构具有较好的降维效果和较高的态势要素分类精度。  相似文献   

8.
为了充分获取高维数据的几何结构特征、增强高维数据在子空间中的识别能力,基于概率协作表示拥有潜在判别信息和数据几何信息的能力,提出一种基于概率协作表示的几何保持图嵌入(PCRGPGE)的降维新方法.在新方法中,相似高维数据样本的概率协作表示相似,且其概率协作表示的重构在低维子空间中也保持相似,从而使得高维数据所蕴含的低维结构信息保持在子空间中.在PCRGPGR中,首先对高维数据进行概率协作表示并重构,以获取数据的潜在判别和几何信息;然后,采用高维数据的类内和类间的构图方式,得到数据的几何分布信息和判别信息.将PCRGPGR与PCA、LDA、LPP等10个图嵌入方法在2个经典的人脸图像数据集PIE29和IMM上进行对比试验.结果表明:所提出的PCRGPGE是一种有效的降维方法,能在低维空间较好地保持高维数据的内在结构信息和增强模式判别能力.  相似文献   

9.
基于已有的数据挖掘预测任务,探讨怎样对小样本的高维(万维以上)数据集进行降维、分类,并在此基础上提出基于物理受力模型的建模思想,同时给出一种易于实现的基于经验的折中分类方法。最后详述该方法在解决所给问题上的应用。  相似文献   

10.
通过构建向量空间模型可以获得表征网页数据的词-文本权重矩阵,然而直接基于此高维矩阵进行分类学习效率较低,为此提出一种结合改进非负矩阵分解的模糊网页文本分类算法.首先,通过迭代的归一化压缩非负矩阵分解将高维的原数据映射到低维语义空间,以降低问题的复杂性.然后,将模糊逻辑引入分类模型,通过特征词与类别的模糊隶属度来生成文本的类别模糊集,以解决确定性矩阵难以判定语义模糊词所属类别的问题.实验结果表明,与其他方法相比,所提出的分类算法具有较高的分类准确度和较好的时间性能.  相似文献   

11.
为了获得良好的图像分类效果,需要采集尽可能多的图像数据特征,进而使得图像原始特征空间的维数越来越高,造成维数灾难.特征提取是通过线性或者非线性映射,将高维特征空间映射到低维空间,从而降低数据维数.现有的特征提取算法往往忽视了数据本身特有的复杂结构以及非线性因素,造成映射方向的模糊以及分类精确度的缺失.充分考虑了图像数据本身的二维特性,通过改进的非线性特征提取方法、流形学习方法来提取图像特征.实验表明,该算法在不影响图像分类效果的前提下可以大大降低数据维数,减少计算复杂度.  相似文献   

12.
针对KNN文本分类算法在高维数据集上分类计算开销大、效率低的缺点,采用一种基于矩阵奇异值分解的文本特征向量降维方法实现向量降维的同时保留更多的分类信息.同时,采用信息增益的方式对原始文本特征词进行了初步筛选,过滤掉对分类系统几乎没有贡献的特征词,以克服文本特征维数增长所带来的奇异值分解计算开销过大的缺点.实验表明此方法能在保持分类精度的同时极大地降低分类计算开销.  相似文献   

13.
以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性与可解释性,提出了基于稀疏正则化的特征抽取模型,为高维特征降维提供了一种新思路.  相似文献   

14.
由于数据量的不断增长,出现了大量的不平衡高维数据,传统的数据挖掘分类算法在处理这些数据时,易受到样本分布和维数的影响,存在分类性能不佳的问题.提出一种针对不平衡高维数据集的改进支持向量机(Supported Vector Machine,SVM)分类算法,首先通过核函数将数据集映射到特征空间中,再引入改进的核SMOTE(Kernel Synthetic Minority Over-sampling Technique)算法而得到正类样本,使两类样本数目平衡化;然后将维数高的数据集通过稀疏表示的方法投影到低维的空间中,实现降维;最后根据空间的距离关系来确定在输入空间中合成样本的原像,再对得到的平衡样本集通过SVM来分类,通过仿真实验验证了该算法对于高维不平衡数据集有较优的分类性能.  相似文献   

15.
针对高维数据集,文中提出一种PREP( PCA-ReliefF for EP)算法:首先采用PCA和ReliefF算法实现特征降维;然后利用EP模式思想,构造精度更高、规模更小的EP模式分类器;最后利用标准数据集对文中的方法进行测试.实验结果表明,在对高维数据进行分类时,该方法构造的分类器在预测精度和运行时间上均有较大幅度的提升.  相似文献   

16.
为了取得精确的图像分类效果,一方面需要提取大量的图像特征数据进行样本分析,另一方面大量的数据又造成了维数灾难.因此,为了解决信息全面与维数灾难的矛盾,引入了深度学习.深度学习利用分层结构处理复杂的高维数据,可以完成复杂函数的逼近,是一类具有多层非线性映射的学习算法,但深度学习模型优化困难且对隐层参数敏感.针对上述问题,将无监督算法引入深度学习,这种学习方法无须人工设计特征提取数据,训练过程中样本标签是未知的.实验表明,该算法在不影响图像分类效果的前提下,可以大大降低计算复杂度,具有一定的时效性.  相似文献   

17.
聚类是大数据时代对海量数据进行数据挖掘与分析的重要工具.本文基于密度峰值聚类算法提出了针对高维数据的聚类模型,以直接简单的形式实现六维度以上数据的任意形状聚类.该模型实现了自动预处理过程,以局部密度较大且距离其他局部密度较大点较远的点作为聚类中心,最后引入参数调整.实验结果表明,该模型不仅对低维数据聚类实用,在高维数据的聚类效果也非常显著.  相似文献   

18.
基于投影寻踪回归文本自动分类的模型   总被引:2,自引:0,他引:2  
文本被表示为向量空间模型后,是维数非常高的数据,对其进行维数约简是必要的.投影寻踪正是一种稳健的、非参数化的维数约简方法.提出了一种基于投影寻踪回归的文本自动分类模型.应用该模型,可以真实地描述高维数据的客观内在规律,从而达到提高文本分类精度的目的,岭函数拟合函数的合理选择是提高分类精度的关键,故对拟合函数的选取做了初步的研究.采用标准文档集Reuters-21578进行了分类实验,同时在相同的预处理条件下,与目前常用的方法进行了对比实验.实验结果表明,该模型对文本自动分类具有较高的召回率和准确率.  相似文献   

19.
针对目标属性识别的特点,建立了基于粗糙集(Rough Sets, RS)的数据分组处理(Group Method of Data Handling, GMDH)神经网络分类模型.该模型较好地解决了采用高维数据集训练神经网络效率低,神经网络结构规模较大的问题.同时为了提高高维数据集合的属性约简效率,改进了集合近似质量属性约简算法.最后,通过与BP(Back-Propagation, BP)神经网络分类能力的仿真对比,结果表明,基于粗糙集的数据分组处理神经网络分类模型分类能力优于BP神经网络模型,满足现代防空作战对目标属性识别的需求,基于快速求核和集合近似质量的属性约简算法快速有效.  相似文献   

20.
基于结构风险最小化原则,提出了可以实现高维数据降维的线性EIV模型参数的LASSO估计(LE)方法,并给出了其数值解的迭代算法.为说明LE方法的有效性,通过实证与WTLS、LS两种方法进行了对比分析.结果表明,LE方法能够明显提高预测精度,具有更强的泛化能力,同时可以实现变量选择,达到高维数据降维的目的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号