首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
阿尔茨海默病(Alzheimer′s disease,AD)具有数据量少、多模态以及高维度等特点.为了对AD进行有效的预测,首先提出一个基于类内方差最小化的多任务特征选择(minimum intra-class variance-based multitask feature selection,MIVMTFS)算法,然后结合基于有效距离的拉普拉斯分数特征选择(effective distance-based laplacian score feature selection,EDLSFS)算法和MIVMTFS算法,提出一种二阶段多任务特征选择(two-stage multi-task feature selection,TSMTFS)算法.TSMTFS算法先利用EDLSFS算法在保持特征局部结构的情况下对原始样本特征进行无监督预降维,再利用MIVMTFS算法对降维后的特征进行有监督地再降维,最终获得一个精简特征子集.实验部分主要包括AD的2个二分类任务,并分别对单模态数据和多模态数据进行实验.实验结果验证了TSMTFS算法在AD领域能够缓解单模态特征选择的信息不够充分、样本量少以及特征维度高等不足.  相似文献   

2.
针对现有无监督特征选择算法所选特征分类准确率不高的缺陷,提出两种新的无监督特征选择算法EDPFS(unsupervised Feature Selection algorithm based on Exponential Density Peaks)和RDPFS(unsupervised Feature Selection algorithm based on the Reciprocal Density Peaks).该两算法提出特征密度与特征距离的概念,并以此定义特征代表性与特征区分度,特征代表性越高表明特征越重要,特征区分度越高表明特征冗余度越小,以特征代表性与区分度之积作为特征重要性评价准则,采用基于特征子集的支持向量机分类正确率评价特征子集的分类性能.在8个UCI机器学习数据库数据集和4个图像数据集上测试这两种新算法,以及多类簇特征选择方法、Laplacian分值特征选择方法、无监督判别特征选择方法和扩展的无监督特征选择方法,实验结果表明:以特征代表性与区分度之积定义的特征重要性评价准则是有效的,提出的两种基于该准则的无监督特征选择算法EDPFS和RDPFS选择的特征子集具有很好的分类性能.  相似文献   

3.
无监督特征选择是无标签高维数据预处理过程中一种有效的数据降维技术,然而大多数无监督特征选择算法忽略了数据样本本身的类簇结构特性,选择具有低判别性信息的特征.基于此,提出一种基于伪标签回归和流形正则化的无监督特征选择算法.具体地,联合伪标签回归和最大化类间散度来保证算法在迭代过程中学习伪标签,同时,自适应学习数据样本之间的局部几何结构,获得更加精准的标签信息和结构信息,进而选择具有高判别性且能保持数据流形结构的特征.在四个公开数据集上的对比实验表明,提出算法的特征选择结果优于现有的一些无监督特征选择算法.  相似文献   

4.
高维数据分析任务中,无监督特征选择是一项重要并具有挑战性的任务.传统的无监督特征选择算法通过保持流形结构或者特征之间相关性进行特征选择,而没有直接考虑选择特征与原始数据的依赖程度.通过考虑投影后的低维空间数据与原始数据信息之间的依赖性,提出有良好性能的特征依赖于原始数据的度量原则.首先利用最大化依赖使投影后数据尽可能保持原始数据的特征信息,据此获得投影矩阵,从而对原始数据达到降维效果.然后联合稀疏表示进行特征选择.提出一种新的无监督特征选择算法,称之为联合依赖最大化与稀疏表示的无监督特征选择方法(DMSR).在4个实际的数据集上进行实验,并与3种已有的无监督特征选择算法进行比较,在两种评价指标聚类精度和互信息上的实验结果表明,提出的DMSR算法是有效的.  相似文献   

5.
利用局部保持投影和稀疏保持投影来刻画数据的本质结构,结合L2,1范数的组稀疏性来选择特征,提出一种新的针对高维小样本数据集的无监督特征选择算法.实验表明:局部和稀疏保持无监督特征选择法是一种有效的无监督特征选择方法;平衡参数对实验结果有较大的影响.  相似文献   

6.
为了综合利用流形学习、多任务学习和正则化约束的优势,提出一种基于全局和局部约束的半监督多任务特征选择(semi-supervised multi-task feature selection,SMFS)模型,在多个任务间共享学习的基础上,构建SMFS模型.该模型采用l2,1范数约束选择最具判别性的特征,避免噪声的干扰,并引入局部信息约束提高特征选择的准确度.将SMFS模型应用于网页自动分类,与目前流行的几种算法进行对比,证明了该算法的有效性.  相似文献   

7.
特征选择是机器学习和模式识别领域中的一个重要问题.本文提出一种非监督的特征选择算法,称为基于密度聚类和样本加权信息熵的特征选择算法(DCWIE).不同于传统的基于信息熵的特征选择算法,DCWIE使用一种加权的信息熵计算方法,增加对分类贡献大的样本的权值,并通过与聚类结合,实现无监督学习.实验结果表明了本文算法的有效性.  相似文献   

8.
针对基于流形正则化自表示(MRSR)的无监督特征选择算法直接从原始的样本空间构造相似矩阵可能会 导致重构空间中样本的相似性描述得不够准确的问题,提出了基于自适应流形正则化自表示的无监督特征选择 (AMRSR)算法。 基于自适应流形正则化自表示的无监督特征选择算法在 MRSR 算法的基础上通过对相似矩阵施 加概率最近邻约束将相似矩阵的学习嵌入到优化过程中,在重构空间中自适应地学习样本的相似性,使得在每一 次迭代中获取更加精确的样本局部几何流形结构,从而选择具有代表性且保持局部几何流形结构的特征。 最后, 在四个公开数据集上进行了大量的对比实验,通过将算法的特征选择结果用于 K-means 聚类并采取两种常见的聚 类评价指标:聚类精确度和归一化互信息评价聚类效果。 实验结果表明,AMRSR 算法与现有的一些算法相比有更 高的聚类精确度和归一化互信息,进一步表明该算法特征选择效果更好。  相似文献   

9.
为了更好地预处理未标记数据,大多数基于图正则的无监督特征选择算法通过构造样本的相似性矩阵来删除冗余信息并选择具有代表性的特征子集.这些方法中的大多数图都是用固定数量的近邻数来初始化,忽略了数据分布不均匀的问题.为了解决这个问题,提出了一种基于自适应邻域和自表示正则的无监督特征选择算法(Adaptive neighbor...  相似文献   

10.
一种改进的SOFM聚类算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
针对常规SOFM(self-organizing feature map)无监督的神经网络,提出了一种改进的自组织特征映射SOFM神经网络算法。在常规SOFM网络数据聚类算法基础上,分析了其在实际应用中存在的不足,对初始权值设定以及邻域范围选择等方面进行了算法的优化和改进,进而提高了SOFM神经网络聚类算法的正确率、收敛速度和实时性,并利用仿真实验进一步对提出的改进算法进行了验证。  相似文献   

11.
针对ORB(Oriented FAST and Rotated BRIEF)算法中的Steer BRIEF描述子只通过比较两个像素点的灰度信息来决定0/1编码,容易产生特征点误匹配现象,本文提出基于像素密度(pixel density)的ORB特征描述子算法,利用两幅图像中相同区域的某一特征点邻域空间内像素密度的相似性原理,通过比较两个像素点的密度信息来决定0/1编码,计算误匹配率,验证了density-ORB算法在图像模糊、压缩、光照变化、视角变化等条件下的鲁棒性.实验结果表明,该算法减少了特征点的误匹配个数,特征点误匹配率比ORB算法降低了2.80%.  相似文献   

12.
为了增强图像特征鉴别力和鲁棒性,获取图像紧致特征表达是关键.现有的图像特征学习方法大多采用最大化L2范数的方式定义,导致其对噪声和异常值十分敏感.针对这个问题,提出了一种基于L2,1范数的鲁棒鉴别特征学习算法.该算法在数据预处理中加入了类内聚拢操作,使得同类样本尽可能靠近,减小了类内异常样本以及强噪声样本的影响;此外,...  相似文献   

13.
【目的】随着遥感技术迅猛发展,在影像解译过程中提取的信息越来越繁杂多样。为提高地物分类准确率,常加入更多的特征信息,而由此往往造成一定的信息冗余,导致分类效率甚至准确率降低。笔者利用随机森林(RF)和支持向量机(SVM)分类器,探索在遥感分类过程中保证分类精度的同时又能降低特征维度的方法。【方法】以吉林省安图县福兴林场部分区域为研究对象,利用2015年Landsat-8影像为数据源,提取光谱信息(红、绿、蓝、近红外和短波红外波段)、植被指数(NDVI、增强型植被指数、比值植被指数和裸土植被指数)、纹理(同质性、均值、二阶矩、方差、差异性、对比度、熵和相关性)和地形信息(坡度和坡向)共19个指标作为分类特征变量。以RF分类器估测的特征重要性进行特征选择为对照,分别以单个特征在RF和SVM两分类器中的分类准确率为依据进行特征选择,并对选取的特征进行主成分分析,与未做主成分分析的进行区分,再分别用RF和SVM分类器进行分类,评价分类精度,确定最优特征和分类器组合。【结果】①基于SVM单个特征分类准确率选取特征,对选取的特征进行主成分分析,再用RF进行分类,该方法与其他方法相比分类性能最好,当特征维度为5时,总体精度为0.86,Kappa系数为0.83; 与输入全部特征进行分类相比,不仅提高了分类精度,而且降低了特征维度,使分类效率得以提升。基于RF特征重要性选取特征的RF分类取得了较高的分类准确率,但特征维数小于7时,分类准确率波动较大; 在特征维数为4时分类准确率增至最大值(0.88),随后骤降为0.83,之后基本保持在此水平。而基于单个特征分类准确率选取特征,分类准确率变化较为平缓,如上所提最优分类性能方法的分类准确率波动范围基本在0.02。②基于单个特征在RF和SVM分类器中的分类准确率进行特征选择,在随后的分类过程中,SVM分类器分类精度总体高于RF。基于RF单个特征分类准确率选取特征的SVM分类,及基于SVM单个特征分类准确率选取特征并对选取特征进行主成分分析的RF分类,较仅利用SVM或RF单个分类器选取特征并分类的分类准确率更高。【结论】①基于单个特征分类准确率的特征选择方法,可在保证分类精度的同时降低特征维度,且在较低维度时,基于该方法选取特征的分类精度较基于特征重要性选取特征的分类精度更稳定。②基于单个特征分类准确率进行特征选择,不同分类器选取的特征有所差异,分类准确率也不同,利用多个分类器较单个分类器选取特征并分类的性能更好。③在中低维度时,RF分类器的分类准确率可能与特征输入顺序有关,对输入特征进行主成分分析有利于提高分类器的分类精度及稳定性。  相似文献   

14.
外耳形状特征和内耳结构特征结合的人耳特征提取   总被引:8,自引:0,他引:8  
针对人耳的生物特征提出了一种人耳的形状特征和结构特征相结合的识别方法. 首先提取外耳最长轴,即外耳轮廓边缘点的最长连线. 利用外耳长轴把外耳曲线分成两部分,用最小二乘法对这两段曲线分别进行多项式曲线拟合,拟合多项式函数的系数作为外耳特征向量. 同时长轴与内耳曲线的交点作为内耳特征点,特征点之间连线的长度与长轴长度的比值作为内耳特征向量. 长轴的相对不变性保证了特征向量具有缩放、平移和旋转不变性. 实验结果表明此方法在噪声情况下具有较强的鲁棒性.  相似文献   

15.
针对尺度不变特征转换(SIFT)算法时间复杂度高的缺点,提出了SIFT特征提取优化算法。分析了SIFT特征提取算法各个计算步骤的时间复杂性。对SIFT特征提取过程进行了优化,包括耗时最多的高斯金字塔的创建和计算特征描述符过程。优化算法降低了特征点提取时间,减少了特征点的重复匹配,同时保证了匹配结果的准确性。最后,实验证明了优化后的算法能有效降低时间复杂度。  相似文献   

16.
通过分析轴类零件的工艺和特点,归纳出轴类零件的特征.总结出30种不同特征间的关系及其联结和定位关系.描述了详细的特征信息,建立了独特的、用XML格式描述的特征信息模型,并创建XML格式的文档,用以配合后序的CAPP系统读取XML文档数据.  相似文献   

17.
特征选择是机器学习和模式识别等领域一个关键问题。而高维特征选择又是当今研究的热点和难点。从高维特征选择的模型出发。详细说明高维特征选择所采用的各种算法类型。并分析了该模型的优劣。  相似文献   

18.
为了克服Relief选择前k个特征作为约简子集所存在的原始特征空间中的近邻在约简后的特征子空间中不一定还是近邻的问题,提出了一种在特征子空间中评价候选特征子集类别区分能力的方法,并结合最好优先特征搜索策略提出了一种新的特征子集选取方法.在12个UCI(加州大学欧文分校)数据集和1个老年痴呆实测数据集上,就约减能力对所提方法与其他3种经典特征选择方法进行了比较,并用决策树、逻辑回归模型详细比较了分类效果.实验结果表明:所提方法不仅能够选出特征数目较少的特征子集,而且特征子集的分类效果良好.  相似文献   

19.
鉴于常规词袋模型中图像局部特征对图像信息表达不全面的特点,提出一种基于图像Laplace谱结构特征与局部特征相结合的图像分类方法.在提取基于图像均匀划分的Laplace谱结构特征后,对图像进行尺度不变特征变换(scale-invariant feature transform,简称SIFT)的抽取及描述;构造基于图像特征的视觉词典;根据视觉词典对图像特征进行量化,得到图像的全局特征直方图表示;构造支持向量机(support vector machine,简称SVM)分类器并进行图像分类.实验验证了该方法对图像进行分类的有效性与可行性.  相似文献   

20.
高维特征集选择模型研究   总被引:1,自引:0,他引:1  
特征选择是机器学习和模式识别等领域一个关键问题,而高维特征选择又是当今研究的热点和难 点。从高维特征选择的模型出发,详细说明高维特征选择所采用的各种算法类型,并分析了该模型的优劣。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号