首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
特征选择是机器学习和模式识别等领域一个关键问题。而高维特征选择又是当今研究的热点和难点。从高维特征选择的模型出发。详细说明高维特征选择所采用的各种算法类型。并分析了该模型的优劣。  相似文献   

2.
基于地统计学和氨基酸理化性质对氨基酸序列进行特征提取,发展了一种改进的最小冗余最大相关特征选择方法,并引入了私有化预测结合支持向量机进行建模预测,得到了一种新的抗菌肽活性的预测方法。结果表明,地统计学关联特征能更好地表征氨基酸序列,特征选择对于高维回归数据的处理作用明显,同时能有效地增强模型的解释性,私有化预测能进一步提升模型的预测能力。所得新方法具有较好的预测能力及可解释性,在高维回归数据领域具有较为广泛的应用前景。  相似文献   

3.
以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性与可解释性,提出了基于稀疏正则化的特征抽取模型,为高维特征降维提供了一种新思路.  相似文献   

4.
针对数据标注的代价昂贵和半监督学习难以直接处理高维数据,其包含的冗余特征往往导致分类模型效果不理想问题。为了解决上述问题,根据粒计算模型,提出基于一致性和知识粒度的半监督特征选择方法。利用正域的依赖度去度量有标记样本的一致性,同时采用知识粒度对未标记样本去评价特征对样本空间的可区分性,由此结合数据分布情况构造了一种基于线性融合的特征重要性方法。在此基础上,设计了面向半监督数据的特征选择方法。最后,通过实例分析和与当前四种半监督特征选择方法对比进一步验证了本文方法在半监督数据中的有效性和可行性。  相似文献   

5.
针对启发式特征选择和特征聚类驱动特征选择方法的不足,研究了决策依赖的特征冗余性问题,提出了一种基于邻域粗糙集的决策依赖特征聚类的高维数据特征选择方法(RDCFS).首先,依据邻域粗糙集模型,设计了一种特征联合依赖度增益度量,刻画数据特征在分类和辨识层面上的冗余性和关联性.其次,构建了一种最优特征簇结构的评估准则和特征冗...  相似文献   

6.
现有的贝叶斯网络结构学习算法都需要对高维数据项集进行大量地计算,极大地影响了算法的可靠性、健壮性以及精确度,同时高维计算也耗费了大量时间,为了解决这个问题,提出基于特征选择技术贪婪贝叶斯网络结构学习算法。理论分析表明,本算法在效率上优于现有算法,实验结果也表明,对于高维相对小采样数据集,本算法在精度上也优于大多数算法。  相似文献   

7.
基于核向量空间模型的专利分类   总被引:2,自引:0,他引:2  
提出了一种利用核函数改进向量空间的新模型:核向量空间模型,该模型利用Mercer核,把输入空间的样本映射到高维特征空间,在高维特征空间中按向量空间模型操作。然后用核向量空间模型实现专利分类.理论分析及在专利分类中的实验表明,所提出的模型比经典向量空间模型有更高的正确分类率。  相似文献   

8.
马兆才 《甘肃科技》2014,30(20):27-29
文本分类的关键是对高维的特征集进行降维。降维的主要方法是特征选择和特征提取。综述了已有的特征选择和特征抽取方法,评价了它们的优缺点和适用范围,提出了两阶段的特征降维方法框架。  相似文献   

9.
特征选择中特征数量和分类精度之间的关系通常可以看作是一个多模态多目标优化问题,但现有大多数多模态多目标进化算法对于高维优化问题的求解存在搜索能力不足的问题。为解决该问题,提出一种基于因果模型和多模态多目标进化算法的两阶段特征选择方法。在该方法中,首先使用因果模型对数据进行特征选择以便降低问题维度;然后使用多模态多目标优化算法搜索具有多模态特性的特征子集。为验证所提算法性能,它被用于术中低体温风险预测模型的特征选择问题。实验结果表明,提出的两阶段特征选择方法不仅融合了2种不同方法的优点,而且能为术中低体温预测提供更多决策支持。  相似文献   

10.
为了降低高维特征空间的维度,从高维特征空间中选择最优特征子集作为检索特征,并合理设置检索特征的权重,使得最优检索特征能够有效融合,运用遗传算法进行自适应特征选择和权重设置.实验数据表明,运用遗传算法进行特征选择和权重设置,提高了图像检索的精度.  相似文献   

11.
针对ORB(Oriented FAST and Rotated BRIEF)算法中的Steer BRIEF描述子只通过比较两个像素点的灰度信息来决定0/1编码,容易产生特征点误匹配现象,本文提出基于像素密度(pixel density)的ORB特征描述子算法,利用两幅图像中相同区域的某一特征点邻域空间内像素密度的相似性原理,通过比较两个像素点的密度信息来决定0/1编码,计算误匹配率,验证了density-ORB算法在图像模糊、压缩、光照变化、视角变化等条件下的鲁棒性.实验结果表明,该算法减少了特征点的误匹配个数,特征点误匹配率比ORB算法降低了2.80%.  相似文献   

12.
为了增强图像特征鉴别力和鲁棒性,获取图像紧致特征表达是关键.现有的图像特征学习方法大多采用最大化L2范数的方式定义,导致其对噪声和异常值十分敏感.针对这个问题,提出了一种基于L2,1范数的鲁棒鉴别特征学习算法.该算法在数据预处理中加入了类内聚拢操作,使得同类样本尽可能靠近,减小了类内异常样本以及强噪声样本的影响;此外,...  相似文献   

13.
【目的】随着遥感技术迅猛发展,在影像解译过程中提取的信息越来越繁杂多样。为提高地物分类准确率,常加入更多的特征信息,而由此往往造成一定的信息冗余,导致分类效率甚至准确率降低。笔者利用随机森林(RF)和支持向量机(SVM)分类器,探索在遥感分类过程中保证分类精度的同时又能降低特征维度的方法。【方法】以吉林省安图县福兴林场部分区域为研究对象,利用2015年Landsat-8影像为数据源,提取光谱信息(红、绿、蓝、近红外和短波红外波段)、植被指数(NDVI、增强型植被指数、比值植被指数和裸土植被指数)、纹理(同质性、均值、二阶矩、方差、差异性、对比度、熵和相关性)和地形信息(坡度和坡向)共19个指标作为分类特征变量。以RF分类器估测的特征重要性进行特征选择为对照,分别以单个特征在RF和SVM两分类器中的分类准确率为依据进行特征选择,并对选取的特征进行主成分分析,与未做主成分分析的进行区分,再分别用RF和SVM分类器进行分类,评价分类精度,确定最优特征和分类器组合。【结果】①基于SVM单个特征分类准确率选取特征,对选取的特征进行主成分分析,再用RF进行分类,该方法与其他方法相比分类性能最好,当特征维度为5时,总体精度为0.86,Kappa系数为0.83; 与输入全部特征进行分类相比,不仅提高了分类精度,而且降低了特征维度,使分类效率得以提升。基于RF特征重要性选取特征的RF分类取得了较高的分类准确率,但特征维数小于7时,分类准确率波动较大; 在特征维数为4时分类准确率增至最大值(0.88),随后骤降为0.83,之后基本保持在此水平。而基于单个特征分类准确率选取特征,分类准确率变化较为平缓,如上所提最优分类性能方法的分类准确率波动范围基本在0.02。②基于单个特征在RF和SVM分类器中的分类准确率进行特征选择,在随后的分类过程中,SVM分类器分类精度总体高于RF。基于RF单个特征分类准确率选取特征的SVM分类,及基于SVM单个特征分类准确率选取特征并对选取特征进行主成分分析的RF分类,较仅利用SVM或RF单个分类器选取特征并分类的分类准确率更高。【结论】①基于单个特征分类准确率的特征选择方法,可在保证分类精度的同时降低特征维度,且在较低维度时,基于该方法选取特征的分类精度较基于特征重要性选取特征的分类精度更稳定。②基于单个特征分类准确率进行特征选择,不同分类器选取的特征有所差异,分类准确率也不同,利用多个分类器较单个分类器选取特征并分类的性能更好。③在中低维度时,RF分类器的分类准确率可能与特征输入顺序有关,对输入特征进行主成分分析有利于提高分类器的分类精度及稳定性。  相似文献   

14.
外耳形状特征和内耳结构特征结合的人耳特征提取   总被引:8,自引:0,他引:8  
针对人耳的生物特征提出了一种人耳的形状特征和结构特征相结合的识别方法. 首先提取外耳最长轴,即外耳轮廓边缘点的最长连线. 利用外耳长轴把外耳曲线分成两部分,用最小二乘法对这两段曲线分别进行多项式曲线拟合,拟合多项式函数的系数作为外耳特征向量. 同时长轴与内耳曲线的交点作为内耳特征点,特征点之间连线的长度与长轴长度的比值作为内耳特征向量. 长轴的相对不变性保证了特征向量具有缩放、平移和旋转不变性. 实验结果表明此方法在噪声情况下具有较强的鲁棒性.  相似文献   

15.
针对尺度不变特征转换(SIFT)算法时间复杂度高的缺点,提出了SIFT特征提取优化算法。分析了SIFT特征提取算法各个计算步骤的时间复杂性。对SIFT特征提取过程进行了优化,包括耗时最多的高斯金字塔的创建和计算特征描述符过程。优化算法降低了特征点提取时间,减少了特征点的重复匹配,同时保证了匹配结果的准确性。最后,实验证明了优化后的算法能有效降低时间复杂度。  相似文献   

16.
目前存在的无监督特征选择算法中往往会忽略特征与特征之间的关系,从而使得特征选择结果不理想.针对这个问题,提出了基于相似性特征聚类的加权无监督特征选择算法(Weighted unsupervised feature selection algorithm based on similarity feature clust...  相似文献   

17.
通过分析轴类零件的工艺和特点,归纳出轴类零件的特征.总结出30种不同特征间的关系及其联结和定位关系.描述了详细的特征信息,建立了独特的、用XML格式描述的特征信息模型,并创建XML格式的文档,用以配合后序的CAPP系统读取XML文档数据.  相似文献   

18.
为了克服Relief选择前k个特征作为约简子集所存在的原始特征空间中的近邻在约简后的特征子空间中不一定还是近邻的问题,提出了一种在特征子空间中评价候选特征子集类别区分能力的方法,并结合最好优先特征搜索策略提出了一种新的特征子集选取方法.在12个UCI(加州大学欧文分校)数据集和1个老年痴呆实测数据集上,就约减能力对所提方法与其他3种经典特征选择方法进行了比较,并用决策树、逻辑回归模型详细比较了分类效果.实验结果表明:所提方法不仅能够选出特征数目较少的特征子集,而且特征子集的分类效果良好.  相似文献   

19.
鉴于常规词袋模型中图像局部特征对图像信息表达不全面的特点,提出一种基于图像Laplace谱结构特征与局部特征相结合的图像分类方法.在提取基于图像均匀划分的Laplace谱结构特征后,对图像进行尺度不变特征变换(scale-invariant feature transform,简称SIFT)的抽取及描述;构造基于图像特征的视觉词典;根据视觉词典对图像特征进行量化,得到图像的全局特征直方图表示;构造支持向量机(support vector machine,简称SVM)分类器并进行图像分类.实验验证了该方法对图像进行分类的有效性与可行性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号