首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
为了解决机械故障诊断中的特征选择问题,利用免疫克隆选择算法,提出了一种结合交叠区异点统计和相关性分析的免疫克隆特征选择方法,可有效地去除不相关特征和冗余特征.基于空间分布的交叠区异点,设计了交叠区异点统计的优化指标;基于J散度距离,设计了一种冗余特征的评估指标;基于免疫克隆选择算法,结合交叠区异点统计优化指标和冗余特征评估指标,提出了一种免疫克隆特征选择新算法.仿真和实际工程应用的结果表明:文中提出的方法比常用的特征选择方法更加有效,选出的特征分类精度更高,特征子集更小,更能满足故障诊断的需求.  相似文献   

2.
王帆  赵春晖  张志 《应用科技》2009,36(3):11-14
针对经典PCA算法在人脸特征提取上的局限性,提出了一种基于克隆选择算法的特征选择方法.克隆选择算法的收敛速度快,具有较强的全局搜索能力,可以快速搜索到最有利于分类的特征空间;因此利用克隆选择算法对PCA变换后的特征向量进行选择,可以有效避免PCA只选择人脸轮廓信息,而忽略细节信息的不足,在人脸识别中取得了较好的效果.通过对ORL和Yale人脸库的仿真实验表明,该方法无论在识别率、降维效果还是稳定性方面,性能均优于遗传算法,不但有效降低了特征向量维数,还将人脸识别率提高到91.5%,因此研究该算法具有很强的现实意义.  相似文献   

3.
针对水声目标小样本识别中样本数目有限而特征数目不断增加,导致分类系统分类性能下降的问题,提出了一种新的自适应免疫特征选择算法(AIFSA).该算法先利用先验知识生成初始种群,接着利用交叉、变异和新的自适应免疫算子指导种群进化,每代中对分类贡献大且选择特征数目少的个体适应度值高.AIFSA具有可以利用先验知识、收敛速度快以及优化特征子集维数小的优点.提取了实测4类水声目标的多域特征,进行特征选择和分类识别仿真实验,结果表明:AIFSA可以选择有效特征子集,在特征维数下降60%的情况下,支持向量机分类器的平均正确分类率下降很小;AIFSA与标准遗传算法相比,收敛快、稳定,所得优化特征子集具有更高的正确分类率和更好的范化性能.  相似文献   

4.
基于互信息和文化基因算法的网络流量特征选择   总被引:1,自引:0,他引:1  
利用文化基因框架的引导,提出一种结合了封装和过滤的混合型特征选择算法.该算法在传统的遗传算法中采用了基于互信息的局部搜索算法,全局搜索以分类器精度为适应度函数,保证得到全局最优解;局部搜索以联合互信息为评价指标,加快了寻找最优特征子集的收敛速度.实验表明,与现有算法相比,该算法在特征数量和计算复杂度上有显著改进,采用该算法的网络流量识别方法能以更少的特征获得更高的分类精度.  相似文献   

5.
针对高维数据中不相关特征、冗余特征等导致的分类任务计算量大、分类正确率低等问题,提出了一种基于归一化互信息的相关性快速过滤特征选择(FCBF-NMI)算法.该算法采用归一化互信息代替对称不确定性作为FCBF算法的相关性评价标准,进行特征与类别、特征与特征的相关性分析,删除不相关特征及冗余特征以获得最优特征子集.实验结果表明:FCBF-NMI算法得到的最优特征子集更合理,平均分类正确率为89.68%,所用时间平均低至2.64s.  相似文献   

6.
一种快速的Wrapper式特征子集选择新方法   总被引:1,自引:0,他引:1  
Wrapper式特征选择方法需要耗费大量时间,为此提出了一种快速的Wrapper式特征选择新方法(Fast Feature Subset Ranking,简称FFSR).与以单个特征作为评价单位的传统方法不同,FFSR算法以特征子集作为评价单位,以子集收敛能力作为评价标准.FFSR算法从收敛速度和收敛极值两个方面对收敛能力进行分析,并利用Sequential Floating Forward Selection(简称SFFS)算法构造和评价快速收敛的子集.FFSR算法选择的特征子集能力接近SFFS算法,但所需时间较SFFS算法大幅度减少.  相似文献   

7.
融合样本选择与特征选择的AdaBoost支持向量机集成算法   总被引:2,自引:0,他引:2  
为提高AdaBoost分类器集成算法的分类精确度并简化分类系统的复杂度,提出一种融合样本选择与特征选择的AdaBoost支持向量机集成算法(IFSelect-SVME)。该算法在AdaBoost算法的每个循环中利用加权免疫克隆样本选择算法进行样本选择,并用互信息顺序向前特征选择算法进行特征选择,再利用每个循环优化选择得到的特征样本子集训练个体SVM分类器,并对其进行加权集成,生成最终的决策系统。对实验所用9组UCI数据集的仿真结果表明:与支持向量机集成(SVME)算法相比,IFSelect-SVME算法的正确分类率有所提高,且样本数可减少30.8%~80.0%,特征数可减少32.2%~81.5%,简化了集成结构,缩短了测试样本的分类时间,所得到的分类系统具有更好的分类精度。  相似文献   

8.
特征选择作为一种常见的降维方法,一直以来都是机器学习和数据挖掘领域的热点话题.针对传统特征选择算法没有充分考虑特征全局冗余性,导致选择的特征子集对分类识别精度不够高的问题,提出基于复杂网络节点重要度评估和遗传算法的特征选择算法,将每个特征视为网络节点,根据互信息建立边,将特征选择问题转化为节点重要度评估问题,利用遗传算法选择最优特征子集.实验结果表明此算法能够找到较为优秀的特征子集,有效降维并提高分类精度.  相似文献   

9.
决策表最优特征子集的选择--基于粗集理论的启发式算法   总被引:5,自引:0,他引:5  
特征子集选择问题是机器学习的重要问题。而最优特征子集的选择是NP困难问题,因此需要启发式搜索指导求解。基于粗集理论,本文提出了一种新的决策表最优特征子集选择的启发式算法。和以往的方法相比,这种算法简单实用,在一定条件下能够以较高的效率得到最优特征子集。  相似文献   

10.
基于多克隆选择的多维关联规则挖掘算法   总被引:6,自引:0,他引:6  
通过引入多克隆选择算法的思想,提出了一种基于多克隆选择的关联规则挖掘算法.仿真对比试验表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,与基于进化算法和基于免疫算法的关联规则挖掘算法相比,明显提高了所得关联规则的准确率.  相似文献   

11.
特性选择是文本分类、机器学习以及模式识别领域的重要问题之一.特征选择能在保证数据完整性的情况下减少高维数据的特征维数,同时提高分类的精度.以往提出的基于同义词词林的特征选择方法虽然能有效避免提取出的特征值在概念上的重复性,但并未考虑到权值最优的特征向量构成的子集可能并非是最优的.为了解决此问题,结合同义词和遗传算法,提出了一种新的基于同义词词林的文本特征选择方法.该方法首先对特征词进行同义词过滤、合并,在降低特征向量维度的同时避免了同义词带来的影响.然后采用改进的遗传算法选出具有较好适应度值的特征向量.实验结果表明,这种方法较之以往提出的方法,在保证特征选择准确率的基础上能明显地减小特征向量的维度.  相似文献   

12.
为有效识别内含子 miRNA 及其宿主基因共表达模式, 提出了一种基于集成特征选择的识别方法。 首先 使用基于支持度的集成特征选择算法, 获取相关性和稳定性较高的特征子集, 再使用封装式特征选择方法结合 FCBF(Fast Correlation-Based Filter)搜索策略进一步去除冗余特征和弱相关的特征, 获得最优的特征子集。 实验 结果表明, 该方法融合了多个特征选择方法的优点, 能提高学习模型的泛化能力并能有效识别内含子 miRNA 及其宿主基因的共表达模式。  相似文献   

13.
提出了一种新的人工免疫系统算法——免疫克隆选择算法,描述了算法的操作过程.采用函数优化仿真实验与进化算法进行比较,结果表明免疫克隆选择算法收敛速度快,求解精度高,稳定性好,并能有效地克服早熟问题和骗问题.  相似文献   

14.
借鉴基于正则回归的无监督并行正交基聚类特征选择法和最大互信息系数,提出正交基低冗余无监督特征选择法.该方法在正交基下选择具有判别能力的特征,可用最大互信息系数矩阵选择低冗余性的特征子集. 4个图像数据集上的实验结果表明:该方法选择的特征子集可以提高聚类准确率.  相似文献   

15.
随着大数据、人工智能以及高性能计算的快速发展, 数据驱动的新材料研发成为研究热点. 在对材料数据进行数据挖掘的过程中, 需要对特征集合进行预处理, 通过减少无关冗余特征, 不仅可以避免模型过拟合, 还能提高模型的可解释性. 基于此, 提出了一种基于强化学习的特征选择(feature selection based on reinforcement learning, FSRL) 算法, 将封装式特征选择抽象成机器学习模型和"环境"互动的过程, 并根据利益最大化准则将对应特征加入特征子集中. 同时, 为了提高模型的预测精度, 还提出一种基于符号变换的特征构造方法来生成新的特征. 最后, 将所提出方法应用到非晶合金材料的分类预测任务和铝基复合材料的回归任务中. 实验结果表明, FSRL 算法的分类准确率最高提升了 2.8%, 而在回归任务中, 基于特征构造的 FSRL 算法使得预测精度最高提升了 22.9%.  相似文献   

16.
机器学习领域中的特征选择算法可简化模型输入,提高可解释性并帮助避免维度灾难及过拟合现象的发生.针对基于封装法进行特征选择时,评价模型通常将搜索出的特征子集直接作为输入,导致算法对特征利用和评估效果受限于评价模型的特征学习能力,限制了对更适特征子集的发现能力等问题,提出一种基于级联森林结构的子集特征预学习封装法.该方法在搜索算法与评价模型之间添加多层级联森林,重构待评价特征子集为高级特征集,降低评价模型模式识别难度,提高对子集性能的评价效果.实验对比了多种搜索算法及评价模型组合,本方法可在保证分类性能的前提下,进一步降低所选特征数量,同时维持了封装法的低耦合性.   相似文献   

17.
A New Approach of Feature Selection for Text Categorization   总被引:1,自引:0,他引:1  
This paper proposes a new approach of feature selection based on the independent measure between features for text categorization. A fundamental hypothesis that occurrence of the terms in documents is independent of each other, widely used in the probabilistic models for text categorization (TC), is discussed. However, the basic hypothesis is incom plete for independence of feature set. From the view of feature selection, a new independent measure between features is designed, by which a feature selection algorithm is given to ob rain a feature subset. The selected subset is high in relevance with category and strong in independence between features, satisfies the basic hypothesis at maximum degree. Compared with other traditional feature selection method in TC (which is only taken into the relevance account), the performance of feature subset selected by our method is prior to others with experiments on the benchmark dataset of 20 Newsgroups.  相似文献   

18.
A new feature selection method is proposed based on the discern matrix in rough set in this paper. The main idea of this method is that the most effective feature, if used for classification, can distinguish the most number of samples belonging to different classes. Experiments are performed using this method to select relevant features for artificial datasets and real-world datasets. Results show that the selection method proposed can correctly select all the relevant features of artificial datasets and drastically reduce the number of features at the same time. In addition, when this method is used for the selection of classification features of real-world underwater targets,the number of classification features after selection drops to 20% of the original feature set, and the classification accuracy increases about 6% using dataset after feature selection.  相似文献   

19.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

20.
通过研究特征变量与类变量的信息测度和特征子集与类变量之间信息测度计算方法,实现快速的特征选择。将基于扩展熵的信息损失量测度用于度量类变量之间的相关性。为避免计算联合互信息的复杂计算,提出了基于信息损失量的变量相关度增加量计算方法,在保证新增特征可提供更多信息量前提下,同时提高特征选择的速度。最后对UCI的3种分类数据集进行实例分析,利用支持向量机对选择的特征子集进行分类验证,并将分类结果与其它常用特征选择方法进行了比较。结果表明所提出的特征选择方法比现有的特征选择方法更有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号