首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 843 毫秒
1.
基于粗糙集理论的目标特征选择方法   总被引:1,自引:0,他引:1  
基于粗糙集理论中的分辨矩阵提出一种新的特征选择方法.此方法的基本思想是:对目标分类最有效的特征应该能划分最多的不同类样本.将该选择方法用于人造数据和实际数据的特征选择中.结果表明:该方法能正确选择人造数据中的相关特征,且能大幅度降低实际数据的特征数目.使用该方法对水下目标的识别特征进行选择时,可将识别特征数目下降至原特征数目的20%左右,对特征选择后的数据进行分类时,正确率可提高约6个百分点.  相似文献   

2.
一种基于特征选择的入侵检测方法   总被引:1,自引:0,他引:1  
针对入侵检测中网络数据高维度、 大规模所带来的问题, 基于特征选择方法Fisher在网络安全数据集中的应用, 提出一种基于特征选择的通用入侵检测框架. 该方法通过提取关键特征, 降低安全数据的维度; 采用K近邻方法作为分类器, 验证特征选择后的检测效果. 实验结果表明, 该方法能在较少特征的情况下达到较高的检测率, 具有较好的可行性.  相似文献   

3.
针对目前特征选择算法应用于数据分类精度不理想的问题, 提出一种基于最大相关最小冗余的特征选择算法, 该算法结合特征选择算法和聚类分析算法对特征进行处理, 将分类中冗余的特征去除. 利用支持向量机对一组心脏病患者实际测量得到的数据进行分类实验, 实验结果表明, 该方法可有效筛选影响分类的特征, 进而提高分类准确率.  相似文献   

4.
提出一种基于属性和距离加权的K近邻特征选择方法.该方法在计算样本类别时既考虑每个特征的重要程度,又考虑近邻样本的距离,使用遗传算法搜索最优特征权重向量.将该方法与已有的3种特征选择方法MIFS、DISR和CIFE在6个公开的数据集上进行比较,实验结果表明该方法是有效的,且可以提高分类性能.  相似文献   

5.
将随机森林的相似度矩阵看做一种特殊的核度量,利用该度量对模型参数的鲁棒性和特征变化的敏感性,提出一种特征选择的方法.采用相似度矩阵,计算训练样本类内和类间相似性比率.再利用特征值随机置换技术,将相似性比率的变化量作为特征重要性度量指标,从而对所有特征进行排序.试验结果表明,该方法能充分利用全部样本的信息,有效地进行特征选择,且其性能优于基于袋外数据误差率估计的特征选择方法.  相似文献   

6.
针对传统特征选择算法的不足, 提出一种新的特征选择算法. 该算法能综合度量一个特征在类内和类间的重要性, 并在3个不同的数据集上利用2个分类器与5个现有的特征选择方法进行了对比实验. 实验结果表明, 该算法进一步降低了特征向量空间的维度, 并有效提高了分类器的分类性能.  相似文献   

7.
鉴于DNA微阵列数据中无关基因和冗余基因对分类精度和效率的影响,提出一种基于全局和声搜索的特征基因选择方法,首先采用ReliefF算法对微阵列基因数据集排序,取排序靠前的N个基因构成初选基因子集,然后利用全局和声搜索算法选择特征基因.两个公共微阵列数据集上的仿真实验表明,该算法全局搜索能力强,分类精度高,能够有效地剔除噪声和冗余基因,是一种有效的特征基因选择算法.  相似文献   

8.
电信客户流失预测是电信运营商客户关系管理系统的一个重要问题,其目的是预测具有较高流失风险的客户.电信客户流失预测模型的构建过程包括数据预处理、不均衡处理、特征选择和分类器的训练与评估.针对电信数据集中存在的特征维度过高问题,结合过滤式特征选择和嵌入式特征选择方法的优点,提出了一种基于Fisher比率和预测风险准则的分步特征提取方法.结合真实数据集的实验结果表明,该方法能够减少特征维度,提高分类器的预测效果.  相似文献   

9.
魏峻 《河南科学》2015,(1):58-64
DNA微阵列数据通常含有成千上万个基因,其中含有大量与分类无关的基因和冗余基因,这些基因的存在会严重影响分类精度和效率.针对这一问题,提出一种基于改进的和声搜索算法的特征基因选择方法,首先采用Relief F算法对微阵列基因数据集排序,取排序靠前的N个基因构成初选基因子集,然后再利用改进的和声搜索算法选择特征基因.通过在3个公共微阵列数据集上的仿真实验,结果表明,该算法能够在更少的特征基因情况下达到很高的精度,是一种有效的特征基因选择算法.  相似文献   

10.
针对特征选择过程中特征评价指标单一性的问题, 基于集成学习中的极端梯度提升算法, 提出一种新的特征选择算法. 该算法首先应用极端梯度提升算法中构建集成树模型的指标作为特征选择的特征重要性度量指标, 然后利用一种新的双向搜索策略, 权衡了多种特征重要性对结果的影响, 并优化了评价过程的效率. 通过11个不同维度的标准数据集进行测试, 实验结果表明, 该算法能增加特征子集的多样性, 加快特征选择的速度, 并在中维和低维数据集上均具有较高的计算效率, 且能处理高维数据集.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号