首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于免疫克隆选择算法的特征选择   总被引:12,自引:0,他引:12  
提出了一种基于免疫克隆选择算法的特征选择方法.特征选择可以被看成是一个组合优化问题,利用免疫克隆选择算法快速收敛于全局最优的特性,加快搜索到最优特征子集的速度,为后续模式分类提供良好的判别依据.实验结果表明算法在保持甚至提高分类精度的同时,有效地降低了特征维数.与基于遗传算法特征选择的结果相比较,在有限代数内,该算法能收敛到更优的特征子集,从而验证了算法的有效性及其应用潜力.  相似文献   

2.
集成学习中特征选择技术   总被引:1,自引:0,他引:1  
集成学习和特征选择是当前机器学习领域中的研究热点.集成学习通过重复采样可产生个体学习器之间差异度,从而提高个体学习器的泛化能力,特征选择应用到集成学习可进一步提高集成学习技术的效果,该研究有3个方面:数据子集的特征选择、个体学习器的选择和多任务学习.该文对近几年集成学习中特征选择技术的研究进行回顾,尤其对以上3个方面的研究分别进行总结,提出一些共性的技术指导以后的研究.  相似文献   

3.
特征分析与选择是设计有效的数据分类与聚类算法的重要前提,为了选择合适的、一定数量的数据特征,文章提出了一种基于模糊集与前馈神经网络的特征分析与选择算法,该算法充分考虑特征的独立性与重要性,采用模糊集理论描述特征之间的独立性,通过独立性估计删除相关性特征;采用监督学习前馈神经网络实现重要性因子的自适应学习与估计,选择出重要性高的特征集合.理论分析与实验结果证明了提出的算法不仅时间复杂度低,而且能准确地反映数据的本质特征.  相似文献   

4.
目前存在的无监督特征选择算法中往往会忽略特征与特征之间的关系,从而使得特征选择结果不理想.针对这个问题,提出了基于相似性特征聚类的加权无监督特征选择算法(Weighted unsupervised feature selection algorithm based on similarity feature clust...  相似文献   

5.
基于粗糙集理论的目标特征选择方法   总被引:1,自引:0,他引:1  
基于粗糙集理论中的分辨矩阵提出一种新的特征选择方法.此方法的基本思想是:对目标分类最有效的特征应该能划分最多的不同类样本.将该选择方法用于人造数据和实际数据的特征选择中.结果表明:该方法能正确选择人造数据中的相关特征,且能大幅度降低实际数据的特征数目.使用该方法对水下目标的识别特征进行选择时,可将识别特征数目下降至原特征数目的20%左右,对特征选择后的数据进行分类时,正确率可提高约6个百分点.  相似文献   

6.
在中文文本分类中,由于中文词条总数较高,限制了中文文本分类算法的选择空间.特征选择是文本分类的一个核心研究课题.提出了一个优化的文档频(optimal document frequency,ODF),再结合粗糙集提出了一个新的基于辨识集的属性约简算法,最后把该属性约简算法同优化的ODF结合起来,提出了一个综合的特征选择方法.该综合选择方法首先使用优化的ODF进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后再利用所提出的属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明该方法有较好的准确率和召回率.  相似文献   

7.
基于类别相关性和交叉熵的特征选择方法   总被引:1,自引:0,他引:1  
文本分类首先要解决的一个问题就是特征选择.简单分析了几种经典的特征选择方法,总结了它们的不足,提出了一个类别相关性方法,把交叉熵引入粗糙集并提出了一个基于交叉熵的属性约简算法,把该属性约简算法同类别相关性方法结合起来,提出了一个综合的特征选择方法.该方法首先利用类别相关性方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,此特征选择方法效果良好.  相似文献   

8.
提出了一种由遗传算法和改进互信息公式相结合的特征选择方法.将遗传算法中的特征评价函数换为改进互信息公式来对特征进行选择,结合了过滤式和封装式这2种特征选择方法的优点.实验部分采用另外2种特征选择算法与本文所提方法分别进行特征选择,将这3种方法所得到的特征子集用于概率神经网络、BP神经网络分类器上,通过比较对应的分类精度,检验各种特征选择方法的效果. 实验结果显示,所提出的特征选择方法能更为有效的实现特征选择,所取得的特征子集具有更好的泛化特性.  相似文献   

9.
特征选择是机器学习和数据挖掘中的一个关键问题,它可以实现数据维度的约减,从而提高学习模型的泛化能力.近年来,为了提高特征选择算法的性能,集成思想被应用到特征选择算法中,即将多个基特征选择器进行集成.本文从提高特征选择算法对大规模数据处理能力的角度出发,提出了一种基于最小最大策略的集成特征选择方法.它主要包括三个步骤:第一,将原始数据根据类别信息划分成多个相对较小的平衡数据子集;第二,在每一个数据子集上进行特征选择,得到多个特征选择结果;第三,对多个特征选择结果依据最小—最大策略进行集成,得出最终的特征选择结果.通过实验对比了该集成策略与其它三种集成策略对分类准确率的影响,结果表明最小最大集成策略在大部分情况下能够获得较好的性能,且基于最小最大策略的集成特征选择可以有效处理大规模数据.  相似文献   

10.
特征权值的选择是文本分类技术的基础环节.在详细分析文本分类技术特点的基础上,基于信息熵理论建立了TF_IDF的改进算法模型;并根据实际工程数据,验证了算法模型的有效性.理论分析和实例验证表明该算法弥补了传统TFIDF算法没有考虑词条文本类间分布的不足,能更好的体现特征词条的权重,从而能有效提高分类的精确度.  相似文献   

11.
基于优化文档频和信息量的特征选择方法   总被引:1,自引:0,他引:1  
针对文本分类中几种典型的特征选择方法存在的不足,提出基于优化文档频和信息量的特征选择方法.该方法首先使用优化的文档频方法进行特征选择以降低文本向量的稀疏性,然后利用所提属性的约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明:该方法同3种经典特征选择方法相比,"互信息"和"统计量"以及"信息增益"都要好.  相似文献   

12.
社会选择理论研究进展   总被引:1,自引:0,他引:1  
在介绍社会选择的形式化描述和社会选择理论的基本框架结构的基础上,对社会选择理论研究中的若干重要问题及进展进行分析和评述,其内容涉及社会选择中的理性假设问题、极大偏好断面规模问题、无约束域条件、合理字典序的构造、防操纵性社会选择机制设计以及基于相容信息的社会选择机制设计等诸多方面.  相似文献   

13.
选择实验的理论和应用——以中国退耕还林为例   总被引:4,自引:0,他引:4  
选择实验的理论基础来自于要素价值理论和随机效用理论,既是一种对环境资源进行价值评估的重要方法,也是揭示研究对象政策偏好的重要手段.利用该方法不仅可以通过对支付意愿或接受赔偿意愿进行评估,进而对一项政策的各个要素的相对重要性进行排序,还可以得到因多个政策要素同时改变时导致的价值变化,从而有助于政策制订者对政策进行调整.本文在评述选择实验的基本理论和方法的基础上,以中国正在实施的退耕还林工程为例,利用选择实验方法对该政策进行了评估,并且基于研究结果对未来的政策改进提出了相关建议.  相似文献   

14.
乳腺肿块检测是防治乳腺癌的有效途径,基于乳腺X射线图像特征模型的极限学习机(ELM)分类算法已被应用于计算机辅助检测乳腺肿块中.针对由于特征间的依赖性导致的ELM学习效率和检测准确度低的问题,提出了基于特征选择ELM的乳腺肿块检测算法.利用影响值选择、序列前向选择和遗传选择等方法进行特征选择,进而利用该结果提高ELM的性能.通过490例来自辽宁省肿瘤医院的乳腺X射线图像的实验表明,基于特征选择ELM的乳腺肿块检测算法能有效提升乳腺肿块检测的效果,其中以遗传选择对ELM性能提升最明显.  相似文献   

15.
在肿瘤特征基因选择过程中,传统分类方法会选出大量冗余基因,而大量冗余基因会造成分类精度低和时间复杂度较高等问题,为了解决上述问题,提出一种结合信噪比过滤法与随机森林算法的肿瘤特征基因选择方法.该方法包含两个过程:首先使用信噪比过滤法剔除原始特征空间中的无关和冗余基因,从而获得与分类属性相关性较高的基因,选择出分类能力较强的预选特征子集;其次使用随机森林算法对特征基因子集进行分类,最终获得分类结果.实验结果显示,该算法可以快速有效地选择出肿瘤特征基因,并具有较高的分类精度.  相似文献   

16.
编辑选择的不可逆与社会选择的可逆性   总被引:1,自引:0,他引:1  
某一社会文化价值客体一旦进入编辑的选择过程,编辑主体就必然作出肯定或否定的回答。如果这一价值客体所含的智化信息吻合了编辑主体内储的知识结构,编辑主体就会做出肯定的结论,从而使这一价值客体付梓、发行,参与社会文化的传播;反之,如若这一价值客体不能取得编辑内储知识结构的首肯和认同,它就将被亮起红灯,就此终止这一具体编辑选择过程。因此,从这个意义上说,编辑的选择过程是具体的、绝对的。然而,社会的选择却具有一定的可逆性。社会选择的可逆性、反复性,克服了编辑选择过程中的局限性,使社会文化的选择放在了一个客观实际的环境中,增强了文化选择的客观公正性和合理性,减少了编辑个体选择过程中的个人情感因素和偶然性因素,从而使社会文化的建构更加科学、合理,体现出一种内在的必然趋向与规律。  相似文献   

17.
张毅斌  马盈仓 《河南科学》2019,37(4):521-527
多标签特征选择已成为处理多标签数据的重要方法之一.利用一种基于模糊互信息的多标签特征选择算法,通过模糊离散化,给出模糊联合熵和模糊条件熵吸模糊互信息的计算方式.将原先的互信息特征选择算法推广到模糊情形中,提出一种基于模糊互信息的多标签特征选择算法.最后在同一准则下,将模糊互信息与原先的互信息特征选择算法及其他几种经典的特征选择算法进行比较.实验表明,此方法在一定程度上效果优于其他特征选择算法,是一种有效的多标签分类问题的特征选择方法.  相似文献   

18.
针对分类属性数据,基于信息熵,提出一种度量特征重要程度的定义.结合聚类分析,提出一种无指导的特征选择方法.该方法时间复杂度与数据集的大小和特征个数近似成线性关系,适合于大规模数据集中的特征选择.实验结果表明,该方法具有较好的性能,提出的特征选择方法有效实用.  相似文献   

19.
特征选择在模式识别技术中起着非常重要的作用,用信息论的方法进行特征选择还是一个新课题.MIFS和MIFS-U是两种用信息论方法进行特征选择的近似算法,MIFS和MIFS-U算法都有一个考虑输入特征之间信息冗余的权重系数,MIFS-U算法还有一个条件限制.当条件不满足或权重系数取值不合适时,这两种算法的特征选择性能就会下降.通过研究这两种算法,借助互信息的概念提出一种新的信息论特征选择算法MIFS-D.和MIFS、MIFS-U算法相比,MIFS-D是一种更精确的算法,去掉了限制条件和权重系数.将3种算法应用于几个分类问题,结果表明MIFS-D算法具有相对更好的特征选择性能.  相似文献   

20.
正确选择区域主导产业在新工业时期区域经济发展中具有重要的战略意义.通过采取实证分析与理论分析相结合,以实证分析为主,针对区域主导产业在新工业化时期的特征要求,提出一个广泛适用的区域主导产业选择的理论模型.结合区域主导产业特征和约束条件,将理论模型应用到具体的样本中进行量化分析,并以佛山市的主导产业的选择为例,验证理论模型的实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号