首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
变精度邻域粗糙集相比于邻域粗糙集具有抗噪容错的能力,但由于重新定义了下近似,正域的划分不再严格,使得属性重要度的可信度降低,在精度改变的情况下无法优先选取最优的属性.针对这一问题,分析变精度邻域粗糙集的下近似,引入邻域内的正确分类率,定义属性质量度,提出一种基于正域的增量和平均正确分类率的增率相结合的属性度量方法.通过和现有的基于属性重要度的属性约简算法做比较,实验结果表明,改进后的属性度量方法对变精度有更好的适应性,在不同变精度阈值下能得到更优的约简结果.  相似文献   

2.
冗余属性过多是影响分类算法运行效率和准确率的重要因素。为了提高分类算法的运行效率和分类准确率,提出一种基于改进邻域粗糙集属性重要度的快速属性约简算法。首先,提出一种改进的KNN属性重要度;其次,利用改进过属性重要度的邻域粗糙集对原始数据的条件属性进行重要度排序,利用排序结果对原始数据进行属性约简,得到约简后的特征子集;最后,将约简后的特征子集输入分类模型进行分类预测。实验仿真结果表明,与改进前的基于邻域粗糙集的属性约简算法相比,所提出的方法具有较高预测精度和较快运行速度。  相似文献   

3.
将基于单隐层前馈神经网络(SLFN)提出的极速学习机(ELM)算法和邻域粗糙集理论进行结合,提出基于邻域粗糙集的极速学习机算法,采用邻域粗糙集对样本集进行属性约简,去掉冗余属性,利用ELM对约简后的数据集进行学习,并对数据样本进行预测。实验表明ELM算法相比具有更高的训练精度和测试精度。  相似文献   

4.
粗糙集理论是关于不确定性信息处理的一种重要理论,其中的多种信息度量都具有有效的不确定性刻画功能.借鉴传统粗糙熵,构建三支加权变形熵.首先,利用粗糙熵的形式结构,采用三支概率提出三支变形熵,得到不完全的粒化单调性.进而变换贝叶斯概率公式,构建三支加权变形熵,得到完全粒化单调性以及三支信息系统性.三支加权变形熵推进了粗糙熵,有益于粗糙集的不确定性表示及应用.  相似文献   

5.
在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阁值设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简.实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能.  相似文献   

6.
基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行.  相似文献   

7.
邻域粗糙集是经典粗糙集的一个扩展模型,研究其不确定性度量模型具有重要意义。在邻域粗糙集理论中,当前不确定性度量方面的研究工作主要专注于度量知识空间的粒度大小或边界域尺寸。在邻域系统中,对于目标概念为模糊时的情形,其不确定性不仅来自于邻域粒的边界域,还来自于正域和负域,当前的不确定性度量方法较少考虑这种情形。为此,构建了邻域粗糙模糊集模型,从粒计算的角度出发,进一步提出了多粒度邻域粗糙模糊集模型;针对多粒度邻域粗糙模糊集具有乐观性与悲观性的特点,借鉴Vague集中支持度和反对度的思想,设计了基于模糊度的多粒度模糊熵的不确定性度量方法,不仅符合人类的认知习惯,而且可以有效刻画整个邻域知识空间的结构信息。  相似文献   

8.
针对混合决策系统的属性约简问题,提出了基于邻域粗集模型的小生境克隆选择属性约简算法.采用邻域关系度量不可分辨关系,通过邻域信息粒子逼近论域空间,可以直接处理数值型属性.克隆选择约简算法的提出解决了求解全部约简的NP完全问题.论述了亲和度函数的选择,引入了小生境技术,避免了抗体的早熟收敛及算法中的参数对具体优化目标的敏感性和单一收敛性,给出了算法的具体实现.对经典数据集和UC I中4组数据约简的仿真结果证明了算法的有效性和可行性.  相似文献   

9.
考虑到粗糙集的不确定性与其所在近似空间知识粒度的关系,在属性粗糙集模型的基础上,将传统的粗糙度与知识粒度相结合,提出了一种新的属性粗糙集粗糙性的度量方法,讨论了这一度量的特性.证明了随着近似空间的细分新的粗糙度单调减小的性质.  相似文献   

10.
传统的肿瘤基因选择算法挑选出的特征基因中存在大量噪声基因和冗余基因,从而对基因算法的准确性和分类精度产生影响.针对这一问题,将K-S检验与邻域粗糙集融合成为一种新的特征选择方法.首先,采用累积分布函数计算正负类样本的累积函数值和K-S检验统计量,对照显著性水平下的样本统计量,从而去除冗余基因和噪声基因;然后,使用邻域粗糙集进行约简,对比条件属性重要度得出最优约简结果;最后,对比K-S检验和两种基于K-S检验的特征选择方法得到的冗余度和分类精度,通过实验验证这种方法不仅能准确挑选出具有显著区分能力的肿瘤基因,且效率高具有可行性.  相似文献   

11.
基于邻域决策错误率的属性约简可以在删除冗余属性的同时,提升邻域分类器的留一验证分类精度.但这种约简方式并未充分考虑邻域分类结果在约简前后的差异.为解决这一问题,借助联合分布矩阵,提出了邻域决策一致性的概念,构建了邻域决策一致性与邻域分类精度的调和平均值,并将其作为约简求解的度量准则.在12个UCI数据集上的实验结果表明,所提出的新约简不仅能够有效地提升邻域分类器的决策一致性,而且在多数情况下能够进一步提高邻域分类器的留一验证分类精度.  相似文献   

12.
粗糙集理论是一种有效的属性约简方法,但不能直接处理实值数据。针对此问题,本文首先介绍了邻域和覆盖的概念,在此基础上构造了覆盖自约简和覆盖间约简(属性约简)算法;然后通过讨论邻域内各样本之间关系,提出了相斥元的定义,相斥元的存在可能导致决策正域计算错误,从而得到不符合数据表实际情况的属性依赖性,因此给出了分解相斥元的方法;最后在四个实值的基因表达数据库上进行了实验,结果表明该属性约简算法是有效的,并相对于现有其他算法具有较高的分类精度。  相似文献   

13.
提出了一种基于论域离散度的适应度函数,在前向贪心搜索策略下,以该适应度函数评估条件属性的重要性,进而求取邻域粗糙集的约简。该算法与3个比较流行的属性约简算法进行对比实验,在12组UCI数据集上进行验证。实验结果表明,与另外3种算法相比,在不降低分类效果的情况下,本文算法在时间消耗和稳定性上具有较为明显的优势。  相似文献   

14.
属性约简的一种贪心算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的关键问题之一 ,现已证明寻找一个决策表的最优约简是 NP- hard问题 .首先在粗糙集理论的基础上 ,给出决策表中属性重要性的两种度量 ,并以此为启发式信息 ,提出了一种基于粗糙集的属性约简贪心算法 ;最后 ,实验结果表明 ,该算法在大多数情况下能有效地获得决策表的最优约简 .  相似文献   

15.
一种基于属性重要性的属性约简启发式算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约简算法.该算法以核属性集为初始约简集合,以新的属性重要性度量准则为启发信息,通过逐步加入相对于决策而言重要的条件属性来求取最小约简.实例分析表明该算法是有效的.  相似文献   

16.
邻域粗糙集和模糊粗糙集是粗糙集理论中处理数值型数据的两种重要模型.在数值型信息系统中融合两者在不确定性度量方面的优越性,首先引入了模糊邻域粗糙集模型,并在该模型上定义了模糊邻域粗糙度的概念.模糊邻域粗糙度是通过粗糙集的边界域来度量信息系统的不确定性,为了达到更为全面的度量效果,在模糊邻域粗糙集模型中定义了模糊邻域粒结构,并基于该粒结构提出了模糊邻域粒度的概念,模糊邻域粒度是对信息系统分类能力的一种度量.最后,通过将两种度量方法进行结合,提出了一种基于模糊邻域粗糙集的混合不确定性度量方法,并从理论上证明其有效性.实验结果表明,所提出的混合度量方法综合了两种单独度量方法的优点,在数值型信息系统中具有更好的度量效果,因此所提出的不确定性度量方法更具有一定的优越性.  相似文献   

17.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

18.
粗糙集是处理不确定性信息的有效数学工具,然而,在复杂的环境下,经典粗糙集并不能满足某些特殊的现实需要,因此,为粗糙集引入拓展要素,是增强模型可靠性的重要手段。文章在直觉模糊信息系统下,基于优势关系研究邻域粗糙集模型。首先将直觉模糊数与邻域粗糙集近似算子结合,刻画直觉模糊邻域粗糙近似算子,建立直觉模糊邻域粗糙集模型。然后,引入了优势关系,构建优势邻域类,进而构建基于优势关系下的直觉模糊邻域粗糙集模型,并研究了该模型的上下近似、优势邻域类、集合的基本运算等性质,给出了模型不精确性度量指标。最后通过实例验证了所提出模型的有效性。  相似文献   

19.
传统邻域粗糙集需指定半径或通过搜索方式找出适用于问题求解的半径,这在数据预处理过程中会带来极大的时间消耗.而粒球粗糙集方法则能够依据数据分布,自适应地生成合适的粒结构.以粒球的纯度为度量准则,粒球粗糙集方法亦为属性约简问题的研究引入新的思路.利用前向贪心搜索求解约简时,需尝试计算每一个候选属性被加入约简池后所引起的粒球...  相似文献   

20.
针对旋转机械故障诊断知识获取困难的问题,将邻域粗糙集和Fisher(费舍)判别法相结合,对从故障数据库中提取决策规则的方法进行了研究.首先基于邻域粗糙集理论对转子故障的时域特征属性集进行属性约简,据此达到消除冗余属性的目的,然后再依据费舍判别法对故障数据集进行故障模式识别.通过处理转子实验台数据来对该方法进行的验证以及与传统方法进行的对比情况表明:本方法在节省数据存储空间的同时还具有能够获得较准确的故障分类决策规则能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号