首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 435 毫秒
1.
基于粗糙集属性变分区的属性约简   总被引:1,自引:1,他引:0  
应用粗糙集的方法,分析决策系统中不同的属性分类方法,以及不同分类方法引起的属性重要性与属性相对约简极小子集的变化情况,寻求属性分类方法与属性约简结果相互影响的内在因素,给出高效的属性分类方法和合理确定约简子集的策略,生成策略对应软件的实现算法,并运用软件实现算法来选取相对约简子集.试验结果显示了该策略及算法的有效性.  相似文献   

2.
刻划了基于粗糙集信息颗粒的知识库模型,证明了基于基本信息颗粒的一种正区域等价算法,分析了不可分矩阵的性质,提出并实现了基于粗糙信息颗粒的属性约简算法,使粗糙集理论能更好地适应海量数据集的挖掘.  相似文献   

3.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

4.
传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率,克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.  相似文献   

5.
研究实值系统中的知识获取是粒计算研究的主要方向之一.为给出一种高效的知识获取方法,文中基于邻域粗糙集的原理,针对实值特点,在实值信息系统上给出熵和基于熵的属性重要度的定义和约简定理.同时研究其性质,并给出了实值信息系统上基于熵的属性重要度的约简算法,对算法的性质进行了分析,通过实例验证了该算法的有效性.  相似文献   

6.
不完备信息系统中的属性约简一直是粗糙集研究领域的一个难点.在不完备信息系统中,用以往的属性约简算法得到的约简结果中,某一属性要么属于该约简,要么不属于该约简.但在实际生活中,当属性以比较大的概率可区分两对象时,这就表明该属性可能以某一概率属于约简结果.基于这种想法,文中通过构造概率区分矩阵,并在此基础上给出相应的区分函数,提出了一种概率属性约简算法,分析了算法正确性.从该算法得到的约简,可以看出各属性属于约简的可能性.最后用实例表明该算法是有效和可行的.  相似文献   

7.
本文针对不协调序决策信息系统,面向用户需求研究属性约简问题.首先,根据基于近似分类质量不变给出的属性约简的定义,重新定义不协调序决策信息系统的区分矩阵.然后,在此基础上,给出判定条件属性子集为属性约简的充分必要条件.最后,通过将用户需求纳入考虑,提出面向用户需求的序决策信息系统属性约简算法.理论分析与实例验证显示算法可行且有效.  相似文献   

8.
针对连续型数据的属性约简问题, 提出了一种新的属性约简方法[CD2]基于分配可辨识矩阵的属性约简方法。给出了基于连续型数据的分配协调集的概念, 研究了基于连续型数据的分配协调集的基本性质, 定义了基于分配协调集的辨识矩阵。在此基础上提出了基于辨识矩阵的连续型数据的属性约简方法, 并给出了计算辨识矩阵的算法。实例分析表明, 该方法能有效地对连续型数据进行属性约简。  相似文献   

9.
基于属性约简的PLS加权朴素贝叶斯分类   总被引:1,自引:0,他引:1  
朴素贝叶斯算法是一种简单而高效的分类算法,它的属性独立性假设,影响了它的分类性能.针对这种问题,在分析属性相关性的基础上,通过属性约简选择一组近似独立的属性约简子集,提出一种基于属性约简的偏最小二乘回归加权朴素贝叶斯分类算法.对不同的条件属性给予不同的权值,从而在保持简单性的基础上有效地提高了朴素贝叶斯分类算法的分类性能.实验结果表明,该方法可行且有效.  相似文献   

10.
信息系统作为一种基本的数学模型广泛应用于人工智能的各个分支,例如分类问题、专家系统、决策支持、上下文分析和数据挖掘.而属性约简是信息系统研究的基本问题.文章提出了近似空间映射(ASM)的概念,并讨论了它与属性约简的关系,提出了基于ASM的属性约简新算法.  相似文献   

11.
云计算技术是海量数据挖掘的一种高效解决方案,将MapReduce并行计算模型与粗糙集属性约简算法相结合,提出一种基于MapReduce的浓缩布尔矩阵并行属性约简算法.该算法提高了粗糙集属性约简算法对大数据的处理能力和效率,并能适应云计算环境.实验结果表明,所提算法具有良好的效率、加速比和可扩展性.  相似文献   

12.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

13.
互补决策约简是一种多标记数据属性约简方法,当数据规模较大时,其启发式算法的计算耗时较大。基于粗糙集理论,对互补决策约简启发式算法的加速算法进行了研究。当粒度由粗变细时,在逐步去掉正域的数据集上,首先研究互补决策约简中属性外部重要度的保序性质;基于此,通过逐步缩小数据规模来降低计算约简的耗时,提出了互补决策约简加速算法。加速算法不仅减少了属性约简的计算时间,而且能够保持原始算法的约简结果。  相似文献   

14.
基于正区域的快速求核算法   总被引:2,自引:0,他引:2  
基于正区域求核算法的最好时间复杂度为O(|C|2|U|log|U|),为降低该求核算法的时间复杂度,给出了基于正区域的简化决策表定义和相应核的定义.证明了该简化决策表的核与原决策表的核等价.由于求正区域的简化决策表首先要求划分U/C,而求划分U/C的最好算法的时间复杂度为O(|C||U|log|U|),因此以基数排序的思想设计了一个新的求划分U/C的算法,其时间复杂度为O(|C||U|).最后以快速缩小搜索空间为目的设计了一个新的求正区域POSC(D)的算法.在此基础上,利用核的性质设计了一个新的求核算法,其时间复杂度为max(O(|C||U|,O(|C|2|U/C|)).并用实例说明了算法的实用性.  相似文献   

15.
一种新的快速求核算法   总被引:2,自引:1,他引:2  
为了解决核影响属性约简算法的速度和效率等问题,提出了一种基于正区域的求核算法.采用基数排序思想计算正区域,分别得到决策属性正区域的条件属性集和除决策属性正区域的一个条件属性之外的条件属性集,并且计算这2种属性集的基数之差,以判断该条件属性是否是核属性,依次判断所有条件属性,从而快速获得所需要的核.基于正区域求核算法的时间复杂度为O(|C||U|).实验结果表明,利用该算法求核,所耗时间将随对象数的增加呈线性增长,且当对象数最大时,求核所耗时间仅为对比算法的0.6%,同时证明了该算法对各种数据集均有很好的适应性.  相似文献   

16.
一种快速属性约简算法   总被引:6,自引:1,他引:5  
基于差别矩阵的属性约简算法,先要求出差别矩阵,随着问题的规模增大,存放差别矩阵的空间和算法的执行时间过大和过长,让计算机难以承受.针对这一问题,提出了差别对象对集的定义,给出了基于差别对象对的属性约简定义,并证明了该定义等价于基于差别矩阵的属性约简定义.利用差别对象对,设计了一个新的属性约简算法.由于这一算法在求属性约简的过程中不用生成差别矩阵和大量的无用元素,因而大大减少了存储量和计算量,从而提高了算法的效率.计算实例说明了新算法的高效性.  相似文献   

17.
属性约简的一种贪心算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的关键问题之一 ,现已证明寻找一个决策表的最优约简是 NP- hard问题 .首先在粗糙集理论的基础上 ,给出决策表中属性重要性的两种度量 ,并以此为启发式信息 ,提出了一种基于粗糙集的属性约简贪心算法 ;最后 ,实验结果表明 ,该算法在大多数情况下能有效地获得决策表的最优约简 .  相似文献   

18.
粗糙集理论是一种处理不确定性问题的数学工具.论文应用粗糙集理论研究不完备决策表的属性约简问题,针对非对称相似关系提出了不完备决策表中正域协调集的概念,并讨论了它的基本性质,给出了正域协调集的充分必要条件,借助区分函数给出了计算正域约简的方法.  相似文献   

19.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号