首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
有许多文献针对集中式集值决策信息系统进行了研究,但还没有针对分布式集值决策信息系统方面的研究。主要讨论了分布式环境下集值决策信息系统的属性约简问题。从概率角度给出了集值对象的相似性度量,定义了分布式集值决策信息系统中的粗糙集模型;以保持系统正域不变为准则,分析了分布式集值决策信息系统中子决策表和属性的可约性;随后,给出了分布式集值决策信息系统中属性对于系统可约的2个判定条件,并采用后向搜索策略提出了相应的属性约简算法;为了验证该方法的有效性,在5份数据集上进行了50组实验。实验结果表明,提出的方法可以在保持分布式集值决策信息系统分类能力基本不变的情况下约简掉冗余的属性。。  相似文献   

2.
通过粗糙集理论对一种实值属性约简算法进行了研究,给出了实值决策系统属性约简的算法,并采用UCI中的数据集进行分析,实验结果表明:该约简方法可以选择较少的属性而保持或改善分类能力.  相似文献   

3.
属性约简是粗糙集理论的重要研究内容之一,主要是用于去除高维数据的冗余信息.利用图论求约简是覆盖决策信息系统属性约简的一个新方法,其将覆盖决策系统的约简等价于超图的极小顶点覆盖.本研究提出一种新的覆盖决策信息系统的属性约简算法,该算法采用三步策略:首先确定覆盖决策信息系统的辨识集,然后得到超图的关联矩阵,最后用贪心法求出...  相似文献   

4.
数据分类的方法直接影响着分类效果。用粗糙集理论中的区分矩阵和区分函数进行的属性约简可以很好地用于数据分类当中,基于此,提出一种数据分类方法,即用区分矩阵和区分函数约简掉信息系统中的冗余属性,得到必要的属性集;然后再约简掉每一条规则中的冗余属性值,提取出决策规则,最后按照决策规则进行分类。实验证明,用该方法实现的数据分类复杂馋低,且能有效提高分类效果。  相似文献   

5.
面向属性的粗集数据挖掘方法研究   总被引:3,自引:2,他引:3  
指出粗集理论的主要思想是在保持分类能力不变的情况下,利用等价类,通过属性约简和决策规则约简,达到挖掘知识并简化知识的目的.但约简问题是一个NP问题,只能通过启发式算法实现.针对这一问题,提出了属性约简和决策规则约简的启发式算法,构成了一个基于粗集理论的挖掘集成算法.最后通过实例表明,该集成算法能够以较高的效率发现良好的分类规则.  相似文献   

6.
由于数据自身的不确定性和观测条件有限,现实问题中许多数据以区间值形式呈现。其中,优势关系下的区间值信息表研究对于多属性决策问题有重要意义。目前针对该系统的属性约简方法主要是辨识矩阵法或基于互信息的增量式约简,但前者计算效率较低,而后者没有利用到决策信息。文章探讨了条件熵作为不确定性度量在该系统下的性质,通过比较不同属性缺失时信息系统的条件熵变化,引入了属性重要度概念,基于此提出启发式属性约简算法。最后,通过对比实验验证了本算法具有低冗余的特点,在约简率上比基于粗糙熵和正域不变等序信息系统的启发式约简。  相似文献   

7.
随着形式背景中数据的增多,概念数量会急剧增加。基于决策形式背景的属性约简在保持决策规则分类能力不变的前提下,寻找极小属性子集,使得决策规则得以简化。文章首先将规则分为强规则与弱规则,提出非冗余规则的判定定理及规则约简的判定定理并予以证明;其次提出规则约简及规则输出算法,具体做法是:生成非冗余规则,然后对非冗余规则进行约简,保留规则中相对必要属性的最简形式,删除规则中的不必要属性;随后讨论了算法的时间复杂度。通过实例分析,对比了其他属性约简算法的运行效率和分类能力,证明本文提出的算法具有可行性和正确性。  相似文献   

8.
本文研究了粗糙集理论中的属性约简问题。一般的约简算法和改进的约简算法都不能够得到一个令人满意的属性约简结果。为了找到具有较少属性的约简,文中提出了使用贪心约简算法,通过对接受过超选择性迷走神经切断术(HSV)治疗的具有11个属性的20个十二指肠溃疡病人构成的信息系统作近似分析,获取了一个与原决策表分类质量相同的仅含有5个属性的较小属性集。实验证明:用此方法能有效地去除冗余信息,对其症状进行约简提炼,从而获取简单而又能体现症状与病征的规则。  相似文献   

9.
面对生活中数据信息量大的问题,常使用粗糙集对数据进行知识约简,消除数据中冗余的部分。但大多数研究没有考虑约简后对原有分类的影响;常使用的朴素贝叶斯算法又难以获得其先验概率。基于上述问题,本文提出了一种基于粗糙集的贝叶斯分类算法:首先利用粗糙集中决策属性和条件属性之间的依赖关系,进行属性约简,消除冗余的数据,然后通过贝叶斯算法对约简后的数据进行知识挖掘,最后通过对故障源数据的对比分析。该方法既避开了朴素贝叶斯算法对先验概率的要求,又使得数据分类和预测能力有了明显提升。  相似文献   

10.
通过对大量旅游突发事件的样本数据进行分析和处理,给出了旅游突发事件中决策系统的构建过程,该过程包括属性提取、属性分类(将属性分为条件属性集和决策属性集)和数据清洗.然后在此基础上构建了一个广泛适用的决策表,并应用粗糙集中基于Pawlak属性重要度的属性约简算法对该决策表进行了属性约简.经过属性约简后,在保持决策表的条件属性和决策属性依赖关系不变的前提下,降低了决策表相对于决策属性的条件属性个数,减少了论域的样本数目,从而可以得到一个更有价值的决策表系统.实验结果表明,在约简后的决策表中可更容易地得出简洁实用的决策规则,甚至可以发现一些潜在的决策关系,能在一定程度上提高旅游突发事件关联规则的获取和决策能力.  相似文献   

11.
基于决策支持度的不完备信息系统约简算法   总被引:1,自引:0,他引:1  
提出了一种基于决策属性支持度的属性相对约简算法。通过引入决策属性支持度对不完备决策表中属性的重要性进行了定义,并以此作为启发信息进行属性的选择,该算法的时间复杂度是多项式的。寻找决策表中最小相对约简问题是典型的NP-hard问题,采用该算法可降低问题复杂度。通过实例说明,该算法能得到不完备决策表的最小相对约简。  相似文献   

12.
一种改进的Rough集属性约简启发式遗传算法   总被引:4,自引:0,他引:4  
属性约简是知识发现中的关键问题之一 .为了能够有效地获取决策表中属性最小相对约简 ,提出了一种在优化初始群体基础上提高算法性能的启发式遗传算法 .首先 ,通过构造一个新的算子 ,将信息论角度定义的属性重要性度量作为启发式信息 ,来描述所选择的属性子集对论域中确定分类子集的影响 ;接着 ,以此为基础并结合遗传算法 ,选择一些经过优化的染色体作为初始群体 ,在加强局部搜索能力的同时保持了该算法全局寻优的特性 .最后 ,从理论上对算法做了分析 ,证明了新算子所选择的属性子集对原有属性分类能力保持不变 .试验分析表明 ,该算法能有效地对决策表属性进行约简  相似文献   

13.
文根据一种基于粗糙集理论的数据挖掘方法,以市场调查数据为研究对象,通过适当的约简算法,得出简化的决策集,分析私家车潜在消费者群体特征。提出了一种启发式的约简算法,在属性约简之前,首先定义了一种条件属性分类能力强度,根据各属性分类能力强度对决策表进行排序,然后采用逐行扫描的方法逐条判断属性是否为不必要属性,解决了属性约简可能出现多个约简结果需要靠人为选取满意结果的问题。  相似文献   

14.
邓春燕  阮忠  吕跃进 《广西科学》2009,16(4):385-388
建立决策系统与关系矩阵之间的联系后,从关系矩阵的角度研究属性重要性的指标,并利用该指标作为启发式信息提出一种新的属性约简算法.该算法具有较大的灵活性,能够从搜索空间逐次删除不重要的属性,避免对这些属性进行重复搜索,提高了搜索的效率.该算法可行有效.  相似文献   

15.
为解决日趋增长的噪声大数据分类问题,提出了一种高度随机模糊森林算法.该算法在决策树学习中生成连续属性的模糊分区,并给出在MapReduce框架中所提算法的分布式实现,用于受属性噪声污染的大数据集中学习模糊决策树的集合,该分布式实现模型可以适应计算的有效分配策略,从而产生良好的可扩展性数据,这种分布式算法使得模糊随机森林能够处理大数据集的学习和分类.高度随机模糊森林算法能够实现噪声大数据的高精度分类,为以后的大数据分析打下良好的基础.实验结果表明,所提算法比现有算法准确率更高,在属性噪声情况下,该文分类准确率也高于随机森林算法,说明该文算法的可行性和有效性.  相似文献   

16.
粗糙集理论的主要思想是在保持分类能力不变的前提下,通过属性约简和值约简,提取决策规则。本文主要是提出了利用隶属度函数进行值约简的同时提取决策规则的算法。利用该算法可在不求得核值表的情况下,直接找到各规则的最小条件属性集,获得决策表的所有决策规则。  相似文献   

17.
研究不完备形式背景的属性约简问题。通过比较对象间属性值的一致性, 定义了对象集上的一个相似关系, 进而定义了基于相似关系的粗糙近似算子, 利用目标集的粗糙集近似, 可以提取语义明确的决策规则。基于不完备形式背景中相似关系给出一种属性约简的概念, 研究了属性约简的判定定理, 给出了三类属性的特征刻画。 最后, 利用对象间的辨识属性, 给出了一种属性约简的方法, 并举例说明了方法的可行性。  相似文献   

18.
基于关系矩阵的信息系统属性约简算法   总被引:1,自引:0,他引:1  
提出了信息系统属性约简的一种新算法,从关系矩阵角度定义了属性重要度及非核属性次要度,然后以属性重要度指标作为启发式信息,辅以属性次要度,设计了一种简洁、有效的属性约简算法.该算法具有较大的灵活性,能从搜索空间逐次删除重要度为零及次要度低的属性,避免对这些属性进行重复搜索,提高了搜索的效率,最后通过实例验证了算法的可行性与有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号