首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 102 毫秒
1.
从粒度计算的观点出发,给出了信息系统中知识距离的定义,指出利用知识距离可以度量信息系统中知识的粗糙性,分析了其相关性质.提出了一种基于知识距离的启发式属性约简算法,算法不需求核,对无核的特殊信息系统计算约简更加有效.  相似文献   

2.
信息系统中粒计算模型及其属性约简方法   总被引:1,自引:0,他引:1  
粒计算是一种基于问题概念空间划分的新的智能计算理论和方法,目前在国际上逐步得到了人工智能有关研究人员的重视。模糊粒度模型、粗糙集粒度模型、邻域系统下的粒计算模型、商空间模型、相容粒度空间模型是目前几种常用的粒计算模型。基于粗糙集理论的粒度模型,通过决策信息系统的粒子空间中各粒子的推理,给出了决策信息系统中核属性计算方法;在此基础上,提出了决策信息系统属性约简的计算方法;通过实例验证了该方法的有效性。  相似文献   

3.
针对决策信息系统属性增加且属性值发生细化的情况下如何快速更新属性约简的问题,探讨了基于矩阵方法计算决策信息系统相对知识粒度的增量更新机理,设计了属性增加且属性值发生细化的矩阵增量约简算法。当决策表中的属性值细化且决策表中属性增加时,所提出的增量约简算法与非增量约简算法及其他增量约简算法相比,约简的分类精度变化不大,但是能够大大缩短计算约简的运行时间。最后利用一些UCI数据集做了大量仿真实验,仿真结果验证了所给出的动态属性约简算法能够有效地解决动态数据约简的问题。  相似文献   

4.
特征选择是粗糙集理论在数据挖掘等领域中一种重要的应用,如何对动态变化的信息系统进行增量式特征选择是目前粗糙集理论研究的重点。在不完备混合型信息系统中,属性集的不断增加是信息系统动态变化的一种重要形式。首先在不完备混合型信息系统中引入邻域条件熵的概念,并且利用矩阵的方法去表示邻域条件熵;然后针对属性集动态增加的情形,提出矩阵形式的邻域条件熵增量式更新,并且基于这种增量式更新机制给出了相应的增量式特征选择算法;最后,UCI数据集的实验结果表明,所提出的增量式特征选择算法比非增量式特征选择算法具有更高的特征选择性能。  相似文献   

5.
由于数据自身的不确定性和观测条件有限,现实问题中许多数据以区间值形式呈现。其中,优势关系下的区间值信息表研究对于多属性决策问题有重要意义。目前针对该系统的属性约简方法主要是辨识矩阵法或基于互信息的增量式约简,但前者计算效率较低,而后者没有利用到决策信息。文章探讨了条件熵作为不确定性度量在该系统下的性质,通过比较不同属性缺失时信息系统的条件熵变化,引入了属性重要度概念,基于此提出启发式属性约简算法。最后,通过对比实验验证了本算法具有低冗余的特点,在约简率上比基于粗糙熵和正域不变等序信息系统的启发式约简。  相似文献   

6.
一种基于相对粒度的不完备决策表约简算法   总被引:1,自引:0,他引:1  
为有效地从不完备决策表中获取最小相对约简,提出了一种基于相对粒度的不完备决策表约简算法.该算法通过分析研究知识的相对粒度在属性约简过程中的变化趋势,并基于属性约简定理,尝试通过不断向核属性集中增加属性的方法,从不完备决策表中获取最小相对约简.最后通过实例验证了该算法的有效性.  相似文献   

7.
廖建文  陈文伟 《应用科技》2012,(3):51-55,60
属性约简贯穿知识发现的整个过程,对知识发现的结果和精度都有很大影响.以信息理论为基础,提出了信息系统相容性和属性约简若干严格的数学概念,对信息系统的条件属性进行了严密的分类,且给出了一些判别法则,以及信息系统相容性判别算法和具有线性计算复杂度求极小属性约简的算法.  相似文献   

8.
一种变粒度的规则提取算法   总被引:1,自引:0,他引:1  
属性约简和值约简是粗糙集理论中知识获取的重要组成部分。通常,在知识获取的过程中先进行属性约简,然后在其基础上进行规则提取。但在实际应用中,属性约简在简化信息系统与提高规则提取效率的同时,原始信息系统中有些重要的条件属性可能被丢弃,从而导致属性约简后对信息系统进行知识获取得到的规则其数量与简化程度并不占优。针对上述问题,提出一种基于粒度变化的规则获取算法,通过属性粒度从粗到细的变化,直接从原始信息系统中提取规则;采用该方法得到的规则与属性约简后得到的规则相比,它们的数量与平均每条规则包含的特征属性数相对较少。最后,在理论分析的基础上,通过实例验证了算法可行性,并通过实验验证了算法的正确性和高效性。  相似文献   

9.
一种增量式属性约简更新算法   总被引:1,自引:0,他引:1  
根据关系矩阵表示与计算方法,提出一种基于二叉树的增量式属性约简更新算法,主要考虑对象动态增加情况下属性约简的更新问题.该算法通过快速更新二叉树,在动态求解核的基础上,通过对二叉树进行剪枝,有效地进行增量式属性约简的更新,并就该方法的有效性进行了理论证明与示例分析.  相似文献   

10.
研究实值系统中的知识获取是粒计算研究的主要方向之一.为给出一种高效的知识获取方法,文中基于邻域粗糙集的原理,针对实值特点,在实值信息系统上给出熵和基于熵的属性重要度的定义和约简定理.同时研究其性质,并给出了实值信息系统上基于熵的属性重要度的约简算法,对算法的性质进行了分析,通过实例验证了该算法的有效性.  相似文献   

11.
信息系统的粒度熵及基于粒度熵的属性约简算法   总被引:2,自引:1,他引:1  
针对完备信息系统中,知识随着知识中属性的逐渐增加或减少从而对论域产生不同粗细的划分进行研究,给出了一个新的度量--粒度熵,以度量知识随着属性的逐渐增加或减少对论域产生不同粗细划分时的分辨能力,并基于粒度熵设计了对信息系统进行属性约简的算法.  相似文献   

12.
针对目前决策表属性约简的计算问题,研究了粗糙集理论中差别矩阵,讨论了知识粒度与信息量、类别特征矩阵之间的关系,利用知识粒度最大的属性生成较小的类别特征矩阵,设计了新的启发式规则来快速缩小搜索空间和最小化属性选择,提出了一个基于知识粒度的最小属性约简算法,并用一个实例证明了算法的正确性。与类别特征矩阵相比,采用知识粒度生成的类别特征矩阵可以有效地减少存储空间。实验结果表明,所提出的算法能够得到最小属性约简。  相似文献   

13.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

14.
基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行.  相似文献   

15.
属性约简是数据挖掘、机器学习等研究领域中的一个颇为重要的预处理步骤,其效率的高低会直接影响相关任务的性能.针对已有的非增量式属性约简方法在相容块粗糙集模型中对象集发生变化时无法高效更新属性约简的问题,提出一种以区分度为启发信息的增量式属性约简方法 .首先,引入相容块的概念并运用相容块对论域进行划分,在此基础上给出不完备信息系统的区分度定义;然后,详细分析对象集发生变化条件下区分度的更新机理;进一步,以区分度为启发式信息构造增量式属性约简算法;最后,选取六个UCI数据集进行增量式约简的更新实验.实验结果表明,在不影响属性约简精度的前提下,该增量式方法的时间消耗比非增量式更新方法平均缩短50%,更加可行和高效.  相似文献   

16.
基于二进制粒与粒计算的属性约简   总被引:1,自引:0,他引:1  
目前有关粒计算的理论与方法主要有商空间理论、词计算理论和粗糙集理论.以粗糙集理论发展的粒计算理论为基础,定义了幂图、粒度幂图及二进制粒等概念,提出基于二进制粒计算与粒度幂图的两种属性约简算法,把属性约简问题转化为在粒度幂图中的搜索问题,为属性约简开辟了新的途径.理论分析表明,所提出的算法是有效可行的.  相似文献   

17.
在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阁值设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简.实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能.  相似文献   

18.
邻域系统是一种数值信息粒度计算模型,该模型可以直接分析数值型数据,拓展了经典粗糙集理论的应用范围。邻域系统中现有的增量算法基本上都是从代数观下分析其变化情况。文章从信息观角度出发,分析了当批量增加样本后,新条件熵的变化机制,并分析出决定条件熵变化的是新增批量样本的不一致邻域,进而导致约简集的变化。基于此,提出一种信息观下批增量式属性约简算法,该算法只需找到新增的不一致邻域,并与新增样本一起进行约简,避免了有重复的约简,大大地减少了计算量,从而能够迅速得到更新后的约简集。最后分析了算法的复杂度,并且通过相关的实验验证了本文算法的有效性和高效性。  相似文献   

19.
由于相似关系或相容关系不具有传递性或对称性,从而相容类或相似类之间存在误判,因此研究不完备信息系统中合适粒度下的粗糙性度量和属性约简算法很有必要。在不改变相关模型的基础上,文章通过极大相容块的思想,研究了非等价关系的基本知识粒度构造,进一步讨论了合适粒度下的粗糙性度量方法,提出了基于极大相容块的知识粗糙性更精确的定义和极大相容块的条件信息熵及其属性重要性定义,并证明了相关性质;给出了合适粒度下属性约简的启发式算法,结果表明,极大相容块的重要性度量避免了通常意义下粒度过粗问题,知识粗糙性更为准确。  相似文献   

20.
目前有关粒计算的理论与方法主要有商空间理论、词计算理论和粗糙集理论。以粗糙集理论发展的粒计算理论为基础,定义了幂图、粒度幂图及二进制粒等概念,提出基于二进制粒计算与粒度幂图的两种属性约简算法,把属性约简问题转化为在粒度幂图中的搜索问题,为属性约简开辟了新的途径。理论分析表明,所提出的算法是有效可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号