首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
文中提出一种离散和连续混合属性的复杂信息系统增量式属性约简算法.首先,将粒计算模型中的知识粒度在混合型信息系统下进行推广,提出了邻域知识粒度,并构造出基于邻域知识粒度的非增量式属性约简算法,然后在混合型信息系统下研究了邻域知识粒度随对象增加时的增量式计算,理论证明了该计算方式的高效性,最后提出了基于邻域知识粒度的混合信息系统增量式属性约简算法.UCI数据集的实验结果表明,所提出的算法在混合型信息系统中具有很高的增量式属性约简性能.  相似文献   

2.
属性约简是数据挖掘、机器学习等研究领域中的一个非常重要的预处理步骤,其效率的高低会直接影响到数据挖掘、机器学习等相关任务的性能。针对目前已有的非增量式属性约简方法在处理不一致邻域信息系统动态变化时无法高效更新属性约简的问题,提出一种在不一致邻域决策信息系统中对象集发生变化时的增量式属性约简方法。首先,该文以不一致邻域决策信息系统为研究对象,结合不一致邻域的特点给出了一种新的不一致度的表示方法。在此基础上用不一致度来表征属性重要度,以属性重要度为启发式信息研究不一致邻域信息系统对象集发生变化条件下邻域类以及不一致度的更新机理。随后,以不一致度为启发信息构建了增量式属性约简算法。进一步,在UCI上选取6个数据集,通过分类精度测试实验精选出各个数据集的最佳邻域半径δ,最后,利用最佳邻域半径δ在各个数据集上执行增量式属性约简算法实验,实验结果表明该文提出的增量式属性约简算法在保持分类精度不变的前提下较其他算法更加快速和有效。  相似文献   

3.
基于随机集的粗糙集模型(Ⅱ)   总被引:10,自引:0,他引:10  
为了说明粗糙订理论在不完备信息系统中的应用,给出了基于随机集的粗糙集方法,提出了不完备信息系统的随机粗糙集的描述,讨论了不完备属性的随机集选择与系统的完备化的关系,并且介绍了一个求不完备属性的最大熵概率测度的算法。  相似文献   

4.
邻域系统是一种数值信息粒度计算模型,该模型可以直接分析数值型数据,拓展了经典粗糙集理论的应用范围。邻域系统中现有的增量算法基本上都是从代数观下分析其变化情况。文章从信息观角度出发,分析了当批量增加样本后,新条件熵的变化机制,并分析出决定条件熵变化的是新增批量样本的不一致邻域,进而导致约简集的变化。基于此,提出一种信息观下批增量式属性约简算法,该算法只需找到新增的不一致邻域,并与新增样本一起进行约简,避免了有重复的约简,大大地减少了计算量,从而能够迅速得到更新后的约简集。最后分析了算法的复杂度,并且通过相关的实验验证了本文算法的有效性和高效性。  相似文献   

5.
基于扩展可辨识矩阵的混合决策系统属性约简   总被引:1,自引:1,他引:0  
经典粗糙集理论的研究对象只能是完备的离散决策系统。为了直接对不完备混合决策系统进行属性约简,因此通过引入邻域关系和限制容差关系的概念对可辨识矩阵的定义进行了扩展,提出了一种基于扩展可辨识矩阵的属性约简算法;该算法可以兼容处理完备与不完备混合决策系统。通过UCI数据集的仿真实验证明了该算法的有效性,最后讨论了扩展可辨识矩阵中的邻域阈值选择对属性约简结果的影响。  相似文献   

6.
属性约简是数据挖掘、机器学习等研究领域中的一个颇为重要的预处理步骤,其效率的高低会直接影响相关任务的性能.针对已有的非增量式属性约简方法在相容块粗糙集模型中对象集发生变化时无法高效更新属性约简的问题,提出一种以区分度为启发信息的增量式属性约简方法 .首先,引入相容块的概念并运用相容块对论域进行划分,在此基础上给出不完备信息系统的区分度定义;然后,详细分析对象集发生变化条件下区分度的更新机理;进一步,以区分度为启发式信息构造增量式属性约简算法;最后,选取六个UCI数据集进行增量式约简的更新实验.实验结果表明,在不影响属性约简精度的前提下,该增量式方法的时间消耗比非增量式更新方法平均缩短50%,更加可行和高效.  相似文献   

7.
粗糙集模型作为一种重要的粒计算模型,是处理数据的重要工具.在实际生活中,由于数据来源的多样性,信息系统常出现集值型数据,这些信息系统被称为集值信息系统.由于信息的更新,集值信息系统中的属性集会发生动态变化,因此,基于局部相容粗糙集模型,研究用矩阵来表示其上、下近似的方法,讨论随着属性集的动态变化局部关系矩阵的变化以及上、下近似的变化,并通过具体实例说明提出的更新方法在处理集值型数据时的有效性.最后给出与增量方法对应的算法,并在UCI数据库中选取了几组数据进行实验.实验结果证明,这种通过矩阵表示上、下近似并对其进行更新的方法是有效的,可以提高计算效率,降低时间复杂度.  相似文献   

8.
借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。  相似文献   

9.
知识约简是粗糙集理论研究中的一个重要内容,可辨识矩阵是属性约简的一个重要方法,把这种方法推广到不完备模糊决策信息中,定义了相似关系下的可辨识矩阵,提出了不完备模糊决策信息系统中相似关系的可辨识矩阵属性约简的算法,最后用实例验证了算法的可行性.  相似文献   

10.
根据粗糙集的理论,在信息系统中使用了分布约简的概念,并利用相应的可辨识属性矩阵,提出了一种在决策表中获取规则的增量式方法,该算法对决策表中出现的各种新对象进行分析,在原有的分布约简的基础上进行增量式更新,从而避免了重新计算.  相似文献   

11.
广义邻域粗集下的集成特征选择及其选择性集成算法   总被引:1,自引:1,他引:0  
针对实际模式识别系统中样本特征常具有的连续值属性、高维性、强相关性和冗余性等影响分类效果的问题,在广义邻域粗集模型下提出一种集成特征选择及其选择性集成算法.该算法先提取样本特征并利用所提出的马氏距离分布熵评估其重要度,再基于特征重要度构建广义邻域粗集模型,并在此模型上以特征重要度为启发式信息设计基于蚁群算法的属性约简算法,然后通过改变广义邻域粗集模型参数的方式获得更多具有更大差异性的基分类器,最后利用主成分分析法对产生的基分类器进行选择性集成.模拟电路故障诊断结果表明,该算法比AdaBoost等算法取得的分类精度至少提高了2.6%.  相似文献   

12.
基于信息熵的不完备信息系统属性约简算法   总被引:11,自引:0,他引:11  
在现实生活中信息的不完备现象广泛存在,等价关系不一定成立,限制了经典Rough集理论在一些实际问题中的应用.从信息论角度出发引入信息熵的概念,提出了不完备信息系统中知识熵的度量方法,定义了信息观下不完备信息系统知识约简的方法,分析并讨论了与现有其他约简定义的关系,给出了一种基于信息熵的不完备信息系统属性约简算法,通过仿真实验说明了该算法对于不完备信息表知识约简是可行的.  相似文献   

13.
边界条件熵的属性约简及在定性仿真中的应用   总被引:1,自引:0,他引:1  
从Pawlak拓扑的角度,给出了一种知识边界粗糙熵和边界条件熵的新定义,并反映出集合的不确定性可以通过边界域来描述的思想,证明了边界条件熵随着信息粒度的变小而单调减少的重要结论.弹簧定性仿真实例,结合定性推理技术,以边界条件熵为基础构造属性约简的启发式算法,消去定性描述中的冗余,获得了弹簧系统定性微分方程式.实验结果表明,粗集理论在定性推理与定性仿真技术中的重要应用价值,基于边界条件熵的属性约简是有效的.  相似文献   

14.
一种基于互信息的粗糙集知识约简算法   总被引:2,自引:0,他引:2  
针对粗糙集理论核心内容之一的知识约简问题,该文提出了一种改进的互信息的属性约简算法。该算法结合信息论中信息熵与互信息的概念定义了粗糙集里的一种新的属性重要度,并以此属性重要度为启发式信息进行属性约简。实验分析表明:在大多数情况下,该种算法都能够得到决策表的最小约简。  相似文献   

15.
一种新的不完备信息系统属性约简算法   总被引:1,自引:0,他引:1  
针对不完备信息系统提出一种基于粗糙集理论的属性相对约简方法。利用粗糙集等价关系的扩展,即容差关系为基础提出容差关系相似矩阵的概念,通过引入广义决策函数的限制来解决不完备信息系统约简的不一致性问题,通过容差关系相似矩阵求不完备信息系统的核属性,利用属性在容差关系相似矩阵中出现的频率给出了属性重要度的计算公式,利用属性重要度为约简的启发式规则,并运用折半启发式算法减少扩展次数,提高约简速度。实验表明该方法简单、有效。  相似文献   

16.
针对不完备信息系统(含有缺省数据或不精确数据),研究它的粗糙分类;并基于相容关系,将分布约简、最大分布约简、分配约简、近似约简引入不完备信息系统;且给出了最大分布约简的一种启发式算法:条件信息量约简算法。经实验检验,该算法是有效的。  相似文献   

17.
特征选择是机器学习领域中的重要研究问题.作为一种重要的特征选择方法,属性约简正在受到越来越多的关注,在许多应用领域已经得到了广泛应用.文章对基于Rough Sets理论的特征选择算法作了系统的回顾和分析,具体包括启发式属性约简、基于区分矩阵的属性约简和扩展粗糙集模型的属性约简三个方面.此外,论文还给出了粗糙特征选择算法的几种常见应用,并对该领域的进一步发展进行了展望.  相似文献   

18.
相容关系的改进及其属性约简   总被引:1,自引:0,他引:1  
针对经典粗糙集理论处理不完备信息系统存在的局限性,作者从扩展粗糙集理论的适用范围出发,引入不完备信息系统对象的先验概率并结合量化相容关系的思想,提出了改进的相容关系模型.以该模型为基础研究了不完备信息系统的属性约简.通过严格的数学证明,给出了属性约简算法.该算法以空集为起点求取系统的约简,不需要计算核,节约了时间,减少了占用空间,简化了求解过程.通过实例验证该改进相容关系模型及其属性约简算法.  相似文献   

19.
基于差别矩阵的增量式属性约简完备算法   总被引:1,自引:0,他引:1  
为了解决基于差别矩阵的属性约简完备算法得不到最小约简的问题,提出了一种改进的属性约简方法.该方法将信息论定义的属性重要性作为启发式信息,并通过构造一个条件信息熵算子对差别集合进行运算,同时利用算子来计算候选属性的剔除次序,采用宽度优先搜索策略使约简集合中含有最重要的属性,这样就解决了完备算法约简率低的问题.结合该方法并在分析对象集增量与差别矩阵关系的基础上,证明了增量约简定理,由此提出了一种增量式约简完备算法(CAIR),当新数据加入决策表时,算法可增量构造差别集合.实验结果表明,所提CAIR在大大缩短计算差别集合时间的同时,约简率比非完备算法提高了20.3%,是同条件下完备算法执行效率的13.2倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号