首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种改进的Rough集属性约简启发式遗传算法   总被引:4,自引:0,他引:4  
属性约简是知识发现中的关键问题之一 .为了能够有效地获取决策表中属性最小相对约简 ,提出了一种在优化初始群体基础上提高算法性能的启发式遗传算法 .首先 ,通过构造一个新的算子 ,将信息论角度定义的属性重要性度量作为启发式信息 ,来描述所选择的属性子集对论域中确定分类子集的影响 ;接着 ,以此为基础并结合遗传算法 ,选择一些经过优化的染色体作为初始群体 ,在加强局部搜索能力的同时保持了该算法全局寻优的特性 .最后 ,从理论上对算法做了分析 ,证明了新算子所选择的属性子集对原有属性分类能力保持不变 .试验分析表明 ,该算法能有效地对决策表属性进行约简  相似文献   

2.
传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率,克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.  相似文献   

3.
文章对现有启发式属性约简算法进行分析,通过实例说明一般启发式算法求得的相对约简有冗余属性存在的问题.针对这一不足,在算法中加入消除冗余属性的二次约简过程,得到一种改进的启发式属性约简算法.提供了实例分析,验证了该改进算法具有较好的约简效果.  相似文献   

4.
一种改进的粗糙集属性约简启发式算法   总被引:43,自引:0,他引:43  
提出了一种改进的属性约简启发式算法 ,讨论了启发式信息的构造 .通过两个反例证明了现有的两种属性重要度定义 (基于属性依赖度的定义和基于信息熵的定义 )的不完备性 ,提出了一种加权平均的属性重要度定义 ;在此基础上构造了两种启发式算法 .通过 UCI机器学习数据库中的几个实例验证了此算法的有效性  相似文献   

5.
一种基于依赖度的决策表属性约简算法   总被引:1,自引:0,他引:1  
属性约简是粗集理论研究的重要内容之一,计算所有属性约简已被证明是NP-hard问题,目前尚不存在一种非常有效的方法。基于依赖度的决策表属性约简算法,可同时适用于一致和不一致的决策表,实验结果表明,与Hu提出的属性约简算法相比,该算法不仅简单可行,而且具有较好的时间性能。  相似文献   

6.
文章对现有启发式属性约简算法进行分析,通过实例说明一般启发式算法求得的相对约简有冗余属性存在的问题。针对这一不足,在算法中加入消除冗余属性的二次约简过程,得到一种改进的启发式属性约简算法。提供了实例分析,验证了该改进算法具有较好的约简效果。  相似文献   

7.
为解决属性约简的诸多问题,比如基于信息熵的属性约简方法偏向多值属性的缺点,而基于属性相似度的属性约简方法偏向少值属性的不足,现提出一种将信息熵和属性相似度结合起来的新的启发式属性约简方法.实验结果表明,避免了上述两种属性约简算法的偏向性.  相似文献   

8.
基于可辨矩阵的属性约简算法都是从信息系统中直接求得约简,提出了分两步求得约简,降低了算法的时间复杂度为O(mn^2),第一步计算出近似约简,第二步去掉其中的冗余属性。改变了过去人们认为基于可辨矩阵的特征选择算法的时间复杂度不低于O(m^2n^2)的观点(其中m为数据集中特征/属性的个数,n为数据集中样本的个数)。最后给出了实验结果.  相似文献   

9.
基于依赖度的启发式约简算法   总被引:2,自引:0,他引:2  
知识约简是Rough Set理论研究中的核心内容之一。文章首先从知识协调性的角度,对知识决策表中属性的依赖度给出度量,并提出了一种基于依赖度的知识相对约简的启发式算法,分析了该算法的复杂性。通过对一个知识系统的实例分析,证明了该算法的可行性和有效性。  相似文献   

10.
海量数据属性约简的研究是数据挖掘研究中的一个难点.已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理.结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法.利用该算法可以快速得到海量数据的属性约简结果.仿真实验结果说明了该算法的高效性.  相似文献   

11.
朱果平 《太原科技》2010,194(3):83-84
在粗糙集理论中,决策表的属性约简是一个非常重要的研究课题。通常人们期望找到最小属性约简,而遗传算法根据个体适应值动态地调整个体的交叉概率和变异概率,提高了遗传算法的寻优能力和收敛速度。  相似文献   

12.
提出了简化差别函数的概念及其算法,简化差别函数不仅具有与决策表相同的决策能力,而且剔除了由决策表导出的原始差别函数中的重复项和冗余项.为了降低遗传约简算法适应度函数的搜索空间,有效提高计算速度,又提出了一种高效遗传约简算法,其将染色体时简化差别函数的覆盖度以及染色体中包含1的个数作为适应度函数的参数,从而保证了算法朝着最小约简收敛,并从理论上证明了算法的属性约简结果为最优,算法的时间复杂度为O(|f′|||C||U|^2),同时,通过4个实例对算法进行了验证,结果表明简化差别函数的项分别为原来的0.39%、0.0008%、0.00008%和0.0003%,且在500代以内能够获得最小属性约简.  相似文献   

13.
基于逼近精度的一个粗糙集属性约简算法   总被引:10,自引:0,他引:10       下载免费PDF全文
43(2000)01-0007-04摘要:根据信息表中相对每个条件属性的集合和划分的粗糙逼近精度,给出衡量属性重要性程度的一种准则.在此基础上,提出了信息表属性约简的一个较为简单有效的算法.  相似文献   

14.
一种改进的基于粗糙集的启发式值约简算法   总被引:1,自引:0,他引:1  
在求得决策表中属性值核的基础上,用属性重要度指导增加后续属性值,还引入包含度和支持度统计度量,生成了不同置信度水平下的决策规则集,并设计了基于规则集的分类算法。对Monk数据集的对比实验表明,该算法是有效的。  相似文献   

15.
用于粗糙集约简的并行算法   总被引:1,自引:0,他引:1  
通过对数据挖掘粗糙集约简算法的研究, 提出一种基于区分能力指数的信息系统数据划分思想. 先将系统按属性区分能力分成若干子表, 再由子表的约简求原系统的约简, 这种思想较好地简化了布尔函数的化简过程. 根据该思想设计了一个属性约简并行算法, 并利用Petri网模拟工具CPN Tools对算法的负载平衡进行了分析, 通过实验与相应的串行算法在时间上进行了对比, 实验结果显示, 该算法对于对象较多的大规模系统具有较高的效率.  相似文献   

16.
结合高压输电线路远程监测系统,在参考粗糙集理论的基础上,结合粗糙熵相关知识,针对复杂系统故障影响因子的特点,提出了一种属性约简算法,最后得出相应的算法规则,解决了复杂信息数据简化的问题。实例证明,该算法是可行的。  相似文献   

17.
基于不完备信息系统的分配约简的启发式算法   总被引:2,自引:0,他引:2  
研究了不完备信息系统下的属性约简,基于相容关系提出一种遗传算法的分配约简算法,算法编码采用了二进制一维编码形式,比较适合地表达了遗传算子.为了加快算法的收敛,在适应值函数中引入了惩罚函数,可以保证所求约简既含较少属性又有较强支持度.在交叉规则中,采用了单点交叉,最大迭代代数被作为停止准则,算法获得较佳的搜索效果.通过实例分析,可以证明该算法是求解知识约简问题的快速有效方法.  相似文献   

18.
提出了一种新型的决策规则约简方法。基于均匀划分和正态分布隶属度函数,对决策表的连续属性进行模糊化,用欧氏距离贴近度来构建相似矩阵,并提出了一种论域的模糊划分算法;依据粗糙集隶属度进行属性约简的基础上,给出了一种决策规则约简算法,从而达到发掘知识并简化知识的目的。  相似文献   

19.
胡国定教授基于“概念的内涵与外延的反比例关系律”这种思想,给出了一种信息度量方法。本文以粗糙集理论为基础,利用胡教授提出的这种信息度量,讨论了决策表属性约简和信息量之间的关系,证明了对于相容决策表,其属性约简在代数表示和此种方法给出的信息表示下的等价性。并举例说明对于不相容决策表,其属性约简不能用信息量来等价表示。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号