首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
一种改进的决策树算法   总被引:1,自引:0,他引:1  
为解决决策树算法ID3的多值偏向的缺点,利用属性相似度偏向少值属性的特点,提出一种将属性相似度作为信息熵的系数的属性选择标准,从而提出相应的决策树生成算法.实验结果表明,新算法既避免了以信息熵作为属性选择标准的决策树算法的多值偏向,也避免了以属性相似度作为属性选择标准的决策树算法的少值偏向.  相似文献   

2.
核聚类算法是一种能够处理样本间差异微弱的有效聚类算法.以粗糙集理论为基础,将基于属性重要度的属性约简算法应用到核聚类算法中,提出一种新的聚类改进算法,由此可以得到高准确率低复杂度的良好结果.该算法在使用核函数对样本优化前,首先用基于属性重要度的约简算法对样本属性进行处理,同时引入信息熵来改进约简算法,从而删除冗余属性得...  相似文献   

3.
一种改进的粗糙集属性约简启发式算法   总被引:43,自引:0,他引:43  
提出了一种改进的属性约简启发式算法 ,讨论了启发式信息的构造 .通过两个反例证明了现有的两种属性重要度定义 (基于属性依赖度的定义和基于信息熵的定义 )的不完备性 ,提出了一种加权平均的属性重要度定义 ;在此基础上构造了两种启发式算法 .通过 UCI机器学习数据库中的几个实例验证了此算法的有效性  相似文献   

4.
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.  相似文献   

5.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

6.
研究了基于联合熵和粗糙集理论的关联规则挖掘算法,改进了基于粗糙集的属性离散化方法—连续属性联合熵差离散化算法;以联合信息熵作为属性约简的标准,提出了基于联合熵的知识约简算法;并给出了以支持度、兴趣度和准确度为阈值的有效关联规则算法.  相似文献   

7.
给出基于信息熵的属性约简的矩阵表示,由此设计一个新的基于信息熵的属性约简算法,并用实例验证算法的可行性.该算法比较直观,容易理解,而且所占用的辅助空间少.  相似文献   

8.
基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行.  相似文献   

9.
在分析大肠早癌荧光数据属性约简方法的基础上,提出一种基于容错关系信息熵的粗糙主成分属性约简方法.该方法首先针对数据的不完整特性,建立容错关系粗糙集模型.然后,引入随信息量减小而单调下降的信息熵,建立基于信息熵的容错关系粗糙集模型,并进行初步数据属性处理.最后,结合主成分分析方法,形成基于容错关系信息熵的粗糙主成分分析方法,在进行数据降维处理的同时提取数据特征.以大肠早癌荧光光谱为实验数据的分析处理结果表明,该方法可以有效地降低荧光光谱数据的处理维数,提取影响医疗诊断的特征数据,减少后续数据处理的复杂度.  相似文献   

10.
研究不完备形式背景的属性约简问题。通过比较对象间属性值的一致性, 定义了对象集上的一个相似关系, 进而定义了基于相似关系的粗糙近似算子, 利用目标集的粗糙集近似, 可以提取语义明确的决策规则。基于不完备形式背景中相似关系给出一种属性约简的概念, 研究了属性约简的判定定理, 给出了三类属性的特征刻画。 最后, 利用对象间的辨识属性, 给出了一种属性约简的方法, 并举例说明了方法的可行性。  相似文献   

11.
一种基于属性重要性的属性约简启发式算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约简算法.该算法以核属性集为初始约简集合,以新的属性重要性度量准则为启发信息,通过逐步加入相对于决策而言重要的条件属性来求取最小约简.实例分析表明该算法是有效的.  相似文献   

12.
信息系统作为一种基本的数学模型广泛应用于人工智能的各个分支,例如分类问题、专家系统、决策支持、上下文分析和数据挖掘.而属性约简是信息系统研究的基本问题.文章提出了近似空间映射(ASM)的概念,并讨论了它与属性约简的关系,提出了基于ASM的属性约简新算法.  相似文献   

13.
粗集理论是一种处理不精确,不完全与不相客知识的新的数学工具.属性约简是粗集理论研究的核心问题之一.通过属性约简,简化信息表的属性雏数.在许多情况下面临的信息系统是不完备的,本文研究不完备信息系统下决策表的属性约简问题.  相似文献   

14.
属性约简是个NP难问题,目前已有很多解决方法,但是每种算法由于其自身的局限性,只适用于特定条件下的求解。蚁群算法是较新的仿生优化算法,在解决各类组合优化问题中都取得了很好的效果。提出一种基于Rough集和蚁群算法的属性约简方法,能够克服传统蚁群算法在前期收敛速度慢的问题,并通过实验验证了该方法的有效性。  相似文献   

15.
粗糙集属性约简判别分析方法及其应用   总被引:6,自引:0,他引:6  
为了解决统计逐步判别分析法存在的问题,提出了一种基于粗糙集属性约简的统计判别分析方法.首先采用粗糙集属性约简进行变量筛选,这样可充分利用粗糙集属性约简不需要属性分布的先验信息这一特点,再对所选择的变量进行Bayes判别分析训练,建立判别函数或相应的后验概率函数,以解决选择变量过程中存储量较大且检验变量的重要性总体服从正态分布这一主观性假设等问题.通过对油气储层数据的实际分析表明,所提方法不仅易于实施,而且检验数据集的判别准确率高于统计逐步判别分析法,同时可节省预测成本,提高预测速度.  相似文献   

16.
样本信息处理中一种属性约简方法的研究   总被引:10,自引:1,他引:10  
为了剔除样本信息中存在的冗余成分和不相容性,同时提取关键信息等,根据样本信息的特点和信息具有粒度的思想,基于粗糙集的2个近似精度科学地定义了条件属性重要性,进而提出一种对样本信息进行属性约简的有效、简便方法.该方法主要包括信息核的求取、可省条件属性的重要性计算和相对属性约简集的确定.其中,为连续属性的离散化处理提供了一种基于模糊相似比原理的快速离散化算法,它能起到剔除模糊噪声的作用.典型实例计算和在油水层识别系统中的实际应用表明,这种属性约简方法的识别准确率可达90%以上,应用效果显著.  相似文献   

17.
一种基于属性依赖的属性约简算法   总被引:1,自引:0,他引:1  
针对现有属性约简算法存在的问题,利用信息论和粗糙集理论,提出了基于属性依赖的属性约简算法,该算法不用求核.首先利用单个条件属性与决策属性的依赖度来选择条件属性,取与决策属性依赖度大的属性,计算完毕后,将得到的条件属性两两之间进行依赖度计算,删除冗余属性,最后得到条件属性的约简.理论分析及实验结果表明该算法具有较好的约简效果及更高的运行效率.  相似文献   

18.
核是粗糙集理论的基本概念之一,为使获取的知识规则更简洁、更易于理解,许多算法都以先求出信息系统的核为基础进行启发式搜索以求取信息系统属性集的最小约简.通过实例验证,发现了许多文献中核的定义与核的计算之间存在矛盾冲突,这一矛盾冲突导致众多属性约简算法普遍存在核基为0时无法有效地进行属性约简的缺陷.针对核概念的这一问题及由此引起的属性约简算法的缺陷,对粗糙集理论中核的概念进行了重新定义,将核的定义统一于核的计算,提出了真核和伪核两个新概念,并给出了这两个新概念的相关定理及证明.  相似文献   

19.
一种变粒度的规则提取算法   总被引:1,自引:0,他引:1  
属性约简和值约简是粗糙集理论中知识获取的重要组成部分。通常,在知识获取的过程中先进行属性约简,然后在其基础上进行规则提取。但在实际应用中,属性约简在简化信息系统与提高规则提取效率的同时,原始信息系统中有些重要的条件属性可能被丢弃,从而导致属性约简后对信息系统进行知识获取得到的规则其数量与简化程度并不占优。针对上述问题,提出一种基于粒度变化的规则获取算法,通过属性粒度从粗到细的变化,直接从原始信息系统中提取规则;采用该方法得到的规则与属性约简后得到的规则相比,它们的数量与平均每条规则包含的特征属性数相对较少。最后,在理论分析的基础上,通过实例验证了算法可行性,并通过实验验证了算法的正确性和高效性。  相似文献   

20.
基于差别矩阵的增量式属性约简完备算法   总被引:1,自引:0,他引:1  
为了解决基于差别矩阵的属性约简完备算法得不到最小约简的问题,提出了一种改进的属性约简方法.该方法将信息论定义的属性重要性作为启发式信息,并通过构造一个条件信息熵算子对差别集合进行运算,同时利用算子来计算候选属性的剔除次序,采用宽度优先搜索策略使约简集合中含有最重要的属性,这样就解决了完备算法约简率低的问题.结合该方法并在分析对象集增量与差别矩阵关系的基础上,证明了增量约简定理,由此提出了一种增量式约简完备算法(CAIR),当新数据加入决策表时,算法可增量构造差别集合.实验结果表明,所提CAIR在大大缩短计算差别集合时间的同时,约简率比非完备算法提高了20.3%,是同条件下完备算法执行效率的13.2倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号