首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 671 毫秒
1.
针对不完整决策系统属性约简算法时间复杂度较高问题,基于正域不变条件下,决策系统分类能力保持不变原则,提出不完整决策系统前向顺序特征选择算法.该算法从约简集为空集开始,根据在约简集合中加入各属性后对正域影响程度大小将属性降序排列,采用顺序前向搜索,选择当前最佳特征加入特征约简集合,确定最佳特征子集.将该算法扩展到基于邻域...  相似文献   

2.
结合一致性准则的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
文章从属性选择角度对粗糙集属性约简概念进行扩展,在属性约简综合多重属性选择标准方面做了初步的研究。将属性类内一致性选择标准与粗糙集属性约简结合,以获得抗噪的约简;设计了一种全局最优算法和一种次优filter算法,从分类正确率、最简性及类内类间距离方面对一致性判据JC进行了测试,实验结果显示一致性高的属性约简集优于其他约简集。  相似文献   

3.
基于粗糙集的属性约简算法研究   总被引:20,自引:1,他引:19  
提出一种新的基于粗糙集的属性约简算法.该算法采用层次结构和近似精度的概念,约简集中的属性选择从空集开始,用启发函数ξ作为选择条件属性的衡量标准,逐步加入相对于决策而言重要的条件属性,并采用下近似值作为剪枝依据,逐步删除给定论域U中根据该属性子集能完全正确分类的对象,减小了属性约简过程中的搜索空间,处理过程是递归的,直到给定论域U为空集,保证了在分类精度不变的情况下,获得简化的属性集,最后运用粗糙集中正域的概念,约简冗余的属性值并求出其最简规则.对UCI机器学习数据库中7个数据库属性约简结果证明了该算法的正确性和可行性.  相似文献   

4.
属性约简是粗糙集理论研究的核心内容。目前已有的研究成果往往是根据分类性能、代价或不确定性等一些度量来定义及求解约简,并未充分考虑数据扰动有可能对约简结果产生的波动影响。为解决这一问题,提出了一种可以求解稳定约简的启发式算法框架:首先,在全体样本集上利用多次聚类进行多重采样以得到若干边界样本集合;其次,利用集成策略,对每一个属性在所有边界样本集合上求得的重要度进行融合;最后,选择重要度较高的属性加入到约简集合中。在8个UCI数据集上将新算法与传统算法进行对比分析,实验结果表明当数据发生扰动时,所提出的方法不仅能够有效地提升求解约简的时间效率与约简结果的稳定性,而且依据约简所求得分类结果的稳定性也有显著增强。  相似文献   

5.
针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法。首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决策理论确定经典域、节域和待评物元,通过计算各簇中属性之间的关联度构建指示矩阵,并计算各属性的指示值;最后,根据指示值,从大到小依次选择属性,实现样本集属性约简。实验结果表明,算法运算速度较快,约简后对数据集分类精度影响小,部分数据集分类精度有所提升,验证了算法的有效性。  相似文献   

6.
基于决策属性支持度的知识约简方法   总被引:9,自引:2,他引:9  
提出了一种基于决策属性支持度的属性相对约简算法·该算法利用粗糙集理论分析的方法,通过在知识表达系统中引入决策属性支持度的概念,来描述由条件属性所提供的知识对整体决策的支持程度,并通过决策属性支持度定义了条件属性对决策属性的相对重要性,以此作为启发式信息,可以方便地求出相对核·再以相对核作为求解最小相对约简的起点,按重要性的不同逐次选择重要属性添加到相对核中,直至其支持度达到整体条件属性支持度时为止,此时即得到知识库的最小约简·通过实例分析证明,该方法是有效的·  相似文献   

7.
一种基于属性重要性的属性约简启发式算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约简算法.该算法以核属性集为初始约简集合,以新的属性重要性度量准则为启发信息,通过逐步加入相对于决策而言重要的条件属性来求取最小约简.实例分析表明该算法是有效的.  相似文献   

8.
通过粗糙集理论对一种实值属性约简算法进行了研究,给出了实值决策系统属性约简的算法,并采用UCI中的数据集进行分析,实验结果表明:该约简方法可以选择较少的属性而保持或改善分类能力.  相似文献   

9.
为了提高分类的精确度,提出一种基于粗糙集理论的增强学习型分类器。采用分割算法对训练数据集中连续的属性进行离散处理;利用粗糙集理论获取约简集,从中选择一个能提供最高分类精确度的约简。对于不同的测试数据,由于离散属性值的变化,相同的约简可能达不到最高的分类精确度。为克服此问题,改进了Q学习算法,使其全面系统地解决离散化和特征选择问题,因此不同的属性可以学习到最佳的分割值,使相应的约简产生最大分类精确度。实验结果表明.该分类器能达到98%的精确度.与其它分类器相比.表现出较好的性能。  相似文献   

10.
提出一种基于粗糙集理论的决策树分类算法.首先,将核属性集中的核属性进行合取后加入析取变换,实现属性约简;其次,在决策树构造阶段,对各条件属性分别求其上下近似集,进而得到各属性的近似精度.选择近似精度最大的属性作为决策树的根结点,以此方法递归应用到各子树上来选择决策树的结点并实现决策树的剪枝.实例分析表明,改进的算法提高了决策树方法的效率.  相似文献   

11.
用粗糙集进行数据挖掘是近年来被采用的一种新的有效方法 ,本文针对传统粗糙集分类方法过于严格 ,对噪音过分敏感的缺点 ,提出了改进的粗糙集挖掘模式及相应面向属性的约简算法和实现步骤  相似文献   

12.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

13.
基于粗糙集方法的知识发现   总被引:1,自引:0,他引:1  
属性约简和属性值约简是租糙集理论中的重要研究内容,也是粗糙集理论应用于知识发现的主要方法.但求取任意问题的最小属性集是一个NP难问题.本文利用属性间的知识依赖度,提出了一个求取属性约简的贪心算法,它可以在多项式时间内得到一个约简.同时,把粗糙集方法应用于知识发现,通过属性约简删除信息系统的冗余属性,减少数据量,再利用属性值约简,获取决策规则.最后通过实例说明了基于粗糙集方法的知识发现过程,验证了方法的有效性.  相似文献   

14.
一种连续属性离散化的新算法   总被引:5,自引:0,他引:5  
连续属性的离散化问题是机器学习、数据挖掘等领域中重要研究课题之一,本文深入讨论连续属性离散的各种方法,提出一种基于RS理论和条件信息熵的决策表条件属性离散化算法,计算简单、易实现并以实例加以说明。  相似文献   

15.
针对垂直划分多决策表,利用半可信第三方和交换加密体制,设计了一个安全多方计算交集基数协议。利用该协议设计了安全多方计算信息熵和安全多方计算条件信息熵的解决方案,提出了一种基于条件信息熵的隐私保护属性约简算法。该算法基于粗糙集信息观的约简理论实现了分布式环境下全局属性约简的求解,使各参与方在不共享其隐私信息的前提下达到集中式属性约简的效果,分析结果表明该算法是有效可行的。  相似文献   

16.
从数据挖掘的一般性定义入手,给出了EIS环境下数据挖掘的概念和过程.并根据EIS和数据挖掘各自的特点,以概念树算法和决策树算法为例,在分析了它们的算法原理的基础上,探讨了通过属性值间概念存在的层次关系实现EIS数据查询的逐级细化;根据信息论原理,以分类学习为基础,通过计算各属性所含信息量大小,得出判断规则,为EIS辅助决策提供支持.  相似文献   

17.
粗糙集理论是一种研究不完整、不确定知识处理的数学工具,属性约简是粗糙集理论的核心内容之一.阐述了粗糙集理论的基本思想,给出了一种启发式的最小约简算法,通过一个实例,分析说明算法的可行性和有效性.  相似文献   

18.
决策树是分类数据挖掘的重要方法。C4.5算法延用了经典ID3算法的基本策略,增加了处理连续属性的方法。在C4.5算法的基础上,讨论了新的基于属性变换的连续属性处理方法。该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度。  相似文献   

19.
粗糙集理论中约简是一个重要的研究课题,它包括属性约简和属性值约简两方面内容。针对目前属性值约简只能实现约简,而不能计算各个规则的出现次数的问题,结合关联规则和粗糙集两方面的优点,对冗余规则和不一致规则进行处理,获得具有实际意义的约简表。实验证明,此算法是有效的。  相似文献   

20.
一种基于粗糙集理论的启发式分类规则挖掘算法   总被引:1,自引:0,他引:1  
粗糙集理论是一种新的数据挖掘算法,文章以属性依赖重要性作为启发信息提出了一种新的属性约简算法,且加入了一定的分类正确度。最后通过一个实例完整演示了本方法,证实其有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号