首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
从理论上研究了决策表中决策值细化程度与信息粒度、近似分类的精度及近似分类质量之间的关系,结果表明,决策属性的属性值划分得越细,则该属性的信息粒度、近似分类精度和近似分类质量的值就越小.仿真实验同时证明,在基于决策属性划分之下,对任意一个条件属性集经决策细化后的决策表所对应的信息粒度、近似分类精度和近似分类质量的值,都不大于决策细化前决策表所对应的信息粒度、近似分类精度和近似分类质量的值,这个结果对研究决策表属性约简和决策规则的有效性等问题都有指导作用.  相似文献   

2.
针对粗糙集的决策系统,给出了有效等价类细化和有效集合细化的定义,从理论上分析了必要属性细化后对上近似和下近似、近似分类精度和质量以及决策规则的数量和相对约简的影响.针对细化的区域分三种情况讨论,得出了在各种区域下划分的结果,如果对有效集合细化划分的越细,上近似和下近似就越逼近给定的集合,分类精度和近似分类质量就越大,产生的规则在包含原规则的基础上增多,并且相对约简和属性的必要和不必要的性质保持不变.研究结果对决策表的属性约简、决策规则形成和有效性等问题具有实际意义.  相似文献   

3.
一种改进的基于粗糙集的启发式值约简算法   总被引:1,自引:0,他引:1  
在求得决策表中属性值核的基础上,用属性重要度指导增加后续属性值,还引入包含度和支持度统计度量,生成了不同置信度水平下的决策规则集,并设计了基于规则集的分类算法。对Monk数据集的对比实验表明,该算法是有效的。  相似文献   

4.
针对决策信息系统属性增加且属性值发生细化的情况下如何快速更新属性约简的问题,探讨了基于矩阵方法计算决策信息系统相对知识粒度的增量更新机理,设计了属性增加且属性值发生细化的矩阵增量约简算法。当决策表中的属性值细化且决策表中属性增加时,所提出的增量约简算法与非增量约简算法及其他增量约简算法相比,约简的分类精度变化不大,但是能够大大缩短计算约简的运行时间。最后利用一些UCI数据集做了大量仿真实验,仿真结果验证了所给出的动态属性约简算法能够有效地解决动态数据约简的问题。  相似文献   

5.
为了提高决策系统的分类质量,探讨了一种在数据仓库中基于粗糙逼近近似度量的挖掘分类规则策略.首先介绍了数据集中挖掘分类规则的基本原理,并利用粗糙集理论中粗糙逼近近似度量概念,根据决策表条件属性重要性度量及条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,最后举例说明了如何在数据库中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠.  相似文献   

6.
属性约简和属性值约简是利用粗糙集理论从决策表中挖掘决策规则的基础,挖掘决策规则是粗糙集理论的重要研究领域之一。本文根据属性的重要度和条件差别矩阵来进行条件属性约简,找出有效约简。同时定义了决策表的不一致度,并根据属性重要度来进行属性值约简,在保持决策表不一致度不增加的前提下挖掘出决策规则,该决策规则集满足独立性、覆盖全域性、可接受性和一致性,即决策规则集为决策算法,最后运用实例对该方法的有效性进行说明。  相似文献   

7.
 讨论了基于正区域与近似分类质量代数约简定义的等价性,证明了基于决策强度的属性约简与信息熵约简是等价的,从条件概率的角度将代数约简与信息熵约简的数学模型在形式上给出了统一表示,分析了它们在一致决策表下是一致的以及在不一致决策表下是不一致的根本原因。  相似文献   

8.
基于变精度粗糙集的产品配置规则提取及增量式更新   总被引:1,自引:0,他引:1  
针对传统粗糙集产品配置规则提取方法容噪性较差的问题,应用变精度粗糙集方法,依据产品设计实例数据建立配置决策表,通过设定分类精度,进行了基于决策类下近似的相对属性约简和基于核值属性的值约简,依据支持度获得有效的产品配置规则.考虑设计实例增加对规则提取的影响,采用增量式更新方法对新增决策表进行规则提取,处理新增配置规则与原配置规则之间的重复、包含和冲突关系,依据可信度进行配置规则的更新.以水平定向钻机配置规则提取为例,验证了所提方法的可行性和有效性.  相似文献   

9.
针对目前诊断推理中知识库构建存在知识获取困难,提出了一种基于粗糙集和决策理论的诊断知识库构建模型.该模型引入决策技术和粗糙集理论,对源数据进行预处理,构建决策表,通过属性约简和属性值约简获取故障诊断的最小约简属性集和诊断规则,并建立诊断规则知识库.实例证明在保持故障诊断分类结果的情况下,该方法可以提取出最能反映故障的特征知识,并能有效地解决诊断知识库构建中规则获取的知识冗余或缺失问题,显著提高故障诊断的精度和效率.  相似文献   

10.
通过对大量旅游突发事件的样本数据进行分析和处理,给出了旅游突发事件中决策系统的构建过程,该过程包括属性提取、属性分类(将属性分为条件属性集和决策属性集)和数据清洗.然后在此基础上构建了一个广泛适用的决策表,并应用粗糙集中基于Pawlak属性重要度的属性约简算法对该决策表进行了属性约简.经过属性约简后,在保持决策表的条件属性和决策属性依赖关系不变的前提下,降低了决策表相对于决策属性的条件属性个数,减少了论域的样本数目,从而可以得到一个更有价值的决策表系统.实验结果表明,在约简后的决策表中可更容易地得出简洁实用的决策规则,甚至可以发现一些潜在的决策关系,能在一定程度上提高旅游突发事件关联规则的获取和决策能力.  相似文献   

11.
传统的模糊决策树虽然可以从模糊数据中抽取模糊分类规则,但只能获取节点的隶属度信息,无法得出样本数据对于节点的非隶属度和犹豫度信息,导致数据分类的准确率不高。针对此,基于毕达哥拉斯模糊集理论,提出了一种新的加权毕达哥拉斯模糊决策树算法(Weighted Pythagorean Fuzzy Decision Tree,WPFDT)。首先,通过改进的K-means聚类算法得到连续属性数据的聚类中心,并结合三角模糊数对连续数据进行模糊处理;其次,定义并计算每一个属性的加权毕达哥拉斯模糊熵,选择加权毕达哥拉斯模糊熵最小的属性作为决策树根节点,在根节点下递归选择模糊熵最小的属性作为分裂节点,同时通过阈值控制树的规模,得到从根节点到叶子节点路径的模糊规则以及模糊规则的隶属度、非隶属度以及犹豫度,并完成预测分类,直至生成WPFDT模型;最后,选取UCI上的3个医学数据集(Haberman、Breast Cancer、Parkinson)进行实验,在分类准确率和得出模糊规则的数量与3种传统决策树算法(模糊ID3算法、C4.5算法、CART算法)比较,实验结果表明:WPFDT在分类精度和树大小上都优于其他传统决策树算法,并且有较高的召回率和精确率。  相似文献   

12.
提出了一种粗糙模糊神经网络分类器的模型。其过程为:利用粗糙集理论获取分类知识,根据训练样本建立决策表,进行决策表属性值离散化、属性约简和分类规则的提取;依据约简后决策表的属性、经模糊化处理的属性值及分类规则构造粗糙模糊神经网络分类器。该分类器可以有效地克服粗糙集规则匹配方法抗噪声能力和规则泛化能力差的缺点;同时可简化神经网络的结构,加快网络的训练速度。并详细介绍了该分类器用于汽车车牌字符识别的步骤和实验结果。  相似文献   

13.
针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的.  相似文献   

14.
一种不完备信息表的预处理方法   总被引:1,自引:0,他引:1  
针对不完备信息表预处理问题中的不完备数据的填补问题、冗余属性的约简问题和连续属性的离散化问题进行了研究. 应用粗糙集理论,由相容信息表中条件属性与决策属性间的一致性对应关系,定义了划分区间的加法运算,解决了不完备数据填补问题;根据类别概念,定义了差别向量,利用差别向量加法运算删除了冗余属性;根据条件属性与决策属性之间的依赖关系及相对信息熵概念,实现了连续属性的离散化. 数值示例和实验结果显示此方法是有效可行的.  相似文献   

15.
具有全局聚类的多属性离散化算法   总被引:1,自引:1,他引:0  
为了减少连续属性离散化后有用信息的丢失和信息系统总的断点数量,提出了一种具有全局聚类效果的多属性离散化算法.算法根据各属性预插入断点对信息系统近似分类质量的影响,来确定要插入断点的属性,从全局属性范围选择最佳断点.根据Ameva统计量来判断属性中最佳断点的位置,并以保证决策表的近似分类质量作为算法的终止条件.实验采用多...  相似文献   

16.
数据分类的方法直接影响着分类效果。用粗糙集理论中的区分矩阵和区分函数进行的属性约简可以很好地用于数据分类当中,基于此,提出一种数据分类方法,即用区分矩阵和区分函数约简掉信息系统中的冗余属性,得到必要的属性集;然后再约简掉每一条规则中的冗余属性值,提取出决策规则,最后按照决策规则进行分类。实验证明,用该方法实现的数据分类复杂馋低,且能有效提高分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号