首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

2.
提出采用贝叶斯理论提取信息不相容和不完备的试验数据规则.首先以试验数据汇总表的确定性(可信度)为先验概率、试验数据的样本数(支持度)为后验概率,然后计算组合规则的条件概率,提取条件概率大于某一阈值的规则,最后通过逻辑合取与析取归并提炼规则.实例计算和应用分析表明,采用贝叶斯理论提取规则的算法概念明确,计算过程简单,便于编制计算机程序,最大限度避免了规则提取中的知识失真和规则丢失.  相似文献   

3.
在实际应用中,集合是动态变化的,包括元素的迁入和迁出.双向概率PS-粗糙集既考虑集合的动态特性,又考虑知识库中统计信息的粗集理论.在深入分析概率PS-粗糙集理论及其性质的基础上提出了基于双向概率PS-粗糙集的动态三支决策模型,以解决集合动态变化下的三支决策问题.首先,根据双向概率PS-粗糙集的上下近似得到概率PS-正域、负域和边界域,给出了双向概率PS-粗糙集的三支决策规则,并分析了三种规则的置信度与错误率的计算方法与性质;其次,定义了决策度量函数与决策损失函数,并基于贝叶斯决策论的最小风险决策规则,给出了参数阈值的计算方法;最后,讨论了此动态模型的决策性质,并通过元素迁入和迁出的实例证明了模型的正确性与可行性.  相似文献   

4.
将粗糙集理论与模糊集理论相结合并应用于膨胀土分级问题中,利用粗糙集中的知识约简方法挖掘评价指标.把权重问题转成粗糙集理论中属性重要性问题,建立了关于膨胀土分级评价的关系数据模型。将评价结果与实际的评价结果对比分析,研究结果表明:预测等级与实际结果吻合,比较客观地反映了膨胀土分类的复杂状况,且该方法操作简单。  相似文献   

5.
为了提高决策系统的分类质量,探讨了一种在数据仓库中基于粗糙逼近近似度量的挖掘分类规则策略.首先介绍了数据集中挖掘分类规则的基本原理,并利用粗糙集理论中粗糙逼近近似度量概念,根据决策表条件属性重要性度量及条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,最后举例说明了如何在数据库中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠.  相似文献   

6.
介绍了粗糙集理论实现数据分类和规则推理的基本原理,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不相容规则的决策系统的多层次数据挖掘算法,应用一实际的例子说明如何在数据库中发现分类规则.  相似文献   

7.
一种基于关联模式的完全决策规则的提取方法   总被引:1,自引:1,他引:1  
针对基于粗糙集理论提取完全的决策规则是NP难问题,提出一种获取统计意义下的完全的简化规则的算法.该算法结合关联规则挖掘方法和粗糙集方法的优点,从决策表中提取出具有一定支持度和可信度阈值的决策规则,具有实际的应用意义.通过实例验证了算法的有效性.  相似文献   

8.
认为数据量的巨大和高维、用户交互与先验知识的利用等等是知识发现领域面临的问题和难点 .粗糙集理论是一种具有模糊边界的集合理论 ,它作为研究知识发现的新型工具 ,能严格地处理不精确数据的分类问题 ,被广泛应用于不相容决策表中的规则提取过程中 .针对粗糙集理论中属性约减和属性值约减这两个重要问题进行了研究 ,并介绍了数据集中挖掘分类规则的基本原理 ,同时利用 RS理论中核和核值的概念 ,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系并简化决策系统的数据挖掘算法 ,并应用一简单的例子说明如何在数据库中发现分类规则 ,实验结果表明此算法可以大大提高系统潜在知识的清晰度  相似文献   

9.
基于增量式遗传算法的粗糙集分类规则挖掘   总被引:8,自引:0,他引:8  
从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性.  相似文献   

10.
一种基于粗糙集的文本分类规则抽取方法   总被引:10,自引:0,他引:10  
随着文本数据库的日益增大,寻找新的文本数据处理方法变得十分紧迫。本文将粗糙集理论应用于文本自动分类的规则提取,提出了基于粗糙集理论的文本分类方法。把文本特征项的权值进行离散化处理后,作为规则的条件属性,文本所属的类别用作决策属性,构造决策表,然后通过决策表的知识约简算法提取出文本的分类规则。实验结果表明,该方法提取规则的分类正确率较高,分类速度较快。  相似文献   

11.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

12.
基于粗糙集和决策树的数据挖掘方法   总被引:9,自引:1,他引:9  
从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果·  相似文献   

13.
粗糙集作为数据挖掘工具,主要通过分类数据得到预测型知识,但分类规则过于严格,使得在挖掘带噪音的数据时,挖掘结果可能会损失一些有价值的规则.提出一种带不确定因子的信息系统及相应的分类方法,改进了传统粗糙集的分类方法.  相似文献   

14.
实际中收集的数据类型具有多样性,如何从这些复杂数据中获取有用的知识是人们进行数据挖掘的目标。由于覆盖粗糙集可以处理复杂的数据,基于此对覆盖决策系统的属性约简和规则提取已有不少的研究。已有的覆盖决策系统规则提取的研究只考虑唯一的置信度评估度量,然而提取的高置信度规则覆盖的样例可能较少而具有欺骗性,由此本文又引入了一个评估规则覆盖能力的度量,从而可以消除数据中的偶然因素,获取泛化能力强的高置信度规则。在此基础上,为了提取紧凑的规则,给出了一个规则置信度保持的属性约简启发式算法。  相似文献   

15.
提出了一种基于可变精度粗糙集的规则挖掘矩阵算法,它是一个采用基于分类精确度的粗糙集模型进行决策规则挖掘的新方法,能有效地处理决策表的不一致性。实例结果和实际应用表明该算法是有效的,为信息系统的规则约简、获取和信息压缩提供了新的思路。  相似文献   

16.
基于遗传算法和粗糙集理论的增量式规则获取方法   总被引:1,自引:0,他引:1  
规则获取的增量式算法是数据挖掘领域的一个热点问题.基于粗糙集理论,从规则获取和优化两方面研究了基于遗传算法的增量式规则挖掘方法,它具有结构简单、搜索效率高、求解速度快等优点.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识,并且将遗传算法和规则挖掘算法相结合,建立了新的优化方法,提出了一种基于遗传算法的增量式规则挖掘的方法.在原有规则集的基础上进行规则和规则参数的增量式更新,避免了为更新规则而重新运行规则获取算法.试验结果表明,执行增量式GA的能够有效地获取最优规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号