首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 110 毫秒
1.
探讨基于粗糙集的分类规则挖掘技术,提出一种融合不同数据源中的分类规则的方法.该方法能保证规则的完整性,即获得适用于全局的所有分类规则,并通过实验进行验证,结果表明该融合方法与直接在全局数据中挖掘分类规则的方法相比,具有运算量小、效率高的优势.针对大规模数据在分类求解中出现的过融合问题,应用剪枝策略进行实验,实验结果表明该剪枝策略正确可行,可以提高分类效果.  相似文献   

2.
基于粗集不相容系统的膨胀土分类规则提取   总被引:2,自引:0,他引:2  
分析膨胀土分类的粗糙性, 指出膨胀土分类是一个基于粗糙集的信息不相容决策系统. 针对常规方法容易引起规则失真的不足, 提出将贝叶斯理论和不相容系统决策挖掘相结合来提取膨胀土分类规则: 以膨胀土分类决策系统的可信度为先验概率, 膨胀土试验数据的支持度为后验概率, 计算膨胀土分类规则的条件概率;提取条件概率大于某一阈值的规则;通过逻辑合取与析取归并膨胀土分类规则. 实例计算和应用分析结果表明: 采用贝叶斯理论和基于粗糙集的不相容系统决策挖掘相结合的方法有利于基于粗糙集的不相容系统的数据挖掘, 而且为膨胀土分类规则的提取提供了一种切实可行的算法.  相似文献   

3.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

4.
基于粗糙集理论的客户分类规则挖掘模型   总被引:4,自引:0,他引:4  
刘嘉  梁勇勇 《甘肃科技》2004,20(10):83-85
本文构建了一个基于粗糙集理论的客户分类规则挖掘模型 ,通过该模型对烟草公司客户数据的分析 ,挖掘出了隐含在数据中的分类规则 ,找到了客户分类的特征描述。  相似文献   

5.
为了提高决策系统的分类质量,探讨了一种在数据仓库中基于粗糙逼近近似度量的挖掘分类规则策略.首先介绍了数据集中挖掘分类规则的基本原理,并利用粗糙集理论中粗糙逼近近似度量概念,根据决策表条件属性重要性度量及条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,最后举例说明了如何在数据库中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠.  相似文献   

6.
基于增量式遗传算法的粗糙集分类规则挖掘   总被引:8,自引:0,他引:8  
从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性.  相似文献   

7.
应用粗糙集理论的属性约简和规则约简方法对数据进行分类,并以可靠的数据对该方法进行了实验.结果表明,该方法复杂度低,且能有效提高分类效果.  相似文献   

8.
基于粗糙集理论的值约简及规则提取   总被引:4,自引:0,他引:4  
结合粗糙集理论和分类规则支持度的概念,提出以值约简后实例的支持度尽可能大作为约简的目标,并给出一种值约简的算法.通过对实例分析表明,该算法能取得较好的效果.文中还讨论了规则集的性质,改进值约简算法得到一种基于粗糙集的规则挖掘算法.实验结果表明,该算法生成规则能够得到令人满意的分类正确率.  相似文献   

9.
粗糙集理论是一种对不精确、不确定和不完全的数据进行分类分析和知识获取的有效手段而,规则提取是粗糙集理论的主要应用领域之一.通过提出一种针对决策信息系统的属性约简方法,采集了异步电机运转过程的实测数据.讨论了过程控制规则的获取方法.  相似文献   

10.
基于PCA和Rough Set在股票分类中的研究   总被引:1,自引:0,他引:1  
为了提高股票分类的精确度,降低分类的复杂度,结合主成分分析和粗糙集理论对股票数据进行了处理.首先对股票数据进行预处理,然后利用主成分分析降低数据的维数,再利用粗糙集理论对降维后数据进行离散化和约简,并最终得到分类精度和分类规则.试验表明:算法取得了较好的分类精度和较少的分类规则数目,具有一定的可行性.  相似文献   

11.
决策树分类算法研究   总被引:2,自引:0,他引:2  
决策树分类算法是数据挖掘研究中的一个以样本数据集为基础的归纳学习方法,它着眼于从一组无次序、无规则的样本数据集中推理出决策树表示形式的分类规则,提取描述样本数据集的数据模型。讨论了决策树分类算法的基本原理,给出了算法的特性并通过一个实例给出了具体的使用方法。  相似文献   

12.
针对传统文本分类算法的分类精度低和计算复杂度高的问题,提出一种基于加权频繁子图挖掘的图模型文本分类算法。首先将文档集表示成图集;然后运用加权图挖掘算法提取频繁子图;最后,对特征向量进行分类。提出的算法仅提取最重要的子图,使其整体具有较好的分类效果和较高的计算效率。为评估该算法有效性,将其与多种现有分类算法分别对一个数据集进行分类实验,实验结果表明,提出的算法具有更高的识别精度和更少的运行时间。  相似文献   

13.
针对选择Gap Statistic(GS)方法估计聚类数能够得到数据集的粗略分类,但不能进一步对数据集进行细分类这一问题,对GS方法进行改进;将Gap统计量引入到ISODATA算法中,提出了IGS模型;实证表明,IGS模型不仅可以实现数据的细分类,而且通过IGS模型估计数据集的最佳分类数准确率明显高于原GS模型。  相似文献   

14.
针对目标属性识别的特点,建立了基于粗糙集(Rough Sets, RS)的数据分组处理(Group Method of Data Handling, GMDH)神经网络分类模型.该模型较好地解决了采用高维数据集训练神经网络效率低,神经网络结构规模较大的问题.同时为了提高高维数据集合的属性约简效率,改进了集合近似质量属性约简算法.最后,通过与BP(Back-Propagation, BP)神经网络分类能力的仿真对比,结果表明,基于粗糙集的数据分组处理神经网络分类模型分类能力优于BP神经网络模型,满足现代防空作战对目标属性识别的需求,基于快速求核和集合近似质量的属性约简算法快速有效.  相似文献   

15.
一种在微机上实现白细胞自动分类的方法   总被引:1,自引:0,他引:1  
阐述一种用微机实现白细胞自动分类的方法。系统采用二分树分类器实现对6种 白细胞分类。对确定二分树分类器的结构、细胞特征选择和结点分类器等问题作了详 细讨论;提出两种适用于微机系统的特征选择方法——相关分析法和二步选择法;给 出不同情况下系统的分类准确率。结果表明.本文提出的方法在训练集上获得的分类 准确确率达93%,考试集上的分类准确率为86%.  相似文献   

16.
介绍了粗糙集理论实现数据分类和规则推理的基本原理,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不相容规则的决策系统的多层次数据挖掘算法,应用一实际的例子说明如何在数据库中发现分类规则.  相似文献   

17.
数据分类的方法直接影响着分类效果。用粗糙集理论中的区分矩阵和区分函数进行的属性约简可以很好地用于数据分类当中,基于此,提出一种数据分类方法,即用区分矩阵和区分函数约简掉信息系统中的冗余属性,得到必要的属性集;然后再约简掉每一条规则中的冗余属性值,提取出决策规则,最后按照决策规则进行分类。实验证明,用该方法实现的数据分类复杂馋低,且能有效提高分类效果。  相似文献   

18.
基于LSI和Rough集的文本分类研究   总被引:2,自引:0,他引:2  
针对传统的基于VSM的文本分类算法未能考虑到VSM中各特征向量间相互影响关系,构成VSM的词条集合并不能完全、准确地反映文本的内容,分类精度不是很理想的问题,提出了一种基于LSI和Rough集的文本分类方法.在构造VSM的过程中引入了LSI理论,将语义关系体现在VSM中,从而减少了向量空间的维数,然后再运用粗糙集理论中规则推理方法,建立文本分类的规则库,对于任意一个未知文本,只需要将其条件属性与规则库中的规则进行相似匹配,即可完成分类.实验表明,该方法在文本分类的精度和效率方面比传统的基于VSM的文本分类方法均有10%以上的提高.  相似文献   

19.
针对数据挖掘中的文本分类问题,提出了一种基于遗传算法和信息熵的文本分类规则抽取算法Genet-ic-Miner(简称GM),该算法的目标是在数据集中发现分类规则。首先利用信息熵生成初始种群,然后利用优化的遗传算法抽取相应规则。采用六个标准的公共领域的数据集比较了GM与其它两个非常著名的同类算法Ant-Miner和CN2,实验结果表明,无论是预测准确性和规则的简单性,GM都明显优于Ant-Miner和CN2,并且该算法能大大提高对知识的理解力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号