首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 106 毫秒
1.
一种基于粗糙集的文本分类规则抽取方法   总被引:10,自引:0,他引:10  
随着文本数据库的日益增大,寻找新的文本数据处理方法变得十分紧迫。本文将粗糙集理论应用于文本自动分类的规则提取,提出了基于粗糙集理论的文本分类方法。把文本特征项的权值进行离散化处理后,作为规则的条件属性,文本所属的类别用作决策属性,构造决策表,然后通过决策表的知识约简算法提取出文本的分类规则。实验结果表明,该方法提取规则的分类正确率较高,分类速度较快。  相似文献   

2.
粗糙集理论中决策表属性约简的信息表示   总被引:5,自引:2,他引:5  
主要讨论了决策表属性约简和信息熵之间的关系,证明了对于一致决策表,其属性约简在代数表示和该文给出的信息表示下是等价的,并举例说明,对于不一致决策表,其属性的约简不能用信息熵来等价表示。  相似文献   

3.
粗糙集理论中约简是一个重要的研究课题,它包括属性约简和属性值约简两方面内容。针对目前属性值约简只能实现约简,而不能计算各个规则的出现次数的问题,结合关联规则和粗糙集两方面的优点,对冗余规则和不一致规则进行处理,获得具有实际意义的约简表。实验证明,此算法是有效的。  相似文献   

4.
在决策表中求取知识时可以进行属性约简,而属性约简中大部分算法都需计算核.文章基于现有的属性约简算法,提出了改进的约简算法.该算法不需要求核,从而节约了时间与空间,使粗糙集在面对大数据时能更好的处理.  相似文献   

5.
基于属性约简的方法,放弃以往复杂的规则匹配算法,提出将约简后的多种属性组进行析取,筛选特征项,并构造分类器.实验结果表明,此算法不仅简单,还能降低维数和提高分类结果.  相似文献   

6.
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。  相似文献   

7.
胡国定教授基于“概念的内涵与外延的反比例关系律”这种思想,给出了一种信息度量方法。本文以粗糙集理论为基础,利用胡教授提出的这种信息度量,讨论了决策表属性约简和信息量之间的关系,证明了对于相容决策表,其属性约简在代数表示和此种方法给出的信息表示下的等价性。并举例说明对于不相容决策表,其属性约简不能用信息量来等价表示。  相似文献   

8.
一种基于粗糙集理论的设备故障诊断方法   总被引:2,自引:0,他引:2  
粗糙集理论是一种处理模糊和不确定知识的数学工具。本文根据粗糙集理论,对设备的振动故障诊断决策表进行属性约简,以提取故障识别的重要属性,降低决策表的冗余性。分析表明,粗糙集理论应用于故障诊断可得到更清晰、简明的诊断规则。  相似文献   

9.
粗糙集的知识获取及其应用   总被引:5,自引:0,他引:5  
提出了一种基于粗糙集的知识理论模型,运用这一模型对决策表进行属性约简,去除其中不必要的属性,揭示出条件属性中的冗余性,最后得出了属性约简的结果以及决策规则。给出了一个简单的例子来说明如何建立和应用这种知识理论模型。  相似文献   

10.
模糊粗糙集的知识约简是模糊粗糙集理论的核心内容之一,从增量式的数据、海量数据或动态数据中挖掘出人们感兴趣的知识,是数据挖掘研究的一个重点,也是一个难点.首先,给出模糊粗糙集的属性重要度的定义及属性约简的定义;其次,从F-粗糙集及并行约简出发,并结合模糊粗糙集的属性重要度,提出了F-模糊粗糙集及其约简,为增量式或动态模糊决策表的属性约简提供了一种有效的方法;最后,通过实例验证了F-模糊粗糙集及其约简的可行性.  相似文献   

11.
粗糙集在决策系统中的应用   总被引:9,自引:1,他引:9  
介绍了粗糙集理论实现数据分类和规则推理的基本原理,对关系数据库中的二维决策表提出了一个问题解决模型,并在同时满足支持度和可信度的基础上对规则进行筛选,提高了决策的准确性和合理性。  相似文献   

12.
粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具。在数据挖掘技术中KNN算法是一个实现简单和分类准确性较高的方法,但是,当用于样本容量较大以及特征属性较多的类似医疗图像挖掘这样的领域时,其效率受到了很大的影响,找到一个删除最大冗余属性的方法成了解决这个问题的关键。将粗糙集理论与KNN算法结合起来,用粗糙集方法进行属性约简,有效地解决了KNN算法分类的这个缺点。  相似文献   

13.
阐述了粗集理论的基本思想,给出了一个基于粗集的知识发现系统模型,并通过实例说明了这一模型的有效性。  相似文献   

14.
基于粗糙集理论的电力系统故障诊断   总被引:1,自引:0,他引:1  
段玉波  阮万江 《科学技术与工程》2007,7(18):4717-47194737
鉴于粗糙集理论具有在处理不精确问题时,不需要提供待求解问题所需处理的数据集合之外的任何先验信息的特点,运用粗糙集方法把保护和断路器的信号作为对故障分类的条件属性集,并考虑了各种可能发生的故障情况,以此建立决策表。然后实现决策表的自动化简和约简。搜索决策表的约简形式,区分关键信号和非关键信号,从故障样本集中导出诊断规则,从而达到在不完备信息下快速准确地进行故障诊断的目的;揭示了这种方法的有效性。  相似文献   

15.
粗糙集理论中决策表属性约简的信息量表示   总被引:2,自引:0,他引:2  
主要讨论了决策表属性约简和信息量之间的关系,证明了对于一致决策表,其属性约简在代数表示和信息论中信息量表示下是等价的.并举例说明,对于不一致决策表,其属性的约简不能用信息量来等价表示.  相似文献   

16.
根据粗糙集理论,提出一种基于决策表相容性的属性约简算法。对一幅经典的天气观测状况决策表进行属性约简,把表示观测状况的各参数作为决策表的属性,运用粗糙集理论对该原始决策表进行约简,以提取天气状况的重要属性,删除分析过程中的冗余属性和属性值,约简后的属性可为决策提供支持。分析表明,粗糙集理论应用于这类决策可得到更清晰、简明的判断规则。  相似文献   

17.
苟和平 《科学技术与工程》2012,12(20):4926-4929
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一,在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。本文提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。  相似文献   

18.
基于粗糙集的Web日志挖掘研究   总被引:1,自引:1,他引:0  
提出了一种基于粗糙集的Web日志挖掘模型,该模型采用粗糙集的方法对原始数据进行约简,然后应用粗糙集理论对数据进行定性分析和约简.最后结合一个Web日志实例验证了方法的可行性和有效性.  相似文献   

19.
电子邮件给人们带来极大便利的同时,垃圾邮件的日益泛滥,也给人们带来了极大的不便和危害。本文使用基于粗集最优属性约简方法对邮件集进行特征维数压缩,在不影响条件属性分类能力的情况下,利用粗糙集约简化简决策表,得到一个规则,利用规则可以对新加入的邮件进行自动分类,试验结果表明该方法是行之有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号