共查询到17条相似文献,搜索用时 76 毫秒
1.
基于粗糙集的多标签文本分类算法 总被引:1,自引:1,他引:0
将粗糙集优越的约简理论应用于多标签文本分类,提出了基于粗糙集理论的多标签文本分类算法,该算法利用训练阶段得到的各个类别的分类规则与测试实例逐一匹配,得出实例的类标签集合,扩展了粗糙集理论在文本分类中的应用,实验证明算法有效可行. 相似文献
2.
粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具。在数据挖掘技术中KNN算法是一个实现简单和分类准确性较高的方法,但是,当用于样本容量较大以及特征属性较多的类似医疗图像挖掘这样的领域时,其效率受到了很大的影响,找到一个删除最大冗余属性的方法成了解决这个问题的关键。将粗糙集理论与KNN算法结合起来,用粗糙集方法进行属性约简,有效地解决了KNN算法分类的这个缺点。 相似文献
3.
一种基于粗糙集理论的启发式分类规则挖掘算法 总被引:1,自引:0,他引:1
粗糙集理论是一种新的数据挖掘算法,文章以属性依赖重要性作为启发信息提出了一种新的属性约简算法,且加入了一定的分类正确度。最后通过一个实例完整演示了本方法,证实其有效性。 相似文献
4.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。 相似文献
5.
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一,在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。本文提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。 相似文献
6.
基于增量式遗传算法的粗糙集分类规则挖掘 总被引:8,自引:0,他引:8
从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性. 相似文献
7.
介绍了属性约简的概念,并用模糊语义距离矩阵解决了含有模糊数据的相互依赖的数据库的信息分类问题。 相似文献
8.
9.
机动车的自动分类和识别在交通管理等部门中具有重要的意义。其实机动车分类是一种模式分类,而模式分类是模式识别和人工智能研究最基本也是最重要的课题之一。 相似文献
10.
《华中科技大学学报(自然科学版)》2016,(1):36-40
针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度. 相似文献
11.
孙兴波 《四川理工学院学报(自然科学版)》2001,14(1):42-44
提出了基于粗集理论的一种图像识别系统。该系统包括图像预处理、特征提取、决策表生成、条件属性简化等。运用粗集方法,能有效地压缩图像特征数目从而大大提高运行速度 相似文献
12.
用粗糙集进行数据挖掘是近年来被采用的一种新的有效方法 ,本文针对传统粗糙集分类方法过于严格 ,对噪音过分敏感的缺点 ,提出了改进的粗糙集挖掘模式及相应面向属性的约简算法和实现步骤 相似文献
13.
从经典的概率粗糙集推广模型出发,参照Bayes因子,研究了一种Bayes粗糙集模型,该模型不受先验概率的影响,从而减小了决策失误的风险. 相似文献
14.
在A.Skowron关于属性值约简研究的基础上,给出截断点集的逻辑抽取方法,并基于复杂度的考虑提出一种改进的启发式算法,使属性的值集规模有实质性的约简. 相似文献
15.
16.
认为数据量的巨大和高维、用户交互与先验知识的利用等等是知识发现领域面临的问题和难点 .粗糙集理论是一种具有模糊边界的集合理论 ,它作为研究知识发现的新型工具 ,能严格地处理不精确数据的分类问题 ,被广泛应用于不相容决策表中的规则提取过程中 .针对粗糙集理论中属性约减和属性值约减这两个重要问题进行了研究 ,并介绍了数据集中挖掘分类规则的基本原理 ,同时利用 RS理论中核和核值的概念 ,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系并简化决策系统的数据挖掘算法 ,并应用一简单的例子说明如何在数据库中发现分类规则 ,实验结果表明此算法可以大大提高系统潜在知识的清晰度 相似文献
17.
基于贝叶斯粗糙集的文本特征选择方法 总被引:3,自引:1,他引:2
特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频,然后简单分析了经典粗糙集和变精度粗糙集的不足,紧接着把贝叶斯粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频结合起来,提出了一个综合的特征选择方法.该综合方法首先利用基于最小词频的文档频提取初始特征,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法是有效的. 相似文献