首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
大型的数据库和数据仓库中的数据往往是有噪声和不一致的,应用经典的粗糙集理论对其进行数据挖掘处理时,效果不够理想.引入信息颗粒的概念,给出了属性子集引导的信息颗粒的构造方法及基于信息颗粒的知识描述,并应用粗糙集的扩展模型讨论知识的粗糙度问题,提出了基于粗糙信息颗粒的属性约简算法,该算法在给定最小置信度阈值的情况下,可实现对不一致数据集的简洁知识提取.图1,表2,参8.  相似文献   

2.
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。  相似文献   

3.
针对权重粗糙集模型不能有效处理非平衡混合数据的问题,对权重论域上的各种类型变量进行分析并建立统一的模糊等价关系,提出混合数据上的权重模糊粗糙集模型,并利用该模型构造出带权模糊等价空间上的混合属性约简算法.混合属性约简算法产生的模糊软划分可以克服权重论域上离散硬划分产生的信息损失.在非平衡混合数据集上进行的实验结果表明,与基于权重粗糙集的算法相比,基于权重模糊粗糙集模型的属性约简算法的平均分类精度提高了11.9%.  相似文献   

4.
变精度粗糙集下基于信息熵的属性约简算法   总被引:5,自引:0,他引:5  
本文针对在Z.Pawlak粗糙集下进行属性约简中存在的问题,在对变精度粗糙集理论下卢下近似约简概念分析的基础上,引入了信息熵,建立了变精度粗糙集意义下的决策表中属性重要性的度量方式,区分了β阈值界定下的“弱不一致信息”与“强不一致信息”的不确定程度,从而刻画了标准粗糙集下正域之外的不一致信息的不确定程度,以该度量作为启发式信息,提出了基于信息熵的β下近似约简的启发式算法.这为不一致信息系统的属性约简提供了理论依据与算法.  相似文献   

5.
基于蚁群算法和粗糙集的信息融合教学评价   总被引:1,自引:0,他引:1  
单目标教学评价结果的不确定性较大,为此提出基于蚁群算法和粗糙集的信息融合教学评价方法.该方法首先利用粗糙集算法处理多项评价指标决策融合问题,在解决多项评价指标决策融合问题时采用蚁群算法对融合问题中的参数进行优化,然后对多源信息利用粗糙集方法进行融合实验结果证明:本方法更加有效,利用本方法的评教结果更加公正、合理.  相似文献   

6.
针对多数聚类算法只能单独处理数值特征数据或类属特征数据,而不能分析具有两种混合属性数据的问题,基于熵和信息粒度提出了粗糙集理论框架下不同粒度划分上的聚类算法.该算法利用相似关系,通过计算每个数据点的熵并选取具有最小熵值的数据点作为聚类中心,将与该聚类中心相似度大于阈值卢的所有数据点聚集形成数字颗粒结构.在整个聚类过程中无需调整每个数据点的熵值,缩短了计算时间,同时利用粗糙集的不可分辨关系形成字符颗粒结构,通过不断调整、合并这两种颗粒结构,实现了具有混合属性特征数据的聚类分析.实验结果比较表明,该算法是有效、可行的,当卢取值为0.8时,算法的聚类有效性最大值可达0.96,该值较同条件下的其他聚类算法要高。  相似文献   

7.
属性约简的一种贪心算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的关键问题之一 ,现已证明寻找一个决策表的最优约简是 NP- hard问题 .首先在粗糙集理论的基础上 ,给出决策表中属性重要性的两种度量 ,并以此为启发式信息 ,提出了一种基于粗糙集的属性约简贪心算法 ;最后 ,实验结果表明 ,该算法在大多数情况下能有效地获得决策表的最优约简 .  相似文献   

8.
针对目前基于粗糙集模型的特征选择算法无法直接应用于数值型数据、必须经过离散化过程而造成决策信息丢失的问题,提出了一种基于邻域决策分辨率的特征选择算法。该算法根据邻域信息粒中决策分布与其分类能力间的关系,提出了邻域决策确定性(Nc)来衡量单个信息粒的决策分辨能力;并根据特征向量空间上所有信息粒所具有的Nc累加值,定义了邻域决策分辨率作为特征子集上决策可分辨性的量度,从而将名义型和数值型数据统一在同一特征选择算法框架下。仿真实验和实际应用的结果表明,该算法性能优于目前主流基于邻域粗糙集的特征选择方法。  相似文献   

9.
结合关联规则与粗糙集的思想, 提出了基于偏好信息的决策规则约简算法, 并将该算法应用于长春市历年的道路交通事故数据分析中, 从而找出交通事故发生的潜在规律.  相似文献   

10.
基于二进制的粗糙集基本运算研究   总被引:1,自引:0,他引:1       下载免费PDF全文
通过讨论二进制与粗糙集之间的内在联系,提出基于二进制的粗糙集运算理论,并借助二进制的位运算操作,给出粗糙集的上近似集和下近似集、等价类的交、集合的基数的运算算法.该算法比传统的粗糙集运算算法的运算速度更快,效率更高.该算法为扩展粗糙集的应用提供了理论基础.  相似文献   

11.
相容关系的改进及其属性约简   总被引:1,自引:0,他引:1  
针对经典粗糙集理论处理不完备信息系统存在的局限性,作者从扩展粗糙集理论的适用范围出发,引入不完备信息系统对象的先验概率并结合量化相容关系的思想,提出了改进的相容关系模型.以该模型为基础研究了不完备信息系统的属性约简.通过严格的数学证明,给出了属性约简算法.该算法以空集为起点求取系统的约简,不需要计算核,节约了时间,减少了占用空间,简化了求解过程.通过实例验证该改进相容关系模型及其属性约简算法.  相似文献   

12.
在分析大肠早癌荧光数据属性约简方法的基础上,提出一种基于容错关系信息熵的粗糙主成分属性约简方法.该方法首先针对数据的不完整特性,建立容错关系粗糙集模型.然后,引入随信息量减小而单调下降的信息熵,建立基于信息熵的容错关系粗糙集模型,并进行初步数据属性处理.最后,结合主成分分析方法,形成基于容错关系信息熵的粗糙主成分分析方法,在进行数据降维处理的同时提取数据特征.以大肠早癌荧光光谱为实验数据的分析处理结果表明,该方法可以有效地降低荧光光谱数据的处理维数,提取影响医疗诊断的特征数据,减少后续数据处理的复杂度.  相似文献   

13.
一种基于粗集的信息排序新算法   总被引:1,自引:1,他引:0  
对有序信息表的排序问题进行了研究,在将有序信息表进行转化的基础上,应用粗集理论对信息表进行简化,通过将属性值标准化并构造排序度量函数,提出了一种基于粗集的总体排序算法,与传统算法相比,该算法不需要领域专家的参与,而且有效地降低了时间复杂度.  相似文献   

14.
许韦 《科学技术与工程》2013,13(9):2517-2522
在不完备信息系统中基于相似关系,引入了可变精度和多粒度粗糙集,进而提出一种基于相似关系的变精度多粒度粗糙集模型。研究了基于相似关系的变精度多粒度粗糙集的相关性质和关系。随后讨论了基于相似关系变精度多粒度粗糙集的约简问题,提出了一种基于属性重要度的启发式分布约简算法,实例分析的结果验证了该方法的可行性。  相似文献   

15.
针对k等价度容差关系,提出了一种基于k等价度容差关系的变精度粗糙集模型,该模型是变精度粗糙集模型在不完备信息系统中的拓展.在此基础上,定义了变精度粗糙集模型约简的概念,讨论了一种刻画属性重要性的新指标,提出了一种启发式约简算法.该算法能从搜索空间中不断地添加重要的属性,并且删除不重要的属性,从而降低了约简的时间复杂度.最后,通过实例说明该算法的有效性.  相似文献   

16.
特征选择是粗糙集理论在数据挖掘等领域中一种重要的应用,如何对动态变化的信息系统进行增量式特征选择是目前粗糙集理论研究的重点。在不完备混合型信息系统中,属性集的不断增加是信息系统动态变化的一种重要形式。首先在不完备混合型信息系统中引入邻域条件熵的概念,并且利用矩阵的方法去表示邻域条件熵;然后针对属性集动态增加的情形,提出矩阵形式的邻域条件熵增量式更新,并且基于这种增量式更新机制给出了相应的增量式特征选择算法;最后,UCI数据集的实验结果表明,所提出的增量式特征选择算法比非增量式特征选择算法具有更高的特征选择性能。  相似文献   

17.
基于粗糙集理论的多指标综合评价方法   总被引:4,自引:0,他引:4  
针对评价多指标优劣中属性权值难以确定的问题,笔者提出了基于粗糙集的TOPSIS综合评价的应用算法,利用粗糙集进行权重确定,把粗糙集与TOPSIS相结合,提出了基于粗糙集的TOPSIS综合评价方法,以属性重要度作为各个属性的权值,对信息系统进行加权分析,得出了总体排序结果,并通过算例验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号