首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
对基于粗糙集的决策系统,从理论上分析了决策数据细化的程度对规则近似质量、近似分类精度、核属性和信息熵的影响.证明了决策属性的属性值划分越细,则其规则近似质量、近似分类精度和信息熵就越小,并且决策表中决策属性值细化后所得到的核属性集一定包含细化前的核属性集.因此,在对决策属性离散化时,决策数据细化的程度要适宜.研究结果对研究决策表属性的约简、决策规则的形成和有效性等问题具有实际意义.  相似文献   

2.
目前常用的离散算法多为单属性离散化算法.利用该类算法对多维连续属性进行离散化时,逐次对单个属性进行离散化,割裂了多维属性之间的关系.基于此提出了一种基于遗传算法和变精度粗糙集的多属性离散化算法.该算法基于变精度粗糙集所具有的较好数据分类容错和抗噪能力,通过变精度粗糙集近似分类精度建立遗传算法适宜度评价函数,并利用遗传算法在多维连续属性候选断点集上寻找最优断点子集.基于UCI数据集比较了所提算法与多种常用的离散化算法的差异,实验结果表明,该算法可以获得相对较好的离散化效果.  相似文献   

3.
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.  相似文献   

4.
基于包含度的粗糙集模型   总被引:1,自引:0,他引:1  
提出了包含度近似空间的概念,得到了基于包含度的粗糙集模型,从而为知识获取提供了一个新的不确定性方法。  相似文献   

5.
特征选择是粗糙集理论在数据挖掘等领域中一种重要的应用,如何对动态变化的信息系统进行增量式特征选择是目前粗糙集理论研究的重点。在不完备混合型信息系统中,属性集的不断增加是信息系统动态变化的一种重要形式。首先在不完备混合型信息系统中引入邻域条件熵的概念,并且利用矩阵的方法去表示邻域条件熵;然后针对属性集动态增加的情形,提出矩阵形式的邻域条件熵增量式更新,并且基于这种增量式更新机制给出了相应的增量式特征选择算法;最后,UCI数据集的实验结果表明,所提出的增量式特征选择算法比非增量式特征选择算法具有更高的特征选择性能。  相似文献   

6.
连续属性的离散化是粗糙集理论亟待解决的关键问题之一。基于灰色系统和粗糙集的有关理论,提出了 一种新的基于属性重要性的离散化算法。该算法以条件属性对决策属性的灰色关联度来度量条件属性的重要性, 在保证决策表原始分类能力不变的前提下,按照属性重要性由小到大的顺序对每个条件属性的侯选断点进行考 察!将冗余的断点去掉,从而将条件属性离散化。同时给出了该算法的时间复杂度分析,并通过实例分析验证了算 法的有效性和实用性。  相似文献   

7.
针对病理诊断规则获取问题,采用基于粗糙集理论的规则提取方法.首先进行连续属性的离散化,用遗传算法对CAIM(class-attribute interdependence maximum)离散化算法进行改进.然后利用粗糙集理论进行规则提取.采用以核为基础的增量式约简算法,综合考虑属性对约简的增益和属性在剩余属性集中的重要性,给出了衡量属性重要性程度的一个准则.随后进行属性值约简,获取诊断规则.  相似文献   

8.
提出了一种粗糙模糊神经网络分类器的模型。其过程为:利用粗糙集理论获取分类知识,根据训练样本建立决策表,进行决策表属性值离散化、属性约简和分类规则的提取;依据约简后决策表的属性、经模糊化处理的属性值及分类规则构造粗糙模糊神经网络分类器。该分类器可以有效地克服粗糙集规则匹配方法抗噪声能力和规则泛化能力差的缺点;同时可简化神经网络的结构,加快网络的训练速度。并详细介绍了该分类器用于汽车车牌字符识别的步骤和实验结果。  相似文献   

9.
为解决连续属性无法直接用于粗糙集理论中这一问题,将Parzen窗方法和遗传算法相结合,提出了一种全新的属性离散化方法。该方法首先选取较多个断点将连续属性分为较多类,然后结合粗糙集理论的一致性要求和Parzen窗所反映的离散结果稳定性指标定义遗传算法的适值函数。仿真结果表明:使用该方法得到的离散结果能得到较少个断点,并且保持数据原有的分类能力。  相似文献   

10.
提出一种基于分类目标的启发式离散化算法, 通过该算法能够解决粗糙集理论中的连续属性离散化问题. 该算法充分考虑目标分类和属性的重要性, 在减少决策规则的同时完成了属性约简. 通过茶味觉信号的验证及与传统算法结果的比较, 验证了所给算法的有效性.  相似文献   

11.
广义邻域粗集下的集成特征选择及其选择性集成算法   总被引:1,自引:1,他引:0  
针对实际模式识别系统中样本特征常具有的连续值属性、高维性、强相关性和冗余性等影响分类效果的问题,在广义邻域粗集模型下提出一种集成特征选择及其选择性集成算法.该算法先提取样本特征并利用所提出的马氏距离分布熵评估其重要度,再基于特征重要度构建广义邻域粗集模型,并在此模型上以特征重要度为启发式信息设计基于蚁群算法的属性约简算法,然后通过改变广义邻域粗集模型参数的方式获得更多具有更大差异性的基分类器,最后利用主成分分析法对产生的基分类器进行选择性集成.模拟电路故障诊断结果表明,该算法比AdaBoost等算法取得的分类精度至少提高了2.6%.  相似文献   

12.
从理论上研究了决策表中决策值细化程度与信息粒度、近似分类的精度及近似分类质量之间的关系,结果表明,决策属性的属性值划分得越细,则该属性的信息粒度、近似分类精度和近似分类质量的值就越小.仿真实验同时证明,在基于决策属性划分之下,对任意一个条件属性集经决策细化后的决策表所对应的信息粒度、近似分类精度和近似分类质量的值,都不大于决策细化前决策表所对应的信息粒度、近似分类精度和近似分类质量的值,这个结果对研究决策表属性约简和决策规则的有效性等问题都有指导作用.  相似文献   

13.
粗糙集理论是解决分类问题的一种数学方法。在信息系统中,属性值可以是数值,也可以是集合或Fuzzy数,因此都可看成格值信息系统。在有限Boole格上,利用上、下近似定义了粗糙集模型,得到了与Pawlak粗糙集模型类似的一些性质,证明了该模型可以定义为一个完备的Stone代数,这样就把现有的粗糙集模型推广到更一般的情形。  相似文献   

14.
变精度粗糙集下基于信息熵的属性约简算法   总被引:5,自引:0,他引:5  
本文针对在Z.Pawlak粗糙集下进行属性约简中存在的问题,在对变精度粗糙集理论下卢下近似约简概念分析的基础上,引入了信息熵,建立了变精度粗糙集意义下的决策表中属性重要性的度量方式,区分了β阈值界定下的“弱不一致信息”与“强不一致信息”的不确定程度,从而刻画了标准粗糙集下正域之外的不一致信息的不确定程度,以该度量作为启发式信息,提出了基于信息熵的β下近似约简的启发式算法.这为不一致信息系统的属性约简提供了理论依据与算法.  相似文献   

15.
基于粗集理论的数据离散化技术研究   总被引:3,自引:0,他引:3  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义。它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

16.
连续量决策信息表的离散化问题研究   总被引:1,自引:0,他引:1  
在粗糙集理论中,知识是以表格的形式表达的.当用粗糙集算法从连续量决策信息表中提取规则时,首先要对其进行离散化处理.针对连续量决策信息表离散化过程中存在的问题,本文中提出了2个定理并进行了证明.定理表明:在考虑决策信息表中属性值之间不可分关系的条件下,若决策信息表的值发生变化,则离散化结果必然发生变化.所以由单一样本构成的连续量决策信息表所得到的离散化结果不能用于实际的连续量系统中.  相似文献   

17.
基于粗集理论的数据离散化技术研究   总被引:2,自引:0,他引:2  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义,它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

18.
基于粗糙集方法提出了一种系统的决策表约简和决策规则提取方法. 为了避免现有属性离散化方法的不足,使用多元统计中的聚类分析,并借助树形图,R2、半偏相关以及伪F统计量,对连续属性进行离散化处理,得到适合粗糙集方法要求的决策表. 在此基础上,简化了基于可辨识矩阵和逻辑运算的传统属性约简算法,并完善了启发式算法进行属性值约简和决策规则提取. 最后,以应用实例验证了该方法的可行性和有效性.  相似文献   

19.
在网络入侵异常检测中,数据预处理是一个非常重要的步骤,数据预处理的好坏直接影响后续检测的准确性.本文针对基于层次聚类的网络入侵异常检测中两个问题,在数据预处理阶段做出改进,一是属性冗余和属性权重问题,运用粗集理论对各个属性赋予权重并进行属性约减,二是粗集理论中连续数据离散化问题,提出了针对数据特点的自适应离散化算法,该算法是根据样本属性值分布来决定离散间隔,最后针对两个改进方法进行了实验,并与采用现有离散化方法进行了对比,实验结果证明了该算法的有效性和准确性.  相似文献   

20.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号