首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行.  相似文献   

2.
冗余属性过多是影响分类算法运行效率和准确率的重要因素。为了提高分类算法的运行效率和分类准确率,提出一种基于改进邻域粗糙集属性重要度的快速属性约简算法。首先,提出一种改进的KNN属性重要度;其次,利用改进过属性重要度的邻域粗糙集对原始数据的条件属性进行重要度排序,利用排序结果对原始数据进行属性约简,得到约简后的特征子集;最后,将约简后的特征子集输入分类模型进行分类预测。实验仿真结果表明,与改进前的基于邻域粗糙集的属性约简算法相比,所提出的方法具有较高预测精度和较快运行速度。  相似文献   

3.
属性约简是粗糙集理论与方法的研究热点,是一种重要的降维方法.将经典变精度粗糙集模型与优势关系粗糙集模型相结合,定义了优势关系下的β近似集合和β分布协调集的概念,并给出了基于β分布协调集的可辨识属性矩阵定义,提出优势关系下的变精度属性约简方法.通过实例分析,说明了该方法的可行性.  相似文献   

4.
变精度粗糙集下基于信息熵的属性约简算法   总被引:5,自引:0,他引:5  
本文针对在Z.Pawlak粗糙集下进行属性约简中存在的问题,在对变精度粗糙集理论下卢下近似约简概念分析的基础上,引入了信息熵,建立了变精度粗糙集意义下的决策表中属性重要性的度量方式,区分了β阈值界定下的“弱不一致信息”与“强不一致信息”的不确定程度,从而刻画了标准粗糙集下正域之外的不一致信息的不确定程度,以该度量作为启发式信息,提出了基于信息熵的β下近似约简的启发式算法.这为不一致信息系统的属性约简提供了理论依据与算法.  相似文献   

5.
文章为研究脱机手写体汉字识别问题,将汉字样本及其特征向量看作是一个信息系统,采用基于β近似依赖度的属性重要度定义作为启发式信息,设计出在变精度粗糙集模型下的特征属性近似约简算法,对手写体汉字信息系统中冗余特征属性进行约简,构建出脱机手写体汉字识别决策信息系统。识别过程中采用基于加权规则置信度的规则融合方法,进一步提高了脱机手写体汉字的可识别性和正确识别率。实验结果表明,该方法是有效可行的。  相似文献   

6.
邻域粗糙集是经典Pawlak粗糙集的扩展,能够有效的处理数值型数据。因为引入了邻域粒化的概念,使用邻域粗糙集模型计算样本邻域度量属性重要度时,需要不断反复的对负域中的样本进行邻域划分操作,算法计算量很大。为此提出了一种基于Relief算法属性重要度的快速属性约简算法,降低计算邻域的算法时间复杂性。通过和现有算法运用多组UCI标准数据集进行比较,实验结果表明,在不降低分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

7.
在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阁值设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简.实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能.  相似文献   

8.
变精度粗糙集β下近似属性约简   总被引:1,自引:0,他引:1  
从属性集角度研究变精度粗糙集模型的属性约简问题,在对象集上定义了一种β下近似二元关系,并利用这种关系建立了属性集及其幂集上的等价关系,由此产生依赖空间。同时利用定义的二元关系和依赖空间给出了变精度粗糙集的β下近似协调集的判定定理,得到一种保持每个决策类的β下近似不变的属性约简方法。最后通过实例验证方法的有效性。  相似文献   

9.
对于数值型数据而言,邻域粗糙集模型是处理不确定信息的有效工具.现有的邻域粗糙集模型仅关注那些邻域中所有样本都属于同一个决策类的一致性情形,无法利用邻域中与多个决策类相交的边界样本所蕴含的信息.针对邻域粗糙集的这一局限性,将相容关系的极大相容块与邻域粗糙集相结合,选取样本邻域内的最大等价块作为最小的信息粒,通过重新定义邻域粗糙集的上下近似和属性重要度等概念,建立了一种基于极大相容块的邻域粗糙集模型.该模型可在更小的信息粒度下将原来边界样本转化成一致性样本来增大正域.运用前向贪婪策略构建了相应的属性约简算法.在七个公开的UCI数据集上的对比实验验证了提出模型的有效性.  相似文献   

10.
在模糊决策信息系统理论研究的基础上,根据其属性来构造对象空间的模糊分割,用邻域粒化的思想定义了变精度模糊决策信息系统粗糙集模型的上、下近似算子及其约简和核等概念,由此给出了一种基于属性约简的算法,通过实例分析验证算法的有效性。  相似文献   

11.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

12.
粗糙集理论是一种有效的属性约简方法,但不能直接处理实值数据。针对此问题,本文首先介绍了邻域和覆盖的概念,在此基础上构造了覆盖自约简和覆盖间约简(属性约简)算法;然后通过讨论邻域内各样本之间关系,提出了相斥元的定义,相斥元的存在可能导致决策正域计算错误,从而得到不符合数据表实际情况的属性依赖性,因此给出了分解相斥元的方法;最后在四个实值的基因表达数据库上进行了实验,结果表明该属性约简算法是有效的,并相对于现有其他算法具有较高的分类精度。  相似文献   

13.
针对k等价度容差关系,提出了一种基于k等价度容差关系的变精度粗糙集模型,该模型是变精度粗糙集模型在不完备信息系统中的拓展.在此基础上,定义了变精度粗糙集模型约简的概念,讨论了一种刻画属性重要性的新指标,提出了一种启发式约简算法.该算法能从搜索空间中不断地添加重要的属性,并且删除不重要的属性,从而降低了约简的时间复杂度.最后,通过实例说明该算法的有效性.  相似文献   

14.
以直觉模糊信息表为背景,利用粗糙集和模糊集,旨在筛除信息表中冗余的属性,提出获取决策规则的近似约简方法 .首先,通过在直觉模糊集中引入带权重评分函数来定义加权直觉模糊序关系;进一步,为了提高模型分类的容错率,结合变精度粗糙集模型构建加权变精度直觉模糊序决策信息表;接着,在该决策表中提出上、下近似约简的判定定理和可辨识矩阵,进而生成两种求解上、下近似约简的方法;最后,通过具体案例和数值实验分析验证了该方法的有效性.  相似文献   

15.
决策表约简方法的关系   总被引:1,自引:0,他引:1  
讨论决策表的正域约简及基于包含度的约简方法的性质及相互关系,证明了分配协调集是正域协调集,且保持近似分类精度与近似分类质量不变.另外,信息系统的约简问题可以转化为相容决策表的约简.  相似文献   

16.
利用邻域粗糙集处理数值型数据,可以解决经典粗糙集不能直接处理数值型数据的问题,改进后的变精度邻域粗糙集可以增强抗噪声的能力。但变精度邻域粗糙集的属性约简有不同于邻域粗糙集的特性,需要考虑每个决策类的下近似分布。文中提出可以遵循平均错误率来约简属性,减少计算规模。实验证明,使用UCI数据集与其它算法进行了比较,该算法可以获得理想的结果。  相似文献   

17.
经典粗糙集的前向启发式正域约简算法没有考虑到存在多个重要度最大的条件属性时如何合理地去选择候选属性;同时在度量条件属性间相关性时忽略了决策属性的影响程度,由此得到的约简集合泛化能力较弱.针对这些问题,首先引入信息粒度,提出一种候选属性选择的优化策略;其次引入信息论中交互信息的概念,通过计算属性之间的交互信息来剔除冗余属...  相似文献   

18.
基于变精度粗糙集的产品配置规则提取及增量式更新   总被引:1,自引:0,他引:1  
针对传统粗糙集产品配置规则提取方法容噪性较差的问题,应用变精度粗糙集方法,依据产品设计实例数据建立配置决策表,通过设定分类精度,进行了基于决策类下近似的相对属性约简和基于核值属性的值约简,依据支持度获得有效的产品配置规则.考虑设计实例增加对规则提取的影响,采用增量式更新方法对新增决策表进行规则提取,处理新增配置规则与原配置规则之间的重复、包含和冲突关系,依据可信度进行配置规则的更新.以水平定向钻机配置规则提取为例,验证了所提方法的可行性和有效性.  相似文献   

19.
正确分类率β是变精度粗糙集模型中重要的参数之一.针对变精度粗糙集中β参数的确定缺乏可预见性的问题,提出了在确定近似分类质量γ下β取值范围的确定方法.首先在选取特定β值的情况下,根据约简条件求取所有β约简;然后在近似分类质量保持不变的前提下,确定β参数的取值范围;最后通过一个算例验证了该方法的有效性.  相似文献   

20.
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号