首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
传统邻域粗糙集需指定半径或通过搜索方式找出适用于问题求解的半径,这在数据预处理过程中会带来极大的时间消耗.而粒球粗糙集方法则能够依据数据分布,自适应地生成合适的粒结构.以粒球的纯度为度量准则,粒球粗糙集方法亦为属性约简问题的研究引入新的思路.利用前向贪心搜索求解约简时,需尝试计算每一个候选属性被加入约简池后所引起的粒球...  相似文献   

2.
文中提出一种离散和连续混合属性的复杂信息系统增量式属性约简算法.首先,将粒计算模型中的知识粒度在混合型信息系统下进行推广,提出了邻域知识粒度,并构造出基于邻域知识粒度的非增量式属性约简算法,然后在混合型信息系统下研究了邻域知识粒度随对象增加时的增量式计算,理论证明了该计算方式的高效性,最后提出了基于邻域知识粒度的混合信息系统增量式属性约简算法.UCI数据集的实验结果表明,所提出的算法在混合型信息系统中具有很高的增量式属性约简性能.  相似文献   

3.
基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行.  相似文献   

4.
前向贪心搜索策略在约简求解的过程中,需要遍历所有的候选属性,从而确保在每轮迭代时能够选择出最优的属性.在属性数量急剧增加时,利用前向贪心搜索进行约简求解会显式地带来较大的时间消耗.鉴于此,在前向贪心搜索的基础上,依据属性约简过程和粒度的变化关系,提出了基于粒度的加速求解约简策略.该策略的核心思想是以粒度大小为标准,剔除...  相似文献   

5.
传统邻域分类器因良好的分类性能在分类问题中得到广泛应用.但数据规模和维度的不断增加,提高了邻域分类器的处理难度.为解决这一问题,该文基于Spark实现邻域决策错误率并行属性约简算法,删除数据中的冗余属性,减少数据间的不确定性.该算法能减少分类过程中数据计算时间,提高分类计算效率.邻域分类器在分类决策过程中采用的多数投票...  相似文献   

6.
提出了一种基于论域离散度的适应度函数,在前向贪心搜索策略下,以该适应度函数评估条件属性的重要性,进而求取邻域粗糙集的约简。该算法与3个比较流行的属性约简算法进行对比实验,在12组UCI数据集上进行验证。实验结果表明,与另外3种算法相比,在不降低分类效果的情况下,本文算法在时间消耗和稳定性上具有较为明显的优势。  相似文献   

7.
冗余属性过多是影响分类算法运行效率和准确率的重要因素。为了提高分类算法的运行效率和分类准确率,提出一种基于改进邻域粗糙集属性重要度的快速属性约简算法。首先,提出一种改进的KNN属性重要度;其次,利用改进过属性重要度的邻域粗糙集对原始数据的条件属性进行重要度排序,利用排序结果对原始数据进行属性约简,得到约简后的特征子集;最后,将约简后的特征子集输入分类模型进行分类预测。实验仿真结果表明,与改进前的基于邻域粗糙集的属性约简算法相比,所提出的方法具有较高预测精度和较快运行速度。  相似文献   

8.
信息系统中粒计算模型及其属性约简方法   总被引:1,自引:0,他引:1  
粒计算是一种基于问题概念空间划分的新的智能计算理论和方法,目前在国际上逐步得到了人工智能有关研究人员的重视。模糊粒度模型、粗糙集粒度模型、邻域系统下的粒计算模型、商空间模型、相容粒度空间模型是目前几种常用的粒计算模型。基于粗糙集理论的粒度模型,通过决策信息系统的粒子空间中各粒子的推理,给出了决策信息系统中核属性计算方法;在此基础上,提出了决策信息系统属性约简的计算方法;通过实例验证了该方法的有效性。  相似文献   

9.
属性约简是数据挖掘、机器学习等研究领域中的一个非常重要的预处理步骤,其效率的高低会直接影响到数据挖掘、机器学习等相关任务的性能。针对目前已有的非增量式属性约简方法在处理不一致邻域信息系统动态变化时无法高效更新属性约简的问题,提出一种在不一致邻域决策信息系统中对象集发生变化时的增量式属性约简方法。首先,该文以不一致邻域决策信息系统为研究对象,结合不一致邻域的特点给出了一种新的不一致度的表示方法。在此基础上用不一致度来表征属性重要度,以属性重要度为启发式信息研究不一致邻域信息系统对象集发生变化条件下邻域类以及不一致度的更新机理。随后,以不一致度为启发信息构建了增量式属性约简算法。进一步,在UCI上选取6个数据集,通过分类精度测试实验精选出各个数据集的最佳邻域半径δ,最后,利用最佳邻域半径δ在各个数据集上执行增量式属性约简算法实验,实验结果表明该文提出的增量式属性约简算法在保持分类精度不变的前提下较其他算法更加快速和有效。  相似文献   

10.
传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率,克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.  相似文献   

11.
邻域粗糙集是经典Pawlak粗糙集的扩展,能够有效的处理数值型数据。因为引入了邻域粒化的概念,使用邻域粗糙集模型计算样本邻域度量属性重要度时,需要不断反复的对负域中的样本进行邻域划分操作,算法计算量很大。为此提出了一种基于Relief算法属性重要度的快速属性约简算法,降低计算邻域的算法时间复杂性。通过和现有算法运用多组UCI标准数据集进行比较,实验结果表明,在不降低分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

12.
为了加快属性降维的速度,提出一种基于模糊粗糙集模型的属性约简搜索策略。首先,从数据的属性层面出发,通过计算不同属性间的相似度,将属性分组,以减少搜索在执行过程中需要遍历的属性个数,进而,利用某高校课程考核管理工作中收集的真实数据,说明了算法在逻辑上的合理性。最后,通过公开数据集上的对比分析实验,验证了算法在性能上的优越性。实例分析和实验结果充分说明,所提算法具有较强的实用性和可操作性,且在不降低分类性能甚至提高分类性能的前提下,展现出显著的时间优势。  相似文献   

13.
在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阁值设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简.实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能.  相似文献   

14.
分辨矩阵为属性约简与求核运算提供了一种规范精确的数学模型,通过分辨矩阵模型可方便地获取决策系统全体属性约简.本文基于分辨矩阵运用启发式信息与二分策略扩展结点,设计了一种构造约简树求取全体属性约简的有效算法,该约简树从根结点到叶结点全体路径构成的析取范式与系统分辨函数等价,其极小析取范式所有析取项即为决策系统全体属性约简.该方法适用于满足任意约简准则的分辨矩阵,能够显著地减少搜索空间和保证全体约简求解的完备性,理论分析与实验结果说明了算法的可行性与有效性.  相似文献   

15.
针对决策属性集合中只存在两个决策集合的情况,为简化决策属性的表达和计算复杂度,提高约简效率,提出一种改进粗糙集决策表的属性约简算法。该算法以条件属性对决策属性的支持度为基础,采用新的约简规则,基于可分辨矩阵的启发式算法,根据属性重要度改进属性约简算法。以高新技术企业智力资本测量指标体系为例,得到了高新技术企业智力资本的最小约简集。结果表明,该约简算法能够得到一个完备的最小约简集,并能显著提高求解约简集的效率。  相似文献   

16.
为提高决策表中最小属性约简的效率、稳定性和鲁棒性,基于云模型在非规范知识定性、定量表示及其相互转换过程中的优良特征对量子进化算法进行算子设计,提出了一种基于量子云模型演化的最小属性约简增强算法(QCMEARE).该算法采用量子基因云对进化种群进行编码,基于约简属性熵权逆向云进行量子旋转门自适应调整,使其在定性知识指导下能够自适应控制属性约简空间搜索范围,并采用量子云变异和云纠缠操作算子较好地避免了在属性演化约简中易陷入局部最优和早熟收敛等问题,使算法快速搜索到全局最优属性约简集.仿真实验表明,提出的最小属性约简增强算法具有收敛速度快、约简精度高和稳定性强等优点.  相似文献   

17.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

18.
针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法。首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决策理论确定经典域、节域和待评物元,通过计算各簇中属性之间的关联度构建指示矩阵,并计算各属性的指示值;最后,根据指示值,从大到小依次选择属性,实现样本集属性约简。实验结果表明,算法运算速度较快,约简后对数据集分类精度影响小,部分数据集分类精度有所提升,验证了算法的有效性。  相似文献   

19.
变精度邻域粗糙集相比于邻域粗糙集具有抗噪容错的能力,但由于重新定义了下近似,正域的划分不再严格,使得属性重要度的可信度降低,在精度改变的情况下无法优先选取最优的属性.针对这一问题,分析变精度邻域粗糙集的下近似,引入邻域内的正确分类率,定义属性质量度,提出一种基于正域的增量和平均正确分类率的增率相结合的属性度量方法.通过和现有的基于属性重要度的属性约简算法做比较,实验结果表明,改进后的属性度量方法对变精度有更好的适应性,在不同变精度阈值下能得到更优的约简结果.  相似文献   

20.
为保证关键属性在属性约简时能够被保留,可对信息系统的属性进行加权,从而提高关键属性的影响力.基于此,在属性加权的模糊序决策信息系统中建立了上、下近似约简的模型,得到两种约简的判定定理,并且给出求解上、下近似约简的辨识矩阵以及约简方法 .最后,通过实例验证了该约简方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号