共查询到19条相似文献,搜索用时 62 毫秒
1.
《聊城大学学报(自然科学版)》2016,(3):105-110
代价敏感属性选择在数据挖掘和机器学习中起着关键性作用,代价敏感属性选择问题是经典属性选择问题的自然扩展,已成为越来越多学者的研究热点之一.首先给出多代价下代价敏感属性选择问题的数学模型,然后介绍现有的有代表性的四种代价敏感属性选择算法,最后在四个UCI数据集上进行实验,对四种代价敏感属性选择算法的效果和效率进行比较分析. 相似文献
2.
代价敏感学习是数据挖掘和机器学习领域的重要课题.已有的研究方法多数针对单目标进行优化,并不适用于多目标代价敏感问题的解决.因此通过分析基于粗糙集领域的单目标代价敏感属性约简问题,定义了多目标代价敏感属性约简问题,并设计了一种简单高效的算法.在4个UCI数据集上的实验结果表明,该算法能获得令人满意的帕累托最优解集,以辅助用户进行方案的选择. 相似文献
3.
属性约简是粗糙集理论中的重要问题.为了满足用户对属性的偏好,人们研究了属性序下的属性约简,然而对一些问题却很难给出完整的属性序.针对该问题,比较分析了属性组序下的约简子集的优劣,并提出代价敏感下的属性组序约简的算法.该算法通过属性组序的特点考虑用户偏好并结合属性代价以及属性重要度加权的方式选择局部属性,可以得到更符合用户偏好的约简.理论分析和实验结果验证了该算法的可行性和有效性,并且能在一般情形下找到满足用户偏好的约简. 相似文献
4.
大数据背景下,数据量呈指数级增长,三支决策在处理代价敏感问题时动态机制和稳定性不足.针对这个问题,结合F-粗糙集处理动态数据方面的优势,在代价敏感决策表簇中提出基于F-粗糙集和三支决策的平均代价敏感并行约简.首先,从平均决策代价和平均测试代价的角度,定义基于F-粗糙集和三支决策的并行约简;其次,设计基于F-粗糙集和三支决策的平均代价敏感并行约简算法.与基于分类的最小代价约简和基于类特定的最小代价约简比较,实验结果显示,基于F-粗糙集和三支决策的平均代价敏感并行约简可以更好地权衡误分类代价(决策代价)和测试代价,提高分类准确率.研究结果为研究动态决策和代价敏感提供一种新的研究方法和思路. 相似文献
5.
传统属性约简的目标是在决策表中的所有条件属性中,选择一组分类代价最小的约简,算法构建了测试代价最小的约简.以往的测试代价约简算法查找成功率不够理想,性能不稳定,提出了一种改进的测试代价约简算法.通过运行2个UCI数据集实验,证明算法是有效的,并为提高测试代价约简算法性能提供了新途径. 相似文献
6.
信息系统中粒计算模型及其属性约简方法 总被引:1,自引:0,他引:1
粒计算是一种基于问题概念空间划分的新的智能计算理论和方法,目前在国际上逐步得到了人工智能有关研究人员的重视。模糊粒度模型、粗糙集粒度模型、邻域系统下的粒计算模型、商空间模型、相容粒度空间模型是目前几种常用的粒计算模型。基于粗糙集理论的粒度模型,通过决策信息系统的粒子空间中各粒子的推理,给出了决策信息系统中核属性计算方法;在此基础上,提出了决策信息系统属性约简的计算方法;通过实例验证了该方法的有效性。 相似文献
7.
基于二进制粒与粒计算的属性约简 总被引:1,自引:0,他引:1
目前有关粒计算的理论与方法主要有商空间理论、词计算理论和粗糙集理论.以粗糙集理论发展的粒计算理论为基础,定义了幂图、粒度幂图及二进制粒等概念,提出基于二进制粒计算与粒度幂图的两种属性约简算法,把属性约简问题转化为在粒度幂图中的搜索问题,为属性约简开辟了新的途径.理论分析表明,所提出的算法是有效可行的. 相似文献
8.
9.
目前有关粒计算的理论与方法主要有商空间理论、词计算理论和粗糙集理论。以粗糙集理论发展的粒计算理论为基础,定义了幂图、粒度幂图及二进制粒等概念,提出基于二进制粒计算与粒度幂图的两种属性约简算法,把属性约简问题转化为在粒度幂图中的搜索问题,为属性约简开辟了新的途径。理论分析表明,所提出的算法是有效可行的。 相似文献
10.
11.
海量数据属性约简的研究是数据挖掘研究中的一个难点.已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理.结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法.利用该算法可以快速得到海量数据的属性约简结果.仿真实验结果说明了该算法的高效性. 相似文献
12.
海量数据属性约简的研究是数据挖掘研究中的一个难点。已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理。结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法。利用该算法可以快速得到海量数据的属性约简结果。仿真实验结果说明了该算法的高效性。 相似文献
13.
属性约简是粗糙集理论中一个核心研究问题,在对粗糙集中属性约简相关理论研究的基础上,提出了一种新的基于属性重要性和依赖性相结合的GENRED_GROWTH属性约简算法.并通过CUI机器学习数据集测试实验,验证了该算法的有效性. 相似文献
14.
为获取高效算法,结合Rough集和粒计算理论,基于知识颗粒设计出获取等价类的算法及计算正区域的等价算法,使用动态SQL语句直接获取已排序的对象集,省略类似算法必需的排序算法,降低了实现的复杂度.给出一种增量式的属性约简算法,设计5种选择属性的新启发策略供算法使用,可避免无用属性入选,更有效去除可省属性及缩减搜索窄间等,确保约简算法的完备性,简化了中间步骤,从而保证算法的高效性.理论分析及实验结果表明:采用该约简算法的时间复杂度和实际求解时间均比采用现有算法的时间复杂度和实际求解时间低,并能更好地适应海量数据集的挖掘. 相似文献
15.
基于可辨识矩阵的属性频率约简算法 总被引:12,自引:0,他引:12
阐述了粗糙集理论的基本概念,知识约简是粗糙集理论研究的核心内容之一,将可辨识矩阵中出现次数多少作为属性重要性的判断依据.算法求取的是所有约简结果中的某一个或某一些f当某两个条件属性出现频率相同时)结果,当信息系统的复杂程度较高时,其求解的复杂度大大小于原来的约简方法. 相似文献
16.
一种基于属性依赖的属性约简算法 总被引:1,自引:0,他引:1
针对现有属性约简算法存在的问题,利用信息论和粗糙集理论,提出了基于属性依赖的属性约简算法,该算法不用求核.首先利用单个条件属性与决策属性的依赖度来选择条件属性,取与决策属性依赖度大的属性,计算完毕后,将得到的条件属性两两之间进行依赖度计算,删除冗余属性,最后得到条件属性的约简.理论分析及实验结果表明该算法具有较好的约简效果及更高的运行效率. 相似文献
17.
利用覆盖粗糙集研究信息系统的属性约简.首先,回顾了覆盖粗糙集的基础知识,然后提出了相关类的概念以及几个相关定理,并且逐步阐述如何用相关类的方法来进行属性约简,最后用例子证明了此方法的可行性,并得出结论. 相似文献
18.
基于关系积的属性约简算法 总被引:1,自引:0,他引:1
粗糙集的属性约简是一个NP难问题,目前尚无高效的算法.基于集合理论,提出了关系积概念和基于关系积的属性约简算法,把决策表的属性约简过程转化为关系积的运算,减小了对决策表的扫描次数,提高了属性约简的效率;算法采用自底向上和宽度优先的搜索策略,可确保找到最小属性约简集.结合实例,给出了算法的具体实现. 相似文献
19.
指出了不相容决策表中存在的正域扩展方法的不足,基于决策表局部最小确定性与条件属性对决策的最小确定性程度,构建了一种改进的扩展正域方法。基于改进的扩展正域方法,提出了计算不相容决策表中认知属性核和认知属性约简的算法。实验结果表明了本文方法的有效性。 相似文献