共查询到20条相似文献,搜索用时 12 毫秒
1.
《漳州师范学院学报》2018,(4)
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性. 相似文献
2.
为了更快速地得到属性约简结果,对现有F2HARNRS算法的正域计算进行了改进。采取保留策略,利用矩阵保留样本间的度量计算值的平方,使得增维后的度量计算量减少,并据此提出了一种快速属性约简算法。最后通过多个UCI数据集验证了该算法,实验结果表明该算法是有效的、可行的。 相似文献
3.
在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阁值设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简.实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能. 相似文献
4.
基于模糊粗糙集的一种属性约简算法 总被引:1,自引:0,他引:1
Sun Ruying 《科技信息》2007,(35)
将粗糙集理论与模糊集理论相结合,提出了一种基于模糊粗糙集的属性约简算法。该方法引入了模糊C均值聚类算法用以连续属性的模糊化;并通过聚类有效性分析来确定最佳分类数目;克服了目前属性模糊化方法需要人为规定划分类数,几乎不考虑信息系统的具体属性值等缺点。实例验证了此方法的有效性。 相似文献
5.
一种改进的粗糙集属性约简启发式算法 总被引:43,自引:0,他引:43
提出了一种改进的属性约简启发式算法 ,讨论了启发式信息的构造 .通过两个反例证明了现有的两种属性重要度定义 (基于属性依赖度的定义和基于信息熵的定义 )的不完备性 ,提出了一种加权平均的属性重要度定义 ;在此基础上构造了两种启发式算法 .通过 UCI机器学习数据库中的几个实例验证了此算法的有效性 相似文献
6.
陈贞 《漳州师范学院学报》2008,21(1):46-51
介绍模糊粗糙集约简算法,利用模糊区分矩阵产生最小约简.通过分析,说明了算法的不足,提出相应的改进策略.将启发性知识结合区分矩阵,提出了基于属性特征权值的启发式约简算法,文中算法意义更加直观,计算也更加简单,提高了约简算法的速度.采用VC进行实验,通过对多个UCI数据集进行测试,结果说明了改进算法的有效性. 相似文献
7.
云计算技术是海量数据挖掘的一种高效解决方案,将MapReduce并行计算模型与粗糙集属性约简算法相结合,提出一种基于MapReduce的浓缩布尔矩阵并行属性约简算法.该算法提高了粗糙集属性约简算法对大数据的处理能力和效率,并能适应云计算环境.实验结果表明,所提算法具有良好的效率、加速比和可扩展性. 相似文献
8.
一种基于条件熵的粗糙集属性约简算法 总被引:1,自引:0,他引:1
粗糙集(Rough set)理论是一个新的数据挖掘方法,其主要思想是保持分类能力不变的情况下,通过属性约简,达到发掘知识并简化知识的目的。本文在理解和分析基于粗糙集理论的数据挖掘算法基础上针对属性约简提出了一个基于条件熵的启发式算法。 相似文献
9.
杨常清 《西北大学学报(自然科学版)》2012,(2):223-225,235
目的针对不完备信息系统寻找处理方法。方法利用粗糙集扩充模型限制容差关系,取代经典粗糙集理论中的不可分辨关系,对不完备信息进行处理。结果理论上证明了算法的完备性,并使用UCI机器学习数据库对属性约简算法进行测试。结论所述的属性约简算法,不仅可以处理不完备信息,而且在效率上有所提高。 相似文献
10.
《贵州大学学报(自然科学版)》2017,(4)
利用邻域粗糙集处理数值型数据,可以解决经典粗糙集不能直接处理数值型数据的问题,改进后的变精度邻域粗糙集可以增强抗噪声的能力。但变精度邻域粗糙集的属性约简有不同于邻域粗糙集的特性,需要考虑每个决策类的下近似分布。文中提出可以遵循平均错误率来约简属性,减少计算规模。实验证明,使用UCI数据集与其它算法进行了比较,该算法可以获得理想的结果。 相似文献
11.
《南京师大学报(自然科学版)》2015,(1)
属性约简是粗糙集理论的核心内容之一,在信息系统的对象信息不断出现增删等更新操作的环境下,如何进行快速有效的属性约简则是一个亟需解决的迫切问题.提出一种面向增删操作的属性约简更新算法,面向更新前后的决策表,首先分析了对象信息动态增加与删除情况下信息熵的变化机制以及约简属性对新增或删除对象的区分情况,然后提出基于区分情况的新条件熵值的计算方法,最后给出基于散列表的属性约简更新算法.实验结果证明,本文方法可以快速求解出增删更新后的属性约简结果,其性能较传统方法有较大优势. 相似文献
12.
粗糙集理论是一种有效的属性约简方法,但不能直接处理实值数据。针对此问题,本文首先介绍了邻域和覆盖的概念,在此基础上构造了覆盖自约简和覆盖间约简(属性约简)算法;然后通过讨论邻域内各样本之间关系,提出了相斥元的定义,相斥元的存在可能导致决策正域计算错误,从而得到不符合数据表实际情况的属性依赖性,因此给出了分解相斥元的方法;最后在四个实值的基因表达数据库上进行了实验,结果表明该属性约简算法是有效的,并相对于现有其他算法具有较高的分类精度。 相似文献
13.
张国荣 《太原师范学院学报(自然科学版)》2013,(4):91-93
在决策表中求取知识时可以进行属性约简,而属性约简中大部分算法都需计算核.文章基于现有的属性约简算法,提出了改进的约简算法.该算法不需要求核,从而节约了时间与空间,使粗糙集在面对大数据时能更好的处理. 相似文献
14.
将单个属性按照B精度的均值和方差决定的属性重要性,从大到小依次加入到约简属性中.对重要性相等的属性,再计算划分的B精度来决定加入哪些属性,直到满足约简条件为止.与不用属性重要性的算法相比,计算量较少,提高了计算速度. 相似文献
15.
利用单属性的逼近精度 ,在Jelonek属性约简算法的基础上 ,得到一个改进的属性约简算法 .实例计算结果表明 ,在获得同样的属性约简的情况下 ,该算法与Jelonek算法相比 ,计算量较少 ,提高了计算速度 . 相似文献
16.
基于粗糙集的属性约简算法研究 总被引:19,自引:1,他引:19
提出一种新的基于粗糙集的属性约简算法.该算法采用层次结构和近似精度的概念,约简集中的属性选择从空集开始,用启发函数ξ作为选择条件属性的衡量标准,逐步加入相对于决策而言重要的条件属性,并采用下近似值作为剪枝依据,逐步删除给定论域U中根据该属性子集能完全正确分类的对象,减小了属性约简过程中的搜索空间,处理过程是递归的,直到给定论域U为空集,保证了在分类精度不变的情况下,获得简化的属性集,最后运用粗糙集中正域的概念,约简冗余的属性值并求出其最简规则.对UCI机器学习数据库中7个数据库属性约简结果证明了该算法的正确性和可行性. 相似文献
17.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高. 相似文献
18.
一种快速属性约简算法 总被引:5,自引:1,他引:5
基于差别矩阵的属性约简算法,先要求出差别矩阵,随着问题的规模增大,存放差别矩阵的空间和算法的执行时间过大和过长,让计算机难以承受.针对这一问题,提出了差别对象对集的定义,给出了基于差别对象对的属性约简定义,并证明了该定义等价于基于差别矩阵的属性约简定义.利用差别对象对,设计了一个新的属性约简算法.由于这一算法在求属性约简的过程中不用生成差别矩阵和大量的无用元素,因而大大减少了存储量和计算量,从而提高了算法的效率.计算实例说明了新算法的高效性. 相似文献
19.
属性约简的一种贪心算法 总被引:2,自引:0,他引:2
属性约简是粗糙集理论研究的关键问题之一 ,现已证明寻找一个决策表的最优约简是 NP- hard问题 .首先在粗糙集理论的基础上 ,给出决策表中属性重要性的两种度量 ,并以此为启发式信息 ,提出了一种基于粗糙集的属性约简贪心算法 ;最后 ,实验结果表明 ,该算法在大多数情况下能有效地获得决策表的最优约简 . 相似文献
20.
一种基于属性依赖的属性约简算法 总被引:1,自引:0,他引:1
针对现有属性约简算法存在的问题,利用信息论和粗糙集理论,提出了基于属性依赖的属性约简算法,该算法不用求核.首先利用单个条件属性与决策属性的依赖度来选择条件属性,取与决策属性依赖度大的属性,计算完毕后,将得到的条件属性两两之间进行依赖度计算,删除冗余属性,最后得到条件属性的约简.理论分析及实验结果表明该算法具有较好的约简效果及更高的运行效率. 相似文献