首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 710 毫秒
1.
多源数据的知识发现是当今大数据时代所面临的重要课题,但在形式概念分析领域的相关研究并不多。基于此,首先提出了多源决策形式背景的概念。进而,研究了多源决策形式背景的属性约简,讨论了其与单源决策形式背景属性约简间的关系。最后,提出了多源决策形式背景的规则获取方法。  相似文献   

2.
多粒度认知能力是人类分析复杂数据的一种常用策略。作为复杂数据类型之一的多源数据,因其数据源头多而使得数据分析变得复杂。受多粒度思想的启发,以多源信息系统为数据基础,基于悲观的决策策略,提出了多源划分约简集的定义。讨论了多源划分约简集与划分约简集之间的关系,并给出了相应的属性特征的判别方法。最后,针对多源决策信息系统,基于乐观的决策策略,提出了多源决策规则。借鉴多粒度模型,从一个新角度所提出的多源数据分析方式进一步丰富了知识获取的方法。  相似文献   

3.
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性.  相似文献   

4.
针对现有不完备决策表属性约简算法复杂度较高的问题,提出了基于属性分辨度的属性约简算法.文中分析了不完备决策表中条件属性相对于决策重要性的外在表现,提出了属性分辨度的概念,并给出了属性分辨度随着约简属性集的变化而动态更新的计算方法.该算法在属性约简过程中会不断删除已经属于正域的对象或不影响正域计算的相容块,通过降低样本数据的规模来减少计算耗时,加速属性约简.理论分析和仿真实验表明,文中算法是有效的,并且算法复杂度优于现有的不完备决策表属性约简算法.  相似文献   

5.
海量数据属性约简的研究是数据挖掘研究中的一个难点.已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理.结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法.利用该算法可以快速得到海量数据的属性约简结果.仿真实验结果说明了该算法的高效性.  相似文献   

6.
属性约简是粗糙集理论研究的重要内容之一.在传统Pawlak粗糙集模型中,随着属性数量的单调变化,下、上近似集也单调变化.然而,在决策粗糙集模型中,随着属性的单调增加,下、上近似集有可能增加也有可能减少.针对这一问题,从优化角度给出了决策单调准则、一般性准则和代价准则的适应性函数并通过遗传算法求得三种准则下的约简.实验结果表明:决策单调准则约简获得了更多的正域规则;一般性准则约简获取了最多的正域规则;代价准则约简获得了最小的决策代价.  相似文献   

7.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

8.
考虑多标准分类问题,即条件属性具有偏好关系而决策属性是无序的类别,通过在条件属性上引入优势关系而决策属性仍然用等价关系来描述不同的属性.针对这类信息系统,本文提出了一种基于样例对的矩阵约简算法.区别于传统的基于辨识矩阵约简方法,该算法在不计算辨识矩阵的前提下,通过选择样例对,来找到辨识矩阵中对约简有用的属性,因此,所提算法能够明显改善计算约简的时间耗费.进一步,为了处理较大规模的数据,提出了一种近似约简算法,该算法按属性重要性添加属性到约简中,进一步缩短了求取约简的时间.最后在UCI数据集上进行大量的实验与传统的约简算法进行了对比,表明了所提出算法的可行性与有效性.  相似文献   

9.
为了找到数值型数据集的多个最小属性约简,设计了一个人工蜂群决策表约简算法。通过对每次迭代过程中采集到的最小属性约简进行保留,算法能得到多个最小属性约简。实验结果证明了该算法的可行性和可靠性。  相似文献   

10.
面对生活中数据信息量大的问题,常使用粗糙集对数据进行知识约简,消除数据中冗余的部分。但大多数研究没有考虑约简后对原有分类的影响;常使用的朴素贝叶斯算法又难以获得其先验概率。基于上述问题,本文提出了一种基于粗糙集的贝叶斯分类算法:首先利用粗糙集中决策属性和条件属性之间的依赖关系,进行属性约简,消除冗余的数据,然后通过贝叶斯算法对约简后的数据进行知识挖掘,最后通过对故障源数据的对比分析。该方法既避开了朴素贝叶斯算法对先验概率的要求,又使得数据分类和预测能力有了明显提升。  相似文献   

11.
为解决属性约简的诸多问题,比如基于信息熵的属性约简方法偏向多值属性的缺点,而基于属性相似度的属性约简方法偏向少值属性的不足,现提出一种将信息熵和属性相似度结合起来的新的启发式属性约简方法.实验结果表明,避免了上述两种属性约简算法的偏向性.  相似文献   

12.
互补决策约简是一种多标记数据属性约简方法,当数据规模较大时,其启发式算法的计算耗时较大。基于粗糙集理论,对互补决策约简启发式算法的加速算法进行了研究。当粒度由粗变细时,在逐步去掉正域的数据集上,首先研究互补决策约简中属性外部重要度的保序性质;基于此,通过逐步缩小数据规模来降低计算约简的耗时,提出了互补决策约简加速算法。加速算法不仅减少了属性约简的计算时间,而且能够保持原始算法的约简结果。  相似文献   

13.
模糊信息系统上的粗糙约简   总被引:3,自引:0,他引:3  
:基于粗糙集理论和模糊等价关系,提出了模糊信息系统(FISs)在不同粒度划分上的知识约简方法和属性重要性度量.这些约简利用了2个水平划分参数(或对象相似度)α、β,其中相对约简与属性重要性度量采用了决策类的水平集正区域公式.利用水平集粗糙成员函数得到分布约简与分配约简方法,它们扩展了Pawlak信息系统(PISs)上的属性约简方法,解决了FISs上的知识获取与特征选择问题.同时,基于不同粒度下的等价类,给出了FISs上可辨识属性矩阵、分布约简和分配约简的辨识公式,克服了经典方法在FISs上的不适用性.示例结果表明,在不同粒度空间上,这些约简方法产生了与全部属性具有最大程度分辨能力和规则置信度的属性子集.  相似文献   

14.
属性约简是粗糙集理论的研究重点之一.现有的各种粗糙集约简几乎都是保持某种约简准则不变,用这种方法处理一些存在异常点的数据时,在泛化能力方面存在一定的问题.针对此类问题,提出了一种可变正区域的约简方法,该方法在进行属性约简时允许正区域存在一定程度的变化.理论分析和示例表明了该方法的有效性.  相似文献   

15.
属性约简是粗糙集理论中一个核心研究问题,在对粗糙集中属性约简相关理论研究的基础上,提出了一种新的基于属性重要性和依赖性相结合的GENRED_GROWTH属性约简算法.并通过CUI机器学习数据集测试实验,验证了该算法的有效性.  相似文献   

16.
由于数据自身的不确定性和观测条件有限,现实问题中许多数据以区间值形式呈现。其中,优势关系下的区间值信息表研究对于多属性决策问题有重要意义。目前针对该系统的属性约简方法主要是辨识矩阵法或基于互信息的增量式约简,但前者计算效率较低,而后者没有利用到决策信息。文章探讨了条件熵作为不确定性度量在该系统下的性质,通过比较不同属性缺失时信息系统的条件熵变化,引入了属性重要度概念,基于此提出启发式属性约简算法。最后,通过对比实验验证了本算法具有低冗余的特点,在约简率上比基于粗糙熵和正域不变等序信息系统的启发式约简。  相似文献   

17.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

18.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

19.
在数据挖掘和机器学习的过程中,分类器的主要任务是提高数据分类的精确度和降低数据分类的费用开销,本文针对传统分类器只考虑了如何提高数据分类的精确度而没有考虑到如何降低数据分类的开销缺陷,提出了一种基于属性开销约束的矩阵属性约简算法,定义了一种新的函数作为属性约简的启发信息,探讨了基于矩阵方法计算等价关系矩阵的增量更新机制.该算法缩短了粗糙集属性约简的计算时间,保证了属性约简的实时性,并通过实例进一步验证了所提出方法的有效性和正确性.  相似文献   

20.
基于优化GA属性约简的上证指数预测   总被引:1,自引:0,他引:1  
结合粗糙集的相关理论,优化了GA属性约简方法,针对上证指数预测的具体问题,对遗传算法的初始种群和适应度函数进行改进,将上证指数10年间数据的58个属性构成的训练集进行属性约简,并应用参数优化后的SVM分别以属性约简前后的数据集对开盘指数进行回归预测.仿真结果表明,用该算法进行属性约简后,原始数据集中冗余属性对预测结果的...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号