首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 953 毫秒
1.
模糊粗糙集是对传统粗糙集的推广,用于处理模糊的数据.将模糊决策信息系统中以划分刻画的决策属性推广到以覆盖刻画.通过利用特征函数将模糊决策信息系统中的以覆盖刻画的决策转化为由0和1组成的形式背景,从而给出多决策模糊信息系统的定义,并且研究了在此框架下属性约简问题.提出了保持正域不变的约简方法,构造了相应的辨识矩阵,并给出了相关判定定理,同时举例子说明了该属性约简方法的合理性和有效性.  相似文献   

2.
多粒度认知能力是人类分析复杂数据的一种常用策略。作为复杂数据类型之一的多源数据,因其数据源头多而使得数据分析变得复杂。受多粒度思想的启发,以多源信息系统为数据基础,基于悲观的决策策略,提出了多源划分约简集的定义。讨论了多源划分约简集与划分约简集之间的关系,并给出了相应的属性特征的判别方法。最后,针对多源决策信息系统,基于乐观的决策策略,提出了多源决策规则。借鉴多粒度模型,从一个新角度所提出的多源数据分析方式进一步丰富了知识获取的方法。  相似文献   

3.
随着形式背景中数据的增多,概念数量会急剧增加。基于决策形式背景的属性约简在保持决策规则分类能力不变的前提下,寻找极小属性子集,使得决策规则得以简化。文章首先将规则分为强规则与弱规则,提出非冗余规则的判定定理及规则约简的判定定理并予以证明;其次提出规则约简及规则输出算法,具体做法是:生成非冗余规则,然后对非冗余规则进行约简,保留规则中相对必要属性的最简形式,删除规则中的不必要属性;随后讨论了算法的时间复杂度。通过实例分析,对比了其他属性约简算法的运行效率和分类能力,证明本文提出的算法具有可行性和正确性。  相似文献   

4.
由于噪声、预测能力等因素的影响,实际问题中遇到的决策形式背景大多是不协调的.因为形式背景中不协调性的存在使得人们挖据有用的信息变得更加复杂和困难,而属性约简可以使决策形式背景的知识表示更为简洁,隐藏的知识更加清晰,因此研究不协调决策形式背景的属性约简具有重要的意义.针对不协调决策形式背景研究了对象定向概念格的属性约简的定义和方法.首先,利用对象幂集上的等价关系定义了对象定向概念格的两种属性约简:分布约简和最大分布约简.分布约简集保持每个对象子集在每个决策等价类的隶属程度不变,而最大分布约简集保持每个对象子集的最大决策等价类不变.其次,讨论了分布协调集和最大分布协调集之间的关系.最后,定义了分布辨识矩阵和最大分布辨识矩阵,给出了分布约简集和最大分布约简集的判定定理,提出了计算分布约简集和最大分布约简集的方法.  相似文献   

5.
多源数据的知识发现是大数据分析领域的重要研究问题。借助剩余格理论研究多源形式背景的融合形式背景中概念的粒结构。针对多源同域形式背景融合成的L模糊形式背景,刻画了融合形式背景中的可变阈值概念与单源形式背景中的概念之间的关系;给出了融合形式背景的粒约简计算方法并讨论了融合形式背景的粒约简与单源形式背景的粒约简之间的关系。  相似文献   

6.
互补决策约简是一种多标记数据属性约简方法,当数据规模较大时,其启发式算法的计算耗时较大。基于粗糙集理论,对互补决策约简启发式算法的加速算法进行了研究。当粒度由粗变细时,在逐步去掉正域的数据集上,首先研究互补决策约简中属性外部重要度的保序性质;基于此,通过逐步缩小数据规模来降低计算约简的耗时,提出了互补决策约简加速算法。加速算法不仅减少了属性约简的计算时间,而且能够保持原始算法的约简结果。  相似文献   

7.
构造形式背景、协调决策形式背景和不协调决策形式背景的统一模型,并提出不同形式背景的概念格的属性约简的定义和方法.首先,定义对象幂集上的一种等价关系,并利用该等价关系给出属性定向概念格的协调近似表示空间的概念.其次,针对不同形式背景构造相应地协调近似表示空间.特别地,构造不协调决策形式背景的四类协调近似表示空间,分别为分布协调近似表示空间、最大分布协调近似表示空间、下协调近似表示空间和上协调近似表示空间.最后,给出协调近似表示空间的属性约简的定义,并利用可辨识矩阵给出属性约简集的判定定理.分析表明,形式背景和决策形式背景(包括协调的和不协调的)都可看作是协调近似表示空间的特殊形式,且形式背景的属性约简恰好对应协调近似表示空间的属性约简.因此,协调近似表示空间的属性约简方法可以在一定程度上降低由形式背景的复杂性带来的概念格的属性约简的复杂性.  相似文献   

8.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

9.
研究不完备形式背景的属性约简问题。通过比较对象间属性值的一致性, 定义了对象集上的一个相似关系, 进而定义了基于相似关系的粗糙近似算子, 利用目标集的粗糙集近似, 可以提取语义明确的决策规则。基于不完备形式背景中相似关系给出一种属性约简的概念, 研究了属性约简的判定定理, 给出了三类属性的特征刻画。 最后, 利用对象间的辨识属性, 给出了一种属性约简的方法, 并举例说明了方法的可行性。  相似文献   

10.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

11.
随着网络技术和存储技术的迅速发展,各行业形成了大量多源数据,为企业提供了良好的发展机遇.由于这些数据随着时间的变化而变化,如何快速更新这些数据的属性约简是目前计算机科学研究领域中备受关注的热点之一.首先介绍多源数据相关矩阵的基础知识,根据多源数据的相关理论知识设计多源数据非增量矩阵约简算法.另外,当多源数据的属性和对象...  相似文献   

12.
目的在形式概念分析理论框架下,研究区间值形式背景的属性约简。方法给出区间值属性集差别矩阵和区间值形式背景属性约简的定义,并研究相关性质;研究协调区间值属性集的判定定理。结果给出协调区间值属性集的判定定理,以及基于区间值属性集差别矩阵的区间值形式背景约简方法。结论区间值形式背景可进行属性约简。  相似文献   

13.
由于数据自身的不确定性和观测条件有限,现实问题中许多数据以区间值形式呈现。其中,优势关系下的区间值信息表研究对于多属性决策问题有重要意义。目前针对该系统的属性约简方法主要是辨识矩阵法或基于互信息的增量式约简,但前者计算效率较低,而后者没有利用到决策信息。文章探讨了条件熵作为不确定性度量在该系统下的性质,通过比较不同属性缺失时信息系统的条件熵变化,引入了属性重要度概念,基于此提出启发式属性约简算法。最后,通过对比实验验证了本算法具有低冗余的特点,在约简率上比基于粗糙熵和正域不变等序信息系统的启发式约简。  相似文献   

14.
针对AE-概念格, 在属性三支协调下, 提出了保持非冗余规则信息不丢失的属性约简理论。 首先讨论了子背景下的相关性质, 其次定义了属性三支协调决策形式背景中的非冗余规则协调集, 并获得了该协调集的判定定理, 最后给出利用差别矩阵和差别函数得到相应约简的方法。  相似文献   

15.
为研究无明确特征模式的煤尘颗粒图像特性,以某煤矿煤样为研究对象,按国标标准运用粉尘采样器对粉尘溢散源处颗粒物进行多点采样。采用多决策属性约简模糊粗糙集3个阶段即提出隶属度模型、实现属性约简、确定最大信息熵阈值分割对颗粒形态特征机理进行分析。首先建立粉尘图像各像素点对应的模糊类别隶属度模型,利用多分段函数确定隶属度;分析煤粉尘图像灰度特征并将其作为条件属性,确定条件属性的模糊依赖度,获取最优值并提取模糊属性约简,进行目标及背景区域的模糊下近似和模糊上近似划分;最后建立煤粉尘颗粒的信息熵模型,存储信息熵并实现对分割阈值的提取。结果表明:依据模糊属性约简的互异重要度可实现多属性约简;并确定煤粉尘图像模块区域的最大信息熵分割阈值。所建立模型可删除冗余属性,选择出对分类更为重要的属性,并通过属性约简完成特征选择分类。  相似文献   

16.
面对生活中数据信息量大的问题,常使用粗糙集对数据进行知识约简,消除数据中冗余的部分。但大多数研究没有考虑约简后对原有分类的影响;常使用的朴素贝叶斯算法又难以获得其先验概率。基于上述问题,本文提出了一种基于粗糙集的贝叶斯分类算法:首先利用粗糙集中决策属性和条件属性之间的依赖关系,进行属性约简,消除冗余的数据,然后通过贝叶斯算法对约简后的数据进行知识挖掘,最后通过对故障源数据的对比分析。该方法既避开了朴素贝叶斯算法对先验概率的要求,又使得数据分类和预测能力有了明显提升。  相似文献   

17.
文根据一种基于粗糙集理论的数据挖掘方法,以市场调查数据为研究对象,通过适当的约简算法,得出简化的决策集,分析私家车潜在消费者群体特征。提出了一种启发式的约简算法,在属性约简之前,首先定义了一种条件属性分类能力强度,根据各属性分类能力强度对决策表进行排序,然后采用逐行扫描的方法逐条判断属性是否为不必要属性,解决了属性约简可能出现多个约简结果需要靠人为选取满意结果的问题。  相似文献   

18.
为有效处理不一致决策的数据, 通过定义决策正域的概念, 提出了基于优势关系的一般决策信息系统的属性约简方法, 并对约简性质进行了分析。最后通过实例说明了属性约简方法的有效性。  相似文献   

19.
属性约简是粗糙集理论的重要研究内容之一,主要是用于去除高维数据的冗余信息.利用图论求约简是覆盖决策信息系统属性约简的一个新方法,其将覆盖决策系统的约简等价于超图的极小顶点覆盖.本研究提出一种新的覆盖决策信息系统的属性约简算法,该算法采用三步策略:首先确定覆盖决策信息系统的辨识集,然后得到超图的关联矩阵,最后用贪心法求出...  相似文献   

20.
考虑多标准分类问题,即条件属性具有偏好关系而决策属性是无序的类别,通过在条件属性上引入优势关系而决策属性仍然用等价关系来描述不同的属性.针对这类信息系统,本文提出了一种基于样例对的矩阵约简算法.区别于传统的基于辨识矩阵约简方法,该算法在不计算辨识矩阵的前提下,通过选择样例对,来找到辨识矩阵中对约简有用的属性,因此,所提算法能够明显改善计算约简的时间耗费.进一步,为了处理较大规模的数据,提出了一种近似约简算法,该算法按属性重要性添加属性到约简中,进一步缩短了求取约简的时间.最后在UCI数据集上进行大量的实验与传统的约简算法进行了对比,表明了所提出算法的可行性与有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号