首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
属性约简是数据挖掘、机器学习等研究领域中的一个非常重要的预处理步骤,其效率的高低会直接影响到数据挖掘、机器学习等相关任务的性能。针对目前已有的非增量式属性约简方法在处理不一致邻域信息系统动态变化时无法高效更新属性约简的问题,提出一种在不一致邻域决策信息系统中对象集发生变化时的增量式属性约简方法。首先,该文以不一致邻域决策信息系统为研究对象,结合不一致邻域的特点给出了一种新的不一致度的表示方法。在此基础上用不一致度来表征属性重要度,以属性重要度为启发式信息研究不一致邻域信息系统对象集发生变化条件下邻域类以及不一致度的更新机理。随后,以不一致度为启发信息构建了增量式属性约简算法。进一步,在UCI上选取6个数据集,通过分类精度测试实验精选出各个数据集的最佳邻域半径δ,最后,利用最佳邻域半径δ在各个数据集上执行增量式属性约简算法实验,实验结果表明该文提出的增量式属性约简算法在保持分类精度不变的前提下较其他算法更加快速和有效。  相似文献   

2.
粗糙集理论在多属性决策、数据挖掘、机器学习、人工智能等领域发挥着越来越大的作用。经典粗糙集理论主要利用不可分辨关系对完备信息系统形成的划分来定义知识的上、下近似集,并在此基础上进行知识约简,规则推理和决策。而现实生活中存在大量不完备信息系统。针对不完备信息系统的多属性决策问题,从非对称相似关系的角度提出基于粗集的多属性决策方法。  相似文献   

3.
基于粗集的不完备信息系统属性约简   总被引:21,自引:0,他引:21  
属性约简是粗集理论研究的核心内容之一。经典粗集理论是建立在完备信息基础之上的,然而在现实中,不完备信息系统的广泛存在极大地限制了粗集理论向实用化迈进。该文基于相容关系,将分布约简、最大分布约筒、分配约简引入不完备信息系统,提出了一种新的约简——分配序约简,并讨论了几种约简之间的关系。给出了分配约简的一种启发式算法:条件信息量约简算法,分析了该算法的时间复杂度。经实验检验,该算法是有效的。  相似文献   

4.
用拓扑学中闭包这个最基本的概念来刻画协调决策信息系统的属性约简和不协调决策信息系统关于上近似的约简。在此基础上,很自然地提出一个二元关系相对于一族二元关系的闭包约简的概念,并且定义一个辨识矩阵来刻画闭包约简,给出闭包协调集的判定定理与约简方法。这些结果是协调信息系统的属性约简和不协调决策信息系统中关于上近似约简理论的自然推广。  相似文献   

5.
讨论了基于分离优势覆盖集的Pythagorean模糊决策信息系统的属性约简问题.首先基于优势关系,在Pythagorean模糊决策信息系统中给出了优势覆盖集、分离优势覆盖集、D-分离优势覆盖集等概念.进而利用分离优势覆盖集、D-分离优势覆盖集对Pythagorean模糊决策信息系统进行约简.最后,将提出的约简算法与其他约简算法进行比较,验证了所提出算法的有效性和优越性.  相似文献   

6.
在不相容信息系统中,代数观点与信息论观点下的属性约简是不等价的.阐述了分布约简与信息论观点下约简的等价性,分析了代数观点下差别矩阵的缺陷,提出了基于分布约简的差别矩阵方法.该方法不仅考虑所比较对象是否不一致,并且深入分析其不一致性的程度及所属条件等价类在决策类中的分布比例,得到信息系统在分布约简概念下的约简.理论分析与仿真实例表明了该算法的可行性和有效性.  相似文献   

7.
为了提高无核或少核序决策信息系统中现有属性约简算法的执行效率,本文以知识粒度表征的属性重要度为启发信息并结合前向属性约简方法提出了一种新的属性约简算法。首先,介绍优势粗糙集方法的相关基础知识,并将经典粗糙集中基于知识粒度的属性约简算法引入优势粗糙集方法中,得到可处理序决策信息系统的属性约简算法;然后,通过分析序决策信息系统中知识粒在属性数目变化条件下的粗化与细化过程,得出相对冗余属性的判断定理,由此结合前向属性约简方法设计了快速属性约简算法;最后分析比较了2种算法的时间复杂度并选取了6个不同的UCI数据集进行算法性能的测试,测试结果表明,本文提出的算法比现有的属性约简算法高效。  相似文献   

8.
为有效处理不一致决策的数据, 通过定义决策正域的概念, 提出了基于优势关系的一般决策信息系统的属性约简方法, 并对约简性质进行了分析。最后通过实例说明了属性约简方法的有效性。  相似文献   

9.
信息系统中,属性约简是知识发现问题的一个研究热点,能达到发掘并简化知识的目的。目前已有很多利用辨识矩阵来进行属性约简的研究,但是当数据维数较大时,算法复杂度往往很大。利用加权欧几里得距离来定义二元关系及辨识矩阵,利用信息系统的约简与生成图的最小顶点覆盖等价的关系,将辨识矩阵求解约简的问题转化为求解生成图中最小顶点覆盖的问题,并给出了Pythagorean模糊信息系统中属性约简的算法;在此基础上,利用基于加权欧几里得距离的相似关系,定义了Pythagorean模糊决策信息系统的辨识矩阵,并给出了用最小顶点覆盖的方法求约简算法,最后利用实例验证了算法的有效性。  相似文献   

10.
李忠  张志远 《甘肃科技》2010,26(24):25-28
由于在现实中,大部分信息系统是不完备的,有可能是不一致的。所以,针对现有属性约简算法的不足,在覆盖粗糙集理论和最大一致块技术的基础上提出了一种新的运用表存储可辨识属性集的不完备决策表的改进约简算法,该算法同时适用于一致决策表和不一致决策表,通过算法可求得决策表属性集的上约简、下约简,实现决策表的属性约简,有效地降低了算法的空间复杂度,提高了算法效率,具有一定的现实指导意义。  相似文献   

11.
不相容决策信息系统属性核的研究   总被引:8,自引:0,他引:8  
决策表属性核的计算往往是基于Rough集理论的决策信息系统约简过程的出发点和关键.不相容决策信息系统是信息系统约简处理研究的重点.本文对不相容决策信息系统属性核的计算问题进行研究,证明了Rough集理论代数观和信息观中属性核概念的包含关系,以及几种属性核计算方法所得到的结果之间的包含关系.  相似文献   

12.
应用粗糙集理论将旋转机械转子的频域信息作为研究对象, 从转子故障实验的频域图表及其相关数据中, 构造符合粗糙集理论要求的决策表, 并对决策表进行约简, 得到旋转机械故障诊断的决策规则, 通过区分矩阵和区分方程寻找决策表的约简和核, 最后优化鳞选出决策表的最小约简形式.  相似文献   

13.
变精度粗糙集下基于信息熵的属性约简算法   总被引:5,自引:0,他引:5  
本文针对在Z.Pawlak粗糙集下进行属性约简中存在的问题,在对变精度粗糙集理论下卢下近似约简概念分析的基础上,引入了信息熵,建立了变精度粗糙集意义下的决策表中属性重要性的度量方式,区分了β阈值界定下的“弱不一致信息”与“强不一致信息”的不确定程度,从而刻画了标准粗糙集下正域之外的不一致信息的不确定程度,以该度量作为启发式信息,提出了基于信息熵的β下近似约简的启发式算法.这为不一致信息系统的属性约简提供了理论依据与算法.  相似文献   

14.
可辨识矩阵是粗集理论中可以标识决策属性和条件属性之间关系的矩阵。根据数据库的动态建立特性,提出了一种基于粗集理论中的可辨识矩阵的动态属性约简算法,利用数据的动态性和可辨识矩阵的特性对己有的属性约简进行修正,并通过实例证明了这种算法的有效性,该算法极大地节省了计算量,提高了算法的执行效率。  相似文献   

15.
根据粗糙集理论,提出一种基于决策表相容性的属性约简算法。对一幅经典的天气观测状况决策表进行属性约简,把表示观测状况的各参数作为决策表的属性,运用粗糙集理论对该原始决策表进行约简,以提取天气状况的重要属性,删除分析过程中的冗余属性和属性值,约简后的属性可为决策提供支持。分析表明,粗糙集理论应用于这类决策可得到更清晰、简明的判断规则。  相似文献   

16.
粗糙集理论的主要思想是在保持分类能力不变的前提下,通过属性约简和值约简,提取决策规则。本文主要是提出了利用隶属度函数进行值约简的同时提取决策规则的算法。利用该算法可在不求得核值表的情况下,直接找到各规则的最小条件属性集,获得决策表的所有决策规则。  相似文献   

17.
互补决策约简是一种多标记数据属性约简方法,当数据规模较大时,其启发式算法的计算耗时较大。基于粗糙集理论,对互补决策约简启发式算法的加速算法进行了研究。当粒度由粗变细时,在逐步去掉正域的数据集上,首先研究互补决策约简中属性外部重要度的保序性质;基于此,通过逐步缩小数据规模来降低计算约简的耗时,提出了互补决策约简加速算法。加速算法不仅减少了属性约简的计算时间,而且能够保持原始算法的约简结果。  相似文献   

18.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

19.
连续属性的离散化是粗糙集理论亟待解决的关键问题之一。基于灰色系统和粗糙集的有关理论,提出了 一种新的基于属性重要性的离散化算法。该算法以条件属性对决策属性的灰色关联度来度量条件属性的重要性, 在保证决策表原始分类能力不变的前提下,按照属性重要性由小到大的顺序对每个条件属性的侯选断点进行考 察!将冗余的断点去掉,从而将条件属性离散化。同时给出了该算法的时间复杂度分析,并通过实例分析验证了算 法的有效性和实用性。  相似文献   

20.
胡国定教授基于“概念的内涵与外延的反比例关系律”这种思想,给出了一种信息度量方法。本文以粗糙集理论为基础,利用胡教授提出的这种信息度量,讨论了决策表属性约简和信息量之间的关系,证明了对于相容决策表,其属性约简在代数表示和此种方法给出的信息表示下的等价性。并举例说明对于不相容决策表,其属性约简不能用信息量来等价表示。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号