共查询到20条相似文献,搜索用时 0 毫秒
1.
一种基于条件熵的粗糙集属性约简算法 总被引:1,自引:0,他引:1
粗糙集(Rough set)理论是一个新的数据挖掘方法,其主要思想是保持分类能力不变的情况下,通过属性约简,达到发掘知识并简化知识的目的。本文在理解和分析基于粗糙集理论的数据挖掘算法基础上针对属性约简提出了一个基于条件熵的启发式算法。 相似文献
2.
信息系统的粒度熵及基于粒度熵的属性约简算法 总被引:1,自引:1,他引:1
针对完备信息系统中,知识随着知识中属性的逐渐增加或减少从而对论域产生不同粗细的划分进行研究,给出了一个新的度量--粒度熵,以度量知识随着属性的逐渐增加或减少对论域产生不同粗细划分时的分辨能力,并基于粒度熵设计了对信息系统进行属性约简的算法. 相似文献
3.
由于数据自身的不确定性和观测条件有限,现实问题中许多数据以区间值形式呈现。其中,优势关系下的区间值信息表研究对于多属性决策问题有重要意义。目前针对该系统的属性约简方法主要是辨识矩阵法或基于互信息的增量式约简,但前者计算效率较低,而后者没有利用到决策信息。文章探讨了条件熵作为不确定性度量在该系统下的性质,通过比较不同属性缺失时信息系统的条件熵变化,引入了属性重要度概念,基于此提出启发式属性约简算法。最后,通过对比实验验证了本算法具有低冗余的特点,在约简率上比基于粗糙熵和正域不变等序信息系统的启发式约简。 相似文献
4.
针对区间值信息系统,文章提出了一种基于双参数相容关系的属性约简方法.该方法是对传统变精度相容关系粗糙集模型的一种扩充,可使模型在实际应用中更加灵活,鲁棒性更强,通过实例对该方法进行了说明. 相似文献
5.
粗糙集理论是一种有效的属性约简方法,但不能直接处理实值数据。针对此问题,本文首先介绍了邻域和覆盖的概念,在此基础上构造了覆盖自约简和覆盖间约简(属性约简)算法;然后通过讨论邻域内各样本之间关系,提出了相斥元的定义,相斥元的存在可能导致决策正域计算错误,从而得到不符合数据表实际情况的属性依赖性,因此给出了分解相斥元的方法;最后在四个实值的基因表达数据库上进行了实验,结果表明该属性约简算法是有效的,并相对于现有其他算法具有较高的分类精度。 相似文献
6.
分析了近似质量在提取非确定性规则方面的不足,并基于粗糙熵的预测成功度概念,结合时序数据特点,提出一种属性约简及规则提取策略.该策略在对时序数据进行属性约简时,采用粗糙熵与时间距离相结合的方法,使得最终得到的约简在时序方面是较优的,最后使用UCI数据库进行仿真实验,效果良好.该策略在工程领域处理时序数据方面有一定的应用价值. 相似文献
7.
区间值信息系统是单值信息系统的一种扩充,如何对其进行属性约简是区间值多属性决策中的一个重要的问题.在已有的优势关系基础上,定义了α-β优势关系,得到基于新的优势关系的可辨识矩阵,进而对区间值信息系统进行属性约简,给出了约简算法.最后通过一个算例验证了新方法的可行性,并与已有方法进行了比较,结果表明所提出的方法更为简单有效. 相似文献
8.
区间值信息系统是单值信息系统的一种扩充,如何对其进行属性约简是区间值多属性决策中的一个重要的问题.在已有的优势关系基础上,定义了α-β优势关系,得到基于新的优势关系的可辨识矩阵,进而对区间值信息系统进行属性约简,给出了约简算法.最后通过一个算例验证了新方法的可行性,并与已有方法进行了比较,结果表明所提出的方法更为简单有效. 相似文献
9.
基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行. 相似文献
10.
基于粗集的不完备信息系统属性约简 总被引:21,自引:0,他引:21
属性约简是粗集理论研究的核心内容之一。经典粗集理论是建立在完备信息基础之上的,然而在现实中,不完备信息系统的广泛存在极大地限制了粗集理论向实用化迈进。该文基于相容关系,将分布约简、最大分布约筒、分配约简引入不完备信息系统,提出了一种新的约简——分配序约简,并讨论了几种约简之间的关系。给出了分配约简的一种启发式算法:条件信息量约简算法,分析了该算法的时间复杂度。经实验检验,该算法是有效的。 相似文献
11.
一种基于属性重要性的属性约简启发式算法 总被引:2,自引:0,他引:2
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约简算法.该算法以核属性集为初始约简集合,以新的属性重要性度量准则为启发信息,通过逐步加入相对于决策而言重要的条件属性来求取最小约简.实例分析表明该算法是有效的. 相似文献
12.
高效的属性约简算法是粗糙集理论应用于知识发现的基础,要在令人可接受的时间内获得约简的通常做法是基于启发式的约简方法。本文提出了决策表中决策属性集相对条件属性集的条件信息量的概念,同时用知识的条件信息量定义了属性的重要性,在此基础上,提出了一种新的基于信息量的属性约简算法,该算法的时间复杂度为(O|C|3|U|2),通过实例分析,表明该算法是有效的。 相似文献
13.
结合高压输电线路远程监测系统,在参考粗糙集理论的基础上,结合粗糙熵相关知识,针对复杂系统故障影响因子的特点,提出了一种属性约简算法,最后得出相应的算法规则,解决了复杂信息数据简化的问题。实例证明,该算法是可行的。 相似文献
14.
研究基于随机决策信息系统的属性约简算法,发现现有文献存在着运算量大、找到的不是约简或仅找到核的缺陷,本文提出了一种属性约减递归算法。该算法能够计算所有约简和核,而且算法时间复杂度少,运算效率高。经实例验证,该算法有很强的可行性和有效性。 相似文献
15.
给出基于信息熵的属性约简的矩阵表示,由此设计一个新的基于信息熵的属性约简算法,并用实例验证算法的可行性.该算法比较直观,容易理解,而且所占用的辅助空间少. 相似文献
16.
将粗糙集模型扩展后应用于属性值为集合值的不完备信息系统,并由属性值集合间的关系导出集值不完备信息系统下的半半序关系,提出基于这种二元关系的可辨识属性矩阵构造方法,研究了集值不完备信息系统的属性约简方法,并给出属性约简判定定理,从而为不完备信息系统的处理提供了一种新的思路和方法. 相似文献
17.
从粒度计算的观点出发,给出了信息系统中知识距离的定义,指出利用知识距离可以度量信息系统中知识的粗糙性,分析了其相关性质.提出了一种基于知识距离的启发式属性约简算法,算法不需求核,对无核的特殊信息系统计算约简更加有效. 相似文献
18.
基于关系矩阵的信息系统属性约简算法 总被引:1,自引:0,他引:1
提出了信息系统属性约简的一种新算法,从关系矩阵角度定义了属性重要度及非核属性次要度,然后以属性重要度指标作为启发式信息,辅以属性次要度,设计了一种简洁、有效的属性约简算法.该算法具有较大的灵活性,能从搜索空间逐次删除重要度为零及次要度低的属性,避免对这些属性进行重复搜索,提高了搜索的效率,最后通过实例验证了算法的可行性与有效性. 相似文献
19.
基于粗糙集属性约简的模糊模式识别 总被引:3,自引:1,他引:3
通过运用粗糙集归约理论对资料进行浓缩和筛选,略去不必要的属性,简化数据。用模糊模式识别确定对象应当归属的模式,给出其对于各个模式的相对隶属度,从而达到分类目的。经实例计算,得到了较好的结果。 相似文献
20.
为有效处理不一致决策的数据, 通过定义决策正域的概念, 提出了基于优势关系的一般决策信息系统的属性约简方法, 并对约简性质进行了分析。最后通过实例说明了属性约简方法的有效性。 相似文献