共查询到20条相似文献,搜索用时 0 毫秒
1.
属性约简是粗糙集理论进行数据挖掘的基本途径, 相关算法主要基于核。 核的差别矩阵表示及相关求核计算具有重要意义, 但已有的差别矩阵及其求核算法还具有时空局限性。对此, 依据差别矩阵的稀疏性与大规模性, 提出基于决策分类的分块差别矩阵及其求核算法, 直接地将决策分类信息融入形式结构与问题求解。 首先, 基于决策分类来定义分块差别矩阵, 设计其计算算法; 其次, 基于分块差别矩阵, 确定核的内涵与算法; 最后, 进行实例分析与实验验证, 说明所建方法的有效性。基于决策分类的分块差别矩阵有效地实施了信息提取与维度降低, 相关的求核算法较好地减少了差别矩阵求核算法的时空复杂性。 相似文献
2.
在粗糙集理论的各种应用中,属性约简算法具有重要意义,因而对属性约简算法的研究一直是粗糙集理论研究中的重点问题之一.提出了一种基于差别矩阵的属性约简算法.该算法引进栈的概念,利用栈的特点,对文献[1]中算法进行改进,提出了一种求所有约简的算法. 相似文献
3.
影响基于差别矩阵的属性约简算法效率的主要因素有计算U/C等价类和差别矩阵的大小.为了解决差别矩阵大小影响属性约简算法计算效率,分析了基于差别矩阵的属性约简算法中差别矩阵定义的不足,重新定义了一种压缩差别矩阵,删除差别矩阵中大量的空元素和相同元素,从而进一步减少了差别矩阵元素的个数,并设计基于压缩差别矩阵的属性约简算法.对UCI及其他数据库进行仿真,实验结果表明该算法具有高效性. 相似文献
4.
利用差别矩阵计算约简的算法,具有直观、易理解和完备性的特点,但也存在一定缺点,差别矩阵中存在大量冗余元素,这类元素的生成和存储将造成时空上的浪费.文章给出的算法在生成差别矩阵时,判断其元素是否冗余,若是冗余立即约去它,从而提高属性的约简效率.实例表明,该算法是正确和有效的。 相似文献
5.
决策表是粗集理论的处理对象,其核属性的计算往往是决策信息约简过程的出发点和关键.大多数决策表的求核方法是基于差别矩阵的,具有较高的时间复杂度和空间复杂度.基于区分表,提出一种效率更高的计算核属性的算法,并验证了算法的正确性. 相似文献
6.
基于修正差别矩阵的高效属性约简算法 总被引:3,自引:1,他引:3
为降低基于修正差别矩阵的属性约简算法的复杂度,给出了基于修正差别矩阵的简化差别矩阵,证明了基于该简化差别矩阵的属性约简定义与基于原修正差别矩阵的属性约简定义是等价的.在此基础上设计了一个基于简化差别矩阵的属性约简算法,其空间和时间复杂度分别被降为O(|C|(|U'pos||U/C|))和max{O(|C|2(|U'pos||U/C|)),O(|C||U|log|U|)}.实例说明:用新算法进行属性约简,不仅减少了计算量,而且减少了存储空间,因而是一种高效的属性约简算法. 相似文献
7.
介绍了决策表的基于差别矩阵的属性约简方法,针对AM-RASR约简算法的不足,将叶东毅的对不相容决策表的求核思想融合进来,提出一个改进的算法,新算法通过在扫描数据过程中用冲突对象对差别集进行修正,可以有效地减少数据的存储量和计算量,并能适用于不相容决策表.最后通过一个UCI数据集的实验说明改进的算法是有效的. 相似文献
8.
基于差别矩阵的增量式属性约简完备算法 总被引:1,自引:0,他引:1
为了解决基于差别矩阵的属性约简完备算法得不到最小约简的问题,提出了一种改进的属性约简方法.该方法将信息论定义的属性重要性作为启发式信息,并通过构造一个条件信息熵算子对差别集合进行运算,同时利用算子来计算候选属性的剔除次序,采用宽度优先搜索策略使约简集合中含有最重要的属性,这样就解决了完备算法约简率低的问题.结合该方法并在分析对象集增量与差别矩阵关系的基础上,证明了增量约简定理,由此提出了一种增量式约简完备算法(CAIR),当新数据加入决策表时,算法可增量构造差别集合.实验结果表明,所提CAIR在大大缩短计算差别集合时间的同时,约简率比非完备算法提高了20.3%,是同条件下完备算法执行效率的13.2倍. 相似文献
9.
针对目前属性约简方法计算量过大、复杂度高的问题,在已有差别矩阵定义和求核方法的基础上,根据二元决策表所特有的性质,提出一种新的差别矩阵的定义,将一个大的差别矩阵分化成两个小矩阵。与建立一个差别矩阵的方法相比,改进的差别矩阵方法减少了矩阵中元素的比较次数。数据分析表明,该方法在改进差别矩阵定义的同时简化了计算过程,提高了运算效率。 相似文献
10.
目的在形式概念分析理论框架下,研究区间值形式背景的属性约简。方法给出区间值属性集差别矩阵和区间值形式背景属性约简的定义,并研究相关性质;研究协调区间值属性集的判定定理。结果给出协调区间值属性集的判定定理,以及基于区间值属性集差别矩阵的区间值形式背景约简方法。结论区间值形式背景可进行属性约简。 相似文献
11.
12.
一种基于差别矩阵的属性约简完备算法 总被引:15,自引:0,他引:15
提出了一种基于差别矩阵的粗糙集属性约简完备算法,算法的求解策略是在每次迭代过程中只选择必要的条件属性,如果在某次迭代过程中找不到这样的条件属性,则任意排除一条件属性,为下一次迭代中找到必要的条件属性做准备.分析了算法在最坏情况下的时间复杂性,给出了该算法相对Pawlak约简的完备性的证明.同已有的同类约简算法相比,该算法在最坏情况下具有更小的时间复杂性. 相似文献
13.
改进的差别矩阵及其求核方法 总被引:48,自引:0,他引:48
粗糙集方法提供了一种新的处理不精确、不完全与不相容知识的数学工具.属性约简是粗糙集理论的重要研究内容之一,而现有的很多属性约简算法都是从信息系统(或决策表)的核开始.针对HU利用差别矩阵求解粗糙集中的核方法的错误,叶东毅提出了新的差别矩阵及其求核方法,但计算代价高.为此,给出了改进的差别矩阵定义和求核方法,该方法纠正HU方法的错误,且可有效地降低计算代价. 相似文献
14.
一个新的差别矩阵及其求核方法 总被引:2,自引:0,他引:2
作者针对已有的利用差别矩阵来求粗糙集中核的方法存在的不足,将粗糙集的代数观与信息观结合起来研究,给出一个新的差别矩阵的定义和求核方法. 相似文献
15.
属性约简是粗糙集理论中的重要内容,而获取核属性又通常是计算属性约简的一个关键步骤.为使算法能同时应用于一致和不一致决策表,并精简分辨矩阵中的元素,优化时间性能,文章提出一种改进的分辨矩阵构造方法,构造的过程中充实核属性集,新产生的核集又能进一步优化分辨矩阵的构造.通过实例分析算法,并通过实验验证了该算法是可行有效的. 相似文献
16.
针对现存差别矩阵属性约简算法存在的缺陷,以及通过差别矩阵求约简属性时过程比较复杂,对比做了部分改进.通过对条件属性进行归类分组,提取代表性记录来生成差别矩阵,简化了差别矩阵的阶数和求约简属性的复杂度.从而在算法的时间复杂度和空间复杂度方面做了优化,节约了算法的时间和空间复杂度.实例表明算法可以有效地对属性进行约简,可获得理想的结果,并且改进后的算法简单、高效. 相似文献
17.
在决策表中,为了评价某条件属性的重要性,不但要考虑这个属性(单一属性)相对于决策属性的重要性,还要考虑该条件属性与其他条件属性构成的属性集的重要性。本文在属性集依赖度比单一属性依赖度更加可信的事实基础上,提出了一个基于辨识矩阵的属性集重要度评价方法。该方法能够较快地获得分辨矩阵,并直接求出属性集的依赖度,从而大大降低了算法的时间复杂度。实例验证了该方法具有较好的有效性和较低的时间复杂度。 相似文献
18.
基于正区域的快速求核算法 总被引:2,自引:0,他引:2
基于正区域求核算法的最好时间复杂度为O(|C|2|U|log|U|),为降低该求核算法的时间复杂度,给出了基于正区域的简化决策表定义和相应核的定义.证明了该简化决策表的核与原决策表的核等价.由于求正区域的简化决策表首先要求划分U/C,而求划分U/C的最好算法的时间复杂度为O(|C||U|log|U|),因此以基数排序的思想设计了一个新的求划分U/C的算法,其时间复杂度为O(|C||U|).最后以快速缩小搜索空间为目的设计了一个新的求正区域POSC(D)的算法.在此基础上,利用核的性质设计了一个新的求核算法,其时间复杂度为max(O(|C||U|,O(|C|2|U/C|)).并用实例说明了算法的实用性. 相似文献
19.
针对决策表,首先从理论上证明了相对知识量与新条件信息熵的等价性,从而保证可以从相对知识量的角度计算Hu差别矩阵属性约简.为快速计算出决策表属性的相对知识量,给出一种相对知识量的递归计算公式,从而得到新条件信息熵的递归计算公式.以此为基础给出一种属性重要性定义并设计出一种计算Hu差别矩阵属性约简的启发式算法.算例和实验结果验证该算法是高效的. 相似文献