首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
基于Skowron分明矩阵的有效属性约简算法   总被引:2,自引:0,他引:2  
为降低基于Skowron分明矩阵属性约简算法的复杂度,提出了简化分明矩阵及其相应属性约简的定义,并证明了基于简化分明矩阵的属性约简与基于原分明矩阵的属性约简等价.在简化决策表的基础上,定义了一个函数,该函数能度量条件属性在简化分明矩阵中出现的频率,并给出了计算该函数的快速算法,其时间和空间复杂度均为O(|U/C|).用该函数设计了一个有效的基于原分明矩阵属性约简算法,算法的时间复杂度降为O(|C||U|)+O(|C|2|U/C|),空间复杂度降为O(|U|);并用实例证明了算法的有效性.  相似文献   

2.
基于修正差别矩阵的高效属性约简算法   总被引:3,自引:1,他引:3  
为降低基于修正差别矩阵的属性约简算法的复杂度,给出了基于修正差别矩阵的简化差别矩阵,证明了基于该简化差别矩阵的属性约简定义与基于原修正差别矩阵的属性约简定义是等价的.在此基础上设计了一个基于简化差别矩阵的属性约简算法,其空间和时间复杂度分别被降为O(|C|(|U'pos||U/C|))和max{O(|C|2(|U'pos||U/C|)),O(|C||U|log|U|)}.实例说明:用新算法进行属性约简,不仅减少了计算量,而且减少了存储空间,因而是一种高效的属性约简算法.  相似文献   

3.
属性约简是粗糙集的精髓,差别矩阵算法是属性约简中的常见方法之一。差别矩阵算法需大量空间存储差别元素,且有很高的时间复杂度。为降低时间、空间复杂度,给出不可鉴别信息量定义,计算属性重要性,并以此为启发信息,设计一种启发式约简算法,使原来的时间复杂度由O(|R|~2|U|~2)降为max(O(|R|~2|U/R|),O(|R||U|)),空间由O(|R||U|~2)降为O(U/R),并通过实例验证该算法的高效性和正确性。  相似文献   

4.
基于二进制可辨矩阵的属性约简启发式算法   总被引:1,自引:0,他引:1       下载免费PDF全文
对文献[2]的可辨矩阵约简变换算法进行改进,利用核属性特性减少比较次数,提高算法的效率.充分考虑决策表的启发性知识,提出一种新的属性重要性计算方法.最后,给出一种基于二进制可辨矩阵的属性约简启发式算法.  相似文献   

5.
差别矩阵中会出现大量的重复元素占用大量内存,当数据太稠密时,构成的差别矩阵太大不容易操作且计算代价较高。本文提出了一种基于简化差别矩阵的属性约简算法(SDMAR),在属性约简之前,通过计算属性相似度,对属性进行了合并操作,得到简化决策表。根据简化决策表构造差别矩阵,计算差别矩阵中出现次数最多的属性并删除包含该属性的元素,当差别矩阵为空时终止操作,以达到对决策表属性约简的目的。通过算法及实例分析得到属性约简过程的时间复杂度有所减小。  相似文献   

6.
针对现存差别矩阵属性约简算法存在的缺陷,以及通过差别矩阵求约简属性时过程比较复杂,对比做了部分改进.通过对条件属性进行归类分组,提取代表性记录来生成差别矩阵,简化了差别矩阵的阶数和求约简属性的复杂度.从而在算法的时间复杂度和空间复杂度方面做了优化,节约了算法的时间和空间复杂度.实例表明算法可以有效地对属性进行约简,可获得理想的结果,并且改进后的算法简单、高效.  相似文献   

7.
高效的属性约简算法是粗糙集理论应用于知识发现的基础,要在令人可接受的时间内获得约简的通常做法是基于启发式的约简方法。本文提出了决策表中决策属性集相对条件属性集的条件信息量的概念,同时用知识的条件信息量定义了属性的重要性,在此基础上,提出了一种新的基于信息量的属性约简算法,该算法的时间复杂度为(O|C|3|U|2),通过实例分析,表明该算法是有效的。  相似文献   

8.
机动目标空间群生成算法   总被引:1,自引:0,他引:1  
提出了一种机动目标的空间群生成算法,该算法的思想是定义空间群目标间的多种特征相似度,通过一级融合获得的信息,计算目标多种特征相似度矩阵并融合求得合群结果。该方法用特征相似度空间属性计算代替了测量空间的目标属性计算,提高了可靠性。该算法的时间复杂度仅为O(n2)。仿真实验表明,该算法具有较高的合群效率,结果可信。  相似文献   

9.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

10.
影响基于差别矩阵的属性约简算法效率的主要因素有计算U/C等价类和差别矩阵的大小.为了解决差别矩阵大小影响属性约简算法计算效率,分析了基于差别矩阵的属性约简算法中差别矩阵定义的不足,重新定义了一种压缩差别矩阵,删除差别矩阵中大量的空元素和相同元素,从而进一步减少了差别矩阵元素的个数,并设计基于压缩差别矩阵的属性约简算法.对UCI及其他数据库进行仿真,实验结果表明该算法具有高效性.  相似文献   

11.
信息熵与支持向量的关系   总被引:6,自引:1,他引:6  
标准支持向量机由于具有O(n~3)的时间复杂度和O(n~2)的空间复杂度,影响了其在海量数据集上的应用,而对支持向量机新模型的研究则最有可能取得一些突破,从而彻底解决上述难题。介绍新模型的研究现状的基础上将信息熵引入到支持向量机建模中,重点分析数据的信息熵分布规律和支持向量数据及其熵值的关系,进一步构造了信息熵支持向量机算法,最后给出了相关实验,初步的实验结果显示信息熵支持向量机具有较快的分类速度。  相似文献   

12.
对训练样本规模为m的标准支持向量机(Support Vector Machine,SVM)进行训练,时间复杂度为O(m3),空间复杂度为O(m2)。文章研究将其转换成等价的最小包含球(Minimum Enclosing Ball,MEB)形式,使用核心集向量机(Core Vector Machine,CVM)高效获得近似最优解。CVM的优点是时间复杂度与训练样本规模m呈线性关系,空间复杂度与m无关。实验证明,CVM可以对大规模数据集进行高效的分类。  相似文献   

13.
为了改善现有linux系统内核iptables模块在数据包过滤中线性匹配规则的效率。采用了散列表和动态平衡树来组织过滤表,提出了按照三层递进式的搜索规则,减少了原来的线性查找重复匹配的次数,改进了过滤效率,并确保原有功能不变。把A个IP地址、B个网络设备和C个协议规则的过滤表查找时间复杂度从O(A*B*C)降低到m*O(log2A)+n*O(B)+k*O(log2C),(m,n,k为系数因子)。通过适当增加数据结构,安排合理的搜索规则,在有限的系统开销内,可以提高数据包过滤的规则匹配效率。  相似文献   

14.
曹国梅 《河南科学》2009,27(7):775-778
研究了一类分族分批排序最小误工个数问题,给出并证明了最优排序的性质,证明了此问题是NP-困难的.对工件的到达时间和工期一致时的情形,给出了一个时间复杂性为O(mb(n/m)^2m)的动态规划算法.  相似文献   

15.
提出一种新的systolic实现方法计算三角Stein方程.可将原复杂性为O(m2n2)的串行算法在处理器为O(m2)的systolic阵列上并行计算,时间复杂性降为O(mn),而处理器具有很高的利用率.利用文中给出的方法,可以并行求解一大类最优控制中有关矩阵运算的问题,如Lyapunov方程、Sylvester方程等  相似文献   

16.
用统计方法研究东西方语言的多词单元问题和东方语言的未登录词问题时需要删除同频子串(子串归并).传统的子串归并算法时间复杂度为O(n^2),在大规模语料库的处理中效率低下.提出一种基于散列技术的时间复杂度为O(n^2)的子串归并算法,并用数学方法证明其与O(n^2)复杂度的算法等价,即输入相同时输出也相同.不同规模语料上的实验结果表明新算法能够大大缩短子串归并所需时间,适用于大规模语料库的处理.  相似文献   

17.
寻求中国货郎担问题最短回路的多项式时间算法   总被引:7,自引:1,他引:6  
研究求解中国货郎担问题最短回路的多项式时间算法。首先利用计算机几何凸壳与中轴的结构将集划分尤其中干个子点集,然后反复采用求子点集凸壳及划分科余子点集的方法,求得通过子点集的子路径,最后将各子路径连接成一条回路。中国货郎担问题存在多项时间算法求得最短回路。  相似文献   

18.
The scheduling problem on a single hatching machine with family jobs was proposed.The single hatching machine can process a group of jobs simultaneously as a batch.Jobs in the same batch complete at the same time.The batch size is assumed to be unbounded.Jobs that belong to different families can not be processed in the same batch.The objective function is minimizing maximum lateness.For the problem with fixed number of m families and n jobs,a polynomial time algorithm based on dynamic programming with time complexity of O(n(n/m + 1)m) was presented.  相似文献   

19.
K-近邻(K-NN:K-nearest neighbors)是著名的数据挖掘算法,应用非常广泛.K-NN思想简单,易于实现,其计算时间复杂度和空间复杂度都是O(n),n为训练集中包含的样例数.当训练集比较大时,特别是面对大数据集时,K-NN算法的效率会变得非常低,甚至不可行.本文用实验的方法比较了2种加速K-NN的方法,2种加速方法分别是压缩近邻(CNN:condensed nearest neighbor)方法和基于MapReduce的K-NN.具体地,在Hadoop环境下,用MapReduce编程实现了K-NN算法,并与CNN算法在8个数据集上进行了实验比较,得出了一些有价值的结论,对从事相关研究的人员具有一定的借鉴作用.  相似文献   

20.
本文给出处理机具有不同的开始加工时间的Q,ai|pmitn|Cmax排序问题的一个最优算法,算法的复杂性为O(m^2n^2)。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号