首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
为获取高效算法,结合Rough集和粒计算理论,基于知识颗粒设计出获取等价类的算法及计算正区域的等价算法,使用动态SQL语句直接获取已排序的对象集,省略类似算法必需的排序算法,降低了实现的复杂度.给出一种增量式的属性约简算法,设计5种选择属性的新启发策略供算法使用,可避免无用属性入选,更有效去除可省属性及缩减搜索窄间等,确保约简算法的完备性,简化了中间步骤,从而保证算法的高效性.理论分析及实验结果表明:采用该约简算法的时间复杂度和实际求解时间均比采用现有算法的时间复杂度和实际求解时间低,并能更好地适应海量数据集的挖掘.  相似文献   

2.
基于遗传编程(GP)提出一种最优规则遗传算法(BRGA)对分类规则进行优化的方法,获取最佳分类规则集,此算法可以调整分类器模型的相关参数,在适当增加迭代基础上大幅提高分类的精确度,具有相当的灵活性和可理解性.利用6个基因数据集检验了算法的性能.仿真结果表明,本文提出的算法与其他文献的方法相比,在具有较高分类精确度和稳定性前提下大幅降低了计算复杂度及冗余.  相似文献   

3.
李仁  段隆振  周青  李光辉 《江西科学》2008,26(2):295-299
在分析关联规则挖掘Apriori算法时,从信息粒的角度出发,根据二进帝j粒计算的表示方法和Apriori算法中的相似性及交互性,提出了一种用二进制粒计算采表示的Apd槲改进算法,即使用二进制粒计算求出频繁项目集。方法不仅简洁、方便、逻辑性强,而且更适合于计算机运算。  相似文献   

4.
分布式互斥请求集的性能,对基于竞争的分布式互斥算法的消息复杂度、对称性、同步时间及容错能力等均具有直接影响.而分布式互斥请求集生成算法性能,如时间复杂度、空间复杂度,则对算法的运行速度、计算能力具有直接影响.通过对基于循环编码的分布式互斥请求集生成算法运行过程的研究,特别是对该算法的时间复杂度的研究,提出一种改进的基于循环编码的分布式互斥请求集生成算法.此算法在不明显增加算法空间复杂度和请求集长度的基础上,能够显著提高请求集生成算法的时间复杂度,从而使得算法的运行速度和计算能力都得到显著增加.  相似文献   

5.
文章提出了一种粒计算和局部线性嵌入(LLE)相结合的图像处理方法.针对人脸研究领域中高维数据产生的复杂计算度问题,提出了图像粒的方法,并对图像进行处理;对高维数据进行了降维,从而达到降低计算复杂度的效果.实验在Frey人脸数据库上进行,在多个不同粒度的图像粒上分别应用LLE算法,给出人脸姿态和表情分布变化的实验结果,并分析了图像信息的损失情况.实验结果表明图像粒LLE算法对算法复杂度的降低和图像信息的保持是一个有效的方法.  相似文献   

6.
Apriori算法是关联规则挖掘中最经典的算法,但它存在两大致命缺陷:需多次扫描数据库和产生海量的候选项目集。从这两个角度出发改进算法,提出了一种基于模式矩阵的高效改进算法(简称P-Matrix算法),使扫描数据库的次数减少为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大减少,有效地提高了Apriori算法的效率。  相似文献   

7.
提出了一种基于贪心启发式的计算方法,可以在多项式时间复杂度内获得DUDC问题的近似最优解.首先生成了可替代二维平面的离散单元格,在每一单元格中心建立能够覆盖一定数量目标点的替代集,使用贪心算法确定替代集的最小组合方式,实现了对目标点的全覆盖.基于每个子集内所包含的点的具体位置,计算了其最小覆盖圆.最小覆盖圆的中心视为选址位置.基于具体案例证明了算法的有效性.讨论了该算法的影响因素,分析了时间复杂度以及近似度比率.  相似文献   

8.
核密度估计(Kernel Density Estimation,简称KDE)算法是当前最有效和应用最广泛的一种非参数密度估计算法,其主要缺点在于二次的算法复杂度,与训练集容量正相关的空间复杂度以及高维密度估计中的性能降低.为了加快KDE的计算速度,简化模型的复杂度,提出了一种新型的基于稀疏贝叶斯回归的快速的KDE的计算模型,该模型用经过人工加噪处理过的分布函数逼近数据作为输入数据,获得了KDE的极为稀疏的表示.在一元和二元人工数据集上的实验结果表明,该算法与传统的KDE算法相比,在保持了相当的计算精度(多数情况下降低了模型误差)的情况下,将算法执行的时空效率大幅度提高,而且该算法在小样本情况下,得到的密度估计也更为光滑. 二元人造数据集上的初步实验结果还表明通过应用数据高斯化技术得到的算法的多元扩展在一定程度上缓解了“维数灾难”.  相似文献   

9.
一种可伸缩的粒计算知识获取方法   总被引:1,自引:1,他引:0  
粒计算是一种新的智能信息处理理论,它很大程度上模拟了人脑认识和解决问题的过程.通过对信息表分层粒化模型的研究,引入了粒分布链表的概念来生成粒子,并改进了一个粒计算算法.改进算法使用数据库技术对原始数据集进行粒化来生成粒分布链表,能够直接处理海量数据集,同时不影响原算法的有效性.通过试验测试了该方法的有效性及可伸缩性.  相似文献   

10.
利用波粒二相机,根据原始的分解算法、量子Shor算法以及经典计算机中的费马算法和莱曼算法,提出了能够进行大数因子分解的几种算法.通过对原始分解算法的改进,使得用原始大数因子分解的问题由N次变为1次完成.通过对费马算法和莱曼算法改进,减少了大数质因子分解过程的计算复杂度.与量子计算机相比,波粒二相机使得在经典上需要指数步完成的算法,在多项式时间内就可以解决,减少了计算复杂度.  相似文献   

11.
在海量数据的关联规则数据挖掘中,采用并行计算是非常必要的;针对当前的关联规则算法,运用并行算法的思想,结合云计算环境下的Hadoop架构,提出了Hadoop下的并行关联规则算法的设计,最后实验表明,该算法能处理节点失效,并且能实现节点负载均衡。  相似文献   

12.
关联规则是数据挖掘的一个基本方法,本文首先介绍传统的Apriori算法的过程,分析它在处理大数据集时存在的问题.提出关联规则的一种改进算法,称为哈希修剪算法.然后比较改进的算法与传统的Apriori算法在算法时间复杂度、性能上的差异.通过实验得出,哈希修剪算法在数据挖掘中能够更加有效的处理数据.  相似文献   

13.
VSS-MASK算法使用数据随机化方法对原始数据进行数据变换,采用纵向结构组织数据与只提交变换后为'1'的数据组成的数据表的方法,克服了原MASK算法中横向组织数据造成的数据稀疏性强、通用性差的缺点,并通过试验证明了VSS-MASK算法效率的提升.  相似文献   

14.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

15.
仲波  张远平 《科学技术与工程》2006,6(24):3863-38663870
基于随机响应技术,提出了一种在保护隐私的关联规则挖掘中对包含三个属性值的序数型数据进行伪装的方法.设计了在伪装的数据集上进行挖掘的算法;分析了算法的安全性及复杂度。并通过实验表明,该算法在伪装的数据集上挖掘出来的规则与原规则相比,相对误差不超过5%。  相似文献   

16.
在高校的科研管理工作中应用关联规则挖掘技术,通过挖掘教师的科研成果数据,可以得到教师科研工作中的潜在信息,辅助决策下一阶段的科研管理工作。  相似文献   

17.
讨论了基于关联规则的数据挖掘技术,并应用于学生信息查询系统中,可以得到有用的信息并利用语义查询优化方法加快查询的速度.  相似文献   

18.
基于矩阵的频繁项集发现算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则的经典算法.在分析经典Apriori算法的基础上,提出了一种有效的基于矩阵的Apriori的改进算法.该算法应用了矩阵的思想,只需对数据库扫描一次,即可得到频繁项集,大大提高了算法的效率.  相似文献   

19.
In data mining from transaction DB, the relationships between the attributes have been focused, but the relationships between the tuples have not been taken into account. In spatial database, there are relationships between the attributes and the tuples, and most of the associations occur between the tuples, such as adjacent, intersection, overlap and other topological relationships. So the tasks of spatial data association rules mining include mining the relationships between attributes of spatial objects, which are called as vertical direction DM, and the relationships between the tuples, which are called as horizontal direction DM. This paper analyzes the storage models of spatial data, uses for reference the technologies of data mining in transaction DB, defines the spatial data association rule, including vertical direction association rule, horizontal direction association rule and twodirection association rule, discusses the measurement of spatial association rule interestingness, and puts forward the work flows of spatial association rule data mining. During twodirection spatial association rules mining, an algorithm is proposed to get nonspatial itemsets. By virtue of spatial analysis, the spatial relations were transferred into nonspatial associations and the nonspatial itemsets were gotten. Based on the nonspatial itemsets, the Apriori algorithm or other algorithms could be used to get the frequent itemsets and then the spatial association rules come into being. Using spatial DB, the spatial association rules were gotten to validate the algorithm, and the test results show that this algorithm is efficient and can mine the interesting spatial rules.  相似文献   

20.
挖掘关联规则Apriori算法的一种改进   总被引:1,自引:0,他引:1  
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号