首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
提出一种改进的Apriori算法.该算法首先对原始数据进行项编码,其次通过"或"运算来确定候选频繁项集,然后再对候选项集作"与"运算来确定频繁项集,最终得到满足最小支持度的极大频繁项集,其中项的长度是由该算法自动搜索得到的.  相似文献   

2.
基于数据库划分的高效关联规则挖掘算法研究   总被引:4,自引:4,他引:0  
在现有的关联规则改进算法的基础上,深入分析了经典算法的内涵,提出了不产生候选二项集的改进算法,而且减少了扫描数据库的大小.与Apriori算法相比,在较大型的交易数据库中,效率明显提高.  相似文献   

3.
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,如果采用Apriori类的候选项目集生成一检验方法,则候选项目集生成的代价通常很高.为寻求避免生成大量候选项集或生成频繁模式树的挖掘算法,提出一种从事务项集交集求最大频繁项集的迭代算法DIIP(Datasets Iteration and Intersection Pruning Algorithm),通过不断缩减事务集数据量和尽可能早地对项目集进行修剪实现最大频繁项集的挖掘,该算法有别于已有的最大频繁项集经典算法,实验表明该算法有效可行.  相似文献   

4.
在所有频繁项集挖掘算法中,Apriori算法一直是一个经典的算法,但是该算法存在的最大缺陷是要进行多次的数据库扫描并且在挖掘过程中产生大量的候选频繁项集,因此效率很低.提出了利用基于矩阵的方法挖掘频繁项集,很好地避免了这个缺陷.  相似文献   

5.
针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性.  相似文献   

6.
基于数组的关联规则算法的改进   总被引:1,自引:0,他引:1  
针对Apriori算法的不足,提出了基于数组的关联规则挖掘算法,该算法只扫描数据库一次,将数据库中的数据存于数组向量中。基于关联规则的性质,对扫描的事务数和项目数,连接步骤等进行压缩和优化,并且利用一维数组对候选2-项集进行计数,从而避免大量候选2项集的产生,有效解决了传统算法候选2项集的瓶颈问题,此算法与Apriori算法相比有明显的提高。  相似文献   

7.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高.  相似文献   

8.
挖掘高效用项集已成为关联分析中的热点问题之一.多数高效用项集挖掘算法需要产生大量的候选项集,影响了算法性能.HUI-Miner是一个不需要产生候选项集就能发现事务数据库中所有高效用项集的算法.但其需要产生大量效用列表,不仅消耗了过多的存储空间,而且影响了算法的运行性能.针对此问题,提出一个新的数据结构,称为项集列表,用于存储事务和项的效用信息.提出3种剪枝策略,减少项集列表的数量,通过扫描一次事务数据库完成所有项集列表的构建.提出算法MHUI,直接从项集列表中挖掘所有的高效用项集而不产生任何候选项集.在3个不同的稀疏数据集上和最新的算法进行对比实验证明,MHUI算法的运行时间和内存消耗优于其他算法.  相似文献   

9.
不确定性数据的频繁项集挖掘的算法—U-apriori算法采用逐层迭代搜索方法,使用候选项集来找频繁项集.分析了U-apriori算法的流程和实现过程,并通过实验对比得出U-apriori算法花费较少时间和空间的优点,最后针对该算法的缺点提出了改进思路.结果表明:U-apriori算法是最佳概率频繁模式挖掘方法之一.  相似文献   

10.
在Apriori算法中,需要多次扫描数据库,并且对候选集的支持度计算比较繁琐,本文利用等价关系的概念,在信息表上计算候选集的支持度计数并寻找频繁项集,且只需扫描数据库1次,提高了挖掘效率,同时保留了包含频繁项集的事务.  相似文献   

11.
举例说明了DHP算法的执行过程,并且对DHP的算法性能进行了分析。DHP算法高效地生成频繁项目集,解决了生成频繁2-项目集L2时的性能瓶颈问题,减少了事务数据库的内容和降低了数据库扫描的次数。  相似文献   

12.
HA (hashing array), a new algorithm, for mining frequent itemsets of large database is proposed. It employs a structure hash array, ItemArray ( ) to store the information of database and then uses it instead of database in later iteration. By this improvement, only twice scanning of the whole database is necessary, thereby the computational cost can be reduced significantly. To overcome the performance bottleneck of frequent 2-itemsets mining, a modified algorithm of HA, DHA (direct-addressing hashing and array) is proposed, which combines HA with direct-addressing hashing technique. The new hybrid algorithm, DHA, not only overcomes the performance bottleneck but also inherits the advantages of HA. Extensive simulations are conducted in this paper to evaluate the performance of the proposed new algorithm, and the results prove the new algorithm is more efficient and reasonable.  相似文献   

13.
128比特分组加密算法E2是日本密码学家M.Kanda等人向NIST提交的一种AES候选算法,详细介绍E2的基本特征、算法描述以及安全特性。研究结果表明,E2不仅具有十分优异的抗差分攻击和抗线性攻击的性能,而且实现也十分方便。  相似文献   

14.
为了完成越野环境中无人自主导航车的障碍检测任务,应用四线激光雷达,提出了1种新的障碍检测算法,该算法利用检测区域的坡度信息进行障碍检测,包括坐标变换、候选障碍点提取、候选障碍点聚类及点簇高度求取4个步骤。为了克服激光雷达检测盲区与抑止测量过程中干扰噪声的影响,运用了卡尔曼滤波算法对目标障碍进行了滤波处理。试验结果表明,障碍检测算法稳定可靠。  相似文献   

15.
基于FP-tree最大频繁模式超集挖掘算法   总被引:1,自引:0,他引:1  
数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无需产生大量的候选集,同时减少数据集扫描次数,降低数据库遍历时间,提高算法效率.实验证明,此算法在降低候选项目集冗余度的同时有效减少了算法运行时间.  相似文献   

16.
Instance-specific algorithm selection technologies have been successfully used in many research fields,such as constraint satisfaction and planning. Researchers have been increasingly trying to model the potential relations between different candidate algorithms for the algorithm selection. In this study, we propose an instancespecific algorithm selection method based on multi-output learning, which can manage these relations more directly.Three kinds of multi-output learning methods are used to predict the performances of the candidate algorithms:(1)multi-output regressor stacking;(2) multi-output extremely randomized trees; and(3) hybrid single-output and multioutput trees. The experimental results obtained using 11 SAT datasets and 5 Max SAT datasets indicate that our proposed methods can obtain a better performance over the state-of-the-art algorithm selection methods.  相似文献   

17.
为解决无人机图像自动识别系统对大视场角下小目标的识别准确率及实时性问题,利用深度学习卷积神经网络对热成像-白光联合图像进行目标识别。设计了一种针对具有温度特征的目标物识别系统以及双通道目标候选提名图像识别算法。充分利用热成像图中目标热源特征的HSV值,将目标物从热成像图中进行筛选、分割。通过Canny算子勾勒目标物轮廓,并标记出目标物大致区域,导入白光图像提取含有目标物的有效图像信息。利用YOLO V2算法对候选图像内目标物进行识别。通过实验表明,提出的双通道目标候选提名图像识别算法具有可行性与实用性,能够在大视场环境下对小目标进行精准快速识别,满足无人机机载系统简易、实时和准确性要求。  相似文献   

18.
在Apriori算法的改进算法M-Apriori基础上,为了进一步减少不必要的数据库扫描,引入事务约简技术,提出一种改进的MR-Apriori算法.考虑到M-Apriori算法会产生大量候选项集,为了实现对候选项集快速剪枝,加入一个自定义的2项集支持度矩阵,提出第2种改进的MP-Apriori算法.将事务约简和2项集矩阵快速剪枝一起引入到 M-Apriori算法中,提出第3种改进的MRP-Apriori算法.最后,在mushroom数据集上进行实验.结果表明:加入事务约简的MR-Apriori算法和加入2项集矩阵快速剪枝的MP-Apriori算法,运行时间相比原M-Apriori算法都有较大缩减,而同时结合两种优化策略的MRP-Apriori算法运行时间最短,验证了这两种优化策略的有效性.  相似文献   

19.
分析了实现均衡路由的功能模型和算法,重点研究了LDM(多路径负载分配)算法。为了充分利用候选路径的信道容量,提出了一种改进的LDM算法。改进后的算法在多个候选路径之间根据比例系数均衡分配通信流量。通过算法性能分析表明:改进后的算法和最初的LDM算法具有相同的复杂度,但对于给定的通信流量能够提升网络性能。  相似文献   

20.
 在移动计算中挖掘满足用户需求的长频繁邻近类别集时,为了避免产生冗余候选项和减少重复计算量,提出一种基于幂集数递减的约束频繁邻近类别集挖掘算法,其能够提取包含约束条件的长频繁邻近类别集;该算法用幂集数递减序列来产生候选频繁邻近类别集,有效地删除了不满足用户需求的冗余候选项和减少了重复扫描空间实例的计算量.实验表明在挖掘满足用户需求的长频繁邻近类别集时,该算法比现有算法更快速.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号