首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
频繁项目集发现算法Apriori的研究   总被引:3,自引:0,他引:3  
为了提高Apriori算法的效率,从减少数据库扫描次数的角度出发,提出了一种动态自适应的改进算法.通过比较,该改进算法有效地减少了数据库的扫描次数,明显地提高了Apriori算法的效率,当数据库中总项目数目较大时,该算法更为有效.  相似文献   

2.
Apriori算法是一种经典的关联分析挖掘算法.经典Apriori算法计算效率偏低,并且需要多次扫描数据库.针对这些问题,文章提出了基于Hash表改进的Apriori算法.基于Hash表的改进Apriori算法计算时只需扫描对应频繁项集Hash表中对应的项,缩小了扫描范围,并且只需要扫描一次数据库.对比经典的Apriori算法,性能具有显著提高.  相似文献   

3.
赵磊 《科技信息》2010,(20):I0126-I0127
本文针对经典的Apriori算法需循环扫描数据库的问题,提出了一种改进的Apriori算法,描述了在数据离散化的基础上只需扫描一遍数据库的算法思路,给出了算法实现的具体过程,并通过典型数据实例进行了验证和对比分析.  相似文献   

4.
关联规则挖掘是数据挖掘中的一个重要课题,常用的Apriori 算法要多次扫描数据库,会产生大量的候选项集.利用向量的内积运算和逻辑运算提出了一种关联规则挖掘的改进算法.研究表明,该算法运算简单,只需要扫描一次数据库,不需要产生候选项集,且具有处理大型数据库的优点.  相似文献   

5.
在分析当前Apriori算法及其改进算法的基础上,提出了一种将Apriori算法与物流信息挖掘相结合的Apriori改进算法.通过Apriori改进算法与原Apriori算法挖掘结果的比较,说明了Apriori改进算法不仅缩小了剪枝扫描数据库的规模而且减少了生成频繁项目集的候选项目集.  相似文献   

6.
基于数据库划分的高效关联规则挖掘算法研究   总被引:4,自引:4,他引:0  
在现有的关联规则改进算法的基础上,深入分析了经典算法的内涵,提出了不产生候选二项集的改进算法,而且减少了扫描数据库的大小.与Apriori算法相比,在较大型的交易数据库中,效率明显提高.  相似文献   

7.
基于矩阵的频繁项集发现算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则的经典算法.在分析经典Apriori算法的基础上,提出了一种有效的基于矩阵的Apriori的改进算法.该算法应用了矩阵的思想,只需对数据库扫描一次,即可得到频繁项集,大大提高了算法的效率.  相似文献   

8.
在关联规则挖掘算法中,PredictiveApriori算法只需设定输出最好的N个规则,就可挖掘出N个预测精度最大的规则,从而极大地减轻用户参数设置的负担.但该算法需要不断对事务数据库进行扫描,如果事务数据库很大将会大大增加I/O时间,降低挖掘效率.本文融合事务压缩技术,提出一种称为Fast PredictiveApriori的改进版算法.实验结果表明,随着事务数据量的增大,改进后的算法只需扫描压缩事务集.因此,在事务数据库很大时,该算法能明显提高执行效率.  相似文献   

9.
对Apriori算法的一种改进   总被引:2,自引:0,他引:2  
给出了一种对Apriori算法改进的算法。改进的算法只需扫描一次数据库D,同时简化了Apriori算法,减少了存储设备I/O时间,提高了算法的效率。  相似文献   

10.
针对垂直数据分布数据库FP-tree生长基本算法中存在的链接点表空间随问题规模线性增加的问题提出一种改进算法.采用定长的链接点表进行分段扫描,在空间需求恒定的前提下构造FP-tree.证明了改进算法与基本算法构造的FP-tree是同构的.实验与分析结果表明,当应用于同一数据集时,改进算法所需空间恒定.  相似文献   

11.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

12.
基于数据挖掘的智能答疑系统   总被引:6,自引:2,他引:6  
根据当今答疑系统的缺点,提出了一套基于数据挖掘算法的答疑设计方案,将改进的关联规则算法应用于文本聚类中,可以将数据库中问题更加准确地分类,因此可以将用户提出的问题快速定位,提高答疑速率.将聚类后的问题库应用关联规则,可以得到更加准确的关联表,用于提取论坛数据库中的最优答案,进而形成一个快速且准确的自动答疑系统.实验结果表明该方案具有智能性、自我更新性能、节约存储空间和提高答疑效率等优点.  相似文献   

13.
在Apriori算法基础上,给出一个改进的关联规则挖掘算法。改进的算法只需对数据库进行一次搜索,能大量减少L/O次数,且内存开销适中。通过一组实验对两种算法进行比较,本算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。  相似文献   

14.
关联规则发现的一种改进算法   总被引:7,自引:0,他引:7  
在Apriori算法基础上,给出一个改进的关联规则发现算法·由于这个算法只需对交易数据库进行一次搜索,能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则发现算法相比具有快速的优点,适合于大型交易数据库·使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法·  相似文献   

15.
针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。  相似文献   

16.
根据数据挖掘中关联规则的性质以及高校成绩管理数据库的自身特点,在经典关联规则算法Apriori算法的基础上提出了一种改进的算法——A 算法,并利用该算法对学生成绩管理数据库进行了关联规则挖掘,得到了隐含在数据库中的有用信息.  相似文献   

17.
SM—AES(S-BoxModifiedAES)算法指的是引入了S盒替换方案的AES加密算法。文章使用SM—AES加密算法对数据库进行加密处理。通过替换原有AES算法中的S盒,提高AES算法抵抗密码分析攻击的能力。改进模式之后.与之前的AES的S盒对比在性能上有了较大的提升,将其应用于数据库加密系统中,改良了其非线性和差分物质特性,提高了数据库的安全性。  相似文献   

18.
文件管理是操作系统和数据库的重要组成部分,B-树和B+树在这方面有着重要的应用,但并不总适合海量数据的访问尤其在大型数据库中,因此希望改进B+树。首先制定叶子节点和目录节点的文件个数的调整规则,以达到较好的平衡;然后选择恰当的叶子节点中的文件个数m和目录节点中的目录项数n,使文件访问时间最少;最后实验证明较之简单使用B+树作为文件管理的算法具有良好的性能。为解决大型数据的文件管理提供了新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号