首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
改进的关联规则采掘算法及其实现   总被引:7,自引:0,他引:7  
在现有的关联规则采掘算法的基础上,进一步分析了经典算法的内涵,提出了生成大项目集优化时减少对交易数据库扫描次数的改进算法,并给出改进后的算法描述。在DBMS平台上用数据查询语言实现关联规则的采掘。结果表明,改进的算法对关联规则的采掘十分有效。  相似文献   

2.
基于事务数据库的关联规则采掘算法研究   总被引:4,自引:0,他引:4  
采掘关联规则是知识发现领域的一个重要问题,文中对采掘关联规则问题进行了简单的回顾,分析了传统的关联规则Apriori算法的优缺点,设计了一种基于事务数据库的快速采掘算法TB-MA。实例证明,与Apriori算法相比,TB-MA算法削减了数据库遍历次数,提高了采掘效率,是十分有效的采掘算法。  相似文献   

3.
一种数据挖掘关联规则的高效算法   总被引:4,自引:0,他引:4  
关联规则是数据挖掘的一个重要课题,本文提出了一种新的算法,可以大大减少扫描数据库的次数,能够灵活的在时空两方面取得折衷,提高了效率。  相似文献   

4.
分析了基于频繁模式的关联规则算法Fptree,给出了一种基于二进制表示的改进算法,详细介绍了该算法的主要思想,算法实现方案.并通过实例比较了两种算法,证明新算法提高了挖掘规则的效率.  相似文献   

5.
如何从已有的大量数据中找出对决策有用的信息支持决策已成当务之急,数据采掘技术可帮助我们完成这项工作,本文简要介绍数据采掘的概念,采掘方法类型和关联规则采掘算法,结合实际给出了一个在教学管理中的应用探讨,所挖掘出的深层次知识,对帮助我们搞好教学管理有重要的指导作用。  相似文献   

6.
一种基于关联规则的属性值约简算法   总被引:3,自引:1,他引:3  
数据约简是数据挖掘中的一个重要领域.将属性值约简和关联规则挖掘相结合.给出了支持度、置信度、属性值重要性的定义.在此基础上.提出一种新的用来进行数据挖掘的算法——基于关联规则的属性值约简算法.  相似文献   

7.
掘进保证系数—一种衡量采掘平衡的新指标   总被引:1,自引:1,他引:0  
针对三量可采用等传统指标的通用性差等问题,研究了煤矿的采掘平衡关系,提出了一种新指标-掘进保证系数。该方法结合采掘计划可以动态,准确地反映矿井现在及未来的采掘关系。在江苏某矿务局的应用结果表明,该方法能够准确反映掘进对回采的保证情况。  相似文献   

8.
一种提取关联规则的数据挖掘快速算法   总被引:8,自引:0,他引:8  
提出了一种从大型数据库中挖掘关联规则的快速算法。该算法以典型的Apriori和DHP算法为基础,提出了中间检查点、等从项目类等概念,并对Apriori中的Apriori-gen算法进行了改进。结果表明,它较Apriori有明显的提高。  相似文献   

9.
谭跃 《科技资讯》2009,(34):19-19
近年来,随着传感器技术的发展及其应用的广泛,数据融合也日益受到人们的重视。数据关联作为数据融合的一个基本问题也得到了深入的研究。本文就两种典型的数据关联算法进行了研究,并通过实验比较分析了它们的优缺点。  相似文献   

10.
一种适于工程应用的多目标跟踪快速数据关联算法   总被引:8,自引:0,他引:8  
提出了一种新的多目标跟踪快速数据关联算法,重点分析了关联门相交区域中的公共回波对航迹更新的影响,并综合考虑了关联门内其余侯选回波对航迹更新的作用,以很小的计算代价完成了后验概率的计算。仿真表明,新算法以与PDAF算法接近的计算量,达到了接近于JPDAF算法的目标跟踪成功率。  相似文献   

11.
在分析广义关联规则基本模型和求解在规则的基本性质基础上,提出一个新的基于关系操作的挖掘广义关联规则算法,该算法既使用了成熟的关系操作又充分利用先验,在多概念层上交互挖掘关联规则,有很好的实用性。  相似文献   

12.
HA (hashing array), a new algorithm, for mining frequent itemsets of large database is proposed. It employs a structure hash array, ItemArray ( ) to store the information of database and then uses it instead of database in later iteration. By this improvement, only twice scanning of the whole database is necessary, thereby the computational cost can be reduced significantly. To overcome the performance bottleneck of frequent 2-itemsets mining, a modified algorithm of HA, DHA (direct-addressing hashing and array) is proposed, which combines HA with direct-addressing hashing technique. The new hybrid algorithm, DHA, not only overcomes the performance bottleneck but also inherits the advantages of HA. Extensive simulations are conducted in this paper to evaluate the performance of the proposed new algorithm, and the results prove the new algorithm is more efficient and reasonable.  相似文献   

13.
关联规则挖掘的新模型   总被引:6,自引:0,他引:6  
对关联规则的不足进行分析,提出了一新关联规则模型,此模型有助于挖掘关联规则的正相关与负相关.并对经典模型进行一定改进.  相似文献   

14.
首先介绍了由Christian Hidber提出的在线挖掘关联规则算法Carma,然后提出了对该算法的若干改进.减弱了原算法第一步中当前交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单.实验表明,以上改进提高了算法的速度.  相似文献   

15.
介绍了由ChristianHidber提出的在线挖掘关联规则算法Carma,提出了该算法的若干改进,减弱了原算法第一步有交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单。实验证明,以上改进提高了算法的速度。  相似文献   

16.
随着计算机技术和通信技术的不断发展,用户存储了越来越多、具有很高使用价值的信息,不断涌现的大量信息在给人们带来方便的同时也带来了问题,怎样提取有用信息使得数据挖掘技术应运而生.关联分析是数据挖掘的本质,关联规则挖掘是进行关联分析最常用的方法.在关联规则的Apriori算法的基础上,指出了该算法的不足之处,提出了一种新的改进算法,从而增强了算法的适应性.  相似文献   

17.
Mining association rules from large database is very costly.We develop a parallel algorithm for this task on sharedmemory multiprocessor (SMP). Most proposed parallel algorithms for association rules mining have to scan the database at least two times. In this article, a parallel algorithm Scan Once (SO) has been proposed for SMP,which only scans the database once. And this algorithm is fundamentally different from the known parallel algorithm Count Distribution (CD). It adopts bit matrix to store the database information and gets the support of the frequent itemsets by adopting Vector-And-Operation, which greatly improve the efficiency of generating all frequent itemsets.Empirical evaluation shows that the algorithm outperforms the known one CD algorithm.  相似文献   

18.
频繁序列模式挖掘算法   总被引:5,自引:0,他引:5  
为解决从数据库中挖掘长模式和支持度较低时可能遇到计算复杂度较高的问题,提出一种新的算法--EFSPAN(Effective Frequent Sequential PAtterN mining algorithm).算法采用了深度优先挖掘策略,并将基于前缀序列格的深度优先遍历与两种高效的剪枝策略相结合.实验结果表明:新算法在模式较长和支持度较低时,能使搜索空间中60%以上的节点免被搜索;从而大大缩小了搜索空间,降低了序列模式挖掘算法的计算复杂度.  相似文献   

19.
快速频繁序列模式挖掘算法   总被引:4,自引:1,他引:3  
为解决从数据库中挖掘长模式可能遇到较高的计算复杂度问题, 提出一种新的算法FFSPAN. 传统上, 要判断一个序列是否频繁, 需要在原数据库中判断整个序列是否频繁; 而算法FFSPAN是通过在序列数据库中寻找一个频繁项或一个频繁项集来代替寻找一个完整的频繁序列, 而且FFSPAN算法每次扫描的数据库都是迅速减小的, 这使得算法在挖掘的序列模式越长时越有效. 在标准测试数据集上的实验结果表明, FFSPAN算法非常有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号