首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
提出一种基于粗糙集理论和布尔矩阵的关联规则挖掘算法,作为对Apriori算法的改进,通过构造布尔矩阵,利用粗糙集划分等价类的方法对事务数据库的记录进行分类,然后通过等价类的取交或取并运算产生更高阶的频繁项目集,算法能有效减少数据库的扫描次数,实验表明算法在对事务数据库进行挖掘时显示出良好的性能.  相似文献   

2.
具有动态加权特性的关联规则算法   总被引:8,自引:1,他引:7  
基于FP_growth关联规则, 提出一种具有动态加权特性 的改进算法. 把事务数据库中的项目按其重要程度划分为5个等级; 运用层次分析(AHP)算法 构造判断矩阵, 计算特征向量; 将得到的向量作为权值, 与项目在事务数据库中出现的次数 综合考虑作为衡量重要程度的标准, 生成FP_tree; 最后得到频繁项目集和关联规则. 由于 权重的赋予过程可以由领域专家动态地改变, 这样不但能挖掘出更有意义的规则, 而且在算 法的运行初期就大量剔除了那些权重小的无用项目集, 从而大大提高了算法的运行效率.  相似文献   

3.
Apriori算法是当前使用最广泛的关联规则挖掘方法中最为经典的算法之一;但是该算法需要反复的扫描数据库,在L/O上花消很大,并且在得到频繁一2项集的过程中会产生庞大的候选一2项集,其次在筛选得到频繁一k项集时,并没排除那些不应该参组合的元素,而导致该算法效率很低,针对上面影响计算效率的三个方面提出基于压缩事务矩阵相乘得到频繁项目集的算法,只需一次扫描数据库,经过压缩处理产生产生事务矩阵,通过矩阵间运算得到频繁项目集,有效提高了关联规则的挖掘效率。  相似文献   

4.
现有算法实现了事务内到事务间最大频繁项目集的转换,能够直接发现不同用户之间的关联关系.但在处理较大的事务数据库时,由于是在原数据库基础上进行关联分析,产生了大量的虚假规则.针对上述问题提出一种基于聚类分析的事务间关联规则挖掘算法,利用聚类分析将初始的复杂的数据集进行约简,去掉冗余数据,缩小数据集,避免了多次扫描数据库和...  相似文献   

5.
关联规则(Association Rules)是数据挖掘的重要研究内容。本文提出了多层次关联规则的挖掘算法——MLIG,利用向量"或"和"与"运算求解频繁项目集(Frequent Itemset),该算法通过构建向量之间的关系矩阵,将频繁项目集的产生过程转化为项目集的关系矩阵中向量运算过程,大大提高了挖掘的效率和速度。算法只需扫描数据库一遍,克服了ML_T2L1及其相关算法产生大量候选集和需多次扫描数据库的缺点。实验结果表明,算法MLIG是非常高效的。  相似文献   

6.
在网络入侵检测系统中,数据挖掘往往面对的是不平衡数据集,而对不平衡数据集中少数类的挖掘是现在研究的热点.针对不平衡数据集中少数类的挖掘问题,提出了不平衡库关联规则挖掘算法(ARUD).算法首先构造一个知识联接强度矩阵,用来存储所有二项集的支持度计数,然后基于该矩阵挖掘满足最小说服度的所有关联规则,且ARUD算法仅需扫描整个事务数据库1次.采用了UCI数据库中4个典型的不平衡数据集,对比Apriori算法与CFP-Growth算法,ARUD算法能有效提取不平衡数据集中的少数类,并在数据挖掘运行时间和占用内存方面均有性能提升.  相似文献   

7.
关联规则算法是数据挖掘中的核心技术,本文给出了数据库中挖掘关系规则的一种新算法,该算法通过二次扫描,第一次将可能出现的频繁项目集加入到ISC中,第二次扫描采用逐步求精算法将频繁项目集加到项目集中,减少了数据库的扫描次数.  相似文献   

8.
为了提高关联规则数据挖掘的效率,在研究Apriori算法原理和相关文献的基础上,提出了一种基于高阶项目集的频繁项目集发现算法.本算法不同于逐层迭代的搜索方式,而是采用从求解所有的高阶频繁m-项目集入手的方式,来发现隐藏在事务数据库中的频繁项目集.本算法避免了大量的候选项目集的产生,并且对数据库仅需进行有限次数的扫描,从而体现了算法的高效性.  相似文献   

9.
FP—Growth算法是关联规则挖掘的一个经典算法。本文提出一种基于事务一项矩阵的挖掘算法MFP—Growth算法,利用向量矩阵表示事务数据库,整个挖掘过程只扫描一遍数据库,通过构造各个频繁项的条件矩阵,利用条件矩阵的向量运算来进行频繁模式的挖掘,减少了算法占用的内存空间,提高了挖掘效率.实验结果表明,MFP—Growth算法是有效可行的.  相似文献   

10.
产生频繁项目集是关联规则挖掘中的一个关键步骤.在对Apriori算法分析的基础上,提出了一种基于集合和位运算的频繁项目集挖掘算法.该算法用位视图表示使用了每个项目的事务,通过对位视图进行位运算来计算每个项目集的支持数,避免了Apriori算法中多次扫描数据库的问题.  相似文献   

11.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

12.
关联规则算法是数据挖掘中的核心技术 ,本文给出了数据库中挖掘关系规则的一种新算法 ,该算法通过二次扫描 ,第一次将可能出现的频繁项目集加入到ISC中 ,第二次扫描采用逐步求精算法将频繁项目集加到项目集中 ,减少了数据库的扫描次数  相似文献   

13.
基于聚类矩阵的CM—Apriori算法研究   总被引:1,自引:0,他引:1  
针对关联规则中Apriori算法的不足,提出了一种基于聚类矩阵的CM-Apriori新算法.该算法只需扫描事务数据库一次,就直接按事务项数生成聚类矩阵,每次只需对部分聚类矩阵进行运算,就可以生成频繁项集.这大大减少了扫描数据库的次数和计算成本,从而有效提高了算法的运算效率,并通过实例说明了它是一种有效的关联规则挖掘方法.  相似文献   

14.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率.  相似文献   

15.
一种基于关联规则的数据挖掘算法实现与应用   总被引:1,自引:0,他引:1  
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

16.
 针对现有拓扑关联规则挖掘算法不能够有效地提取长频繁约束拓扑关联规则,提出一种基于区间映射的约束拓扑关联规则挖掘算法,该算法适合挖掘带约束空间布局关系的长频繁拓扑关联规则;该算法用区间映射法的下行搜索策略产生候选频繁拓扑项目集,利用逻辑"与"运算计算拓扑关系事务的支持数.实验证明在挖掘长频繁约束拓扑项目集时,该算法比现有算法更快速更有效.  相似文献   

17.
研究分布式环境下约束性关联规则更新问题,包括数据库中事务增加和删除2种情况.引入向导集的概念,提出基于全局局部模式的约束性关联规则增量式更新算法DUCAR,其中包括局部约束性频繁项目集更新算法ULFC和全局约束性频繁项目集更新算法UGFC.该算法充分利用原先的挖掘结果提高更新效率,首先从最高维的频繁n项目集进行更新,在更新过程中考虑约束条件,结合剪枝算法,生成较少数量的满足约束条件的候选项目集.将该算法用Java加以实现,采用多组数据对此算法的性能进行测试,并与其他算法作对比实验,实验结果表明,该算法是高效可行的.  相似文献   

18.
考虑事务数据库D长度不变、项目集I发生变化并且带有权重时的关联规则挖掘问题,提出了一种针对项目集增加的加权关联规则更新算法,解决了增加项目集的加权关联规则更新问题,与对新数据库重新运行算法相比,其运行效率有显著提高.  相似文献   

19.
典型的关联规则仅考虑事务中所列举的项目,这样的规则主要是正关联规则.负关联规则不但要考虑事务中所包含的项目集,还要考虑事务中所不包含的项目,它有利于进行购物篮分析以发现那些相关的商品或互斥的商品.而已有的负关联规则挖掘的算法具有很大的局限性.为此,文中提出了一种基于位矩阵的负关联规则挖掘新算法.通过算例表明,该算法是有效可行的.  相似文献   

20.
提出一种有效的基于频繁闭项目集的关联规则挖掘算法RIFCI.该算法采用挖掘频繁项目闭集取代传统的频繁项目集,同时在项目集和事务集中展开搜索.通过对UCI机器学习库中10个数据集的测试,与工业标准C4.5比较,错误率低于19.48%,在准确度不变的情况下,生成规则数目低于传统算法,提高了算法的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号