首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法.该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程.算法只需扫描数据库一次,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点.又不同于BOM算法,挖掘频繁k_项目集时,需要进行 次k个向量的与运算.因此,BOFPV_MMFIA算法的效率明显高于Apriori、DMFIA及BOM算法.  相似文献   

2.
以格论及位图索引技术为基础给出了一个新的频繁项目集发现算法.1)该算法利用有向图进行一次性数据预处理,在预处理过程中将数据库预先存贮为每个结点都用一个域来记录其支持度的项目集格,从而把复杂的频繁项目集的发现问题转化为图搜索问题,提高了频繁项目集发现过程的效率.2) 支持度计算是关联规则发现中I/O及计算开销都非常大,算法引入了位图索引技术,提高了项目集支持度的计算速度.存储完整位图需要较大空间,针对该问题算法对位图进行了分块管理并对其进行了有效的编码压缩;不仅可以有效地对原始位图进行有效压缩,另外也可以在较大程度上提高支持度的计算效率.最后,对算法进行了计算实验与分析.  相似文献   

3.
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。  相似文献   

4.
基于关联规则的ABC库存分类方法   总被引:3,自引:0,他引:3  
库存管理是工业工程中普遍存在的基础管理,由于库存项目繁多,一般需要进行有重点的分类管理.ABC分类法一直被广泛应用于很多场合,其基础是将库存项目按照某类价值进行由高到低的排序,然后根据2-8原则分段划分ABC类型.然而,商品项目的价值不仅仅来源其自身的销售价值,还受到其它项目的影响,如"交叉销售"效应(cross-sal e effect).本文研究了在考虑交叉销售效应影响下的项目重要度评价问题,给出了一种基于关联规则的项目重要度评价指标,称为"期望金额占用",并在此基础上给出了新的库存 ABC分类方法.通过简单算例和benchmark数据集的计算,验证了算法的效率和效果.实验计算表明,新算法下的分类结果与传统ABC分类结果之间存在着不可忽略的较大差异.  相似文献   

5.
在线挖掘数据流滑动窗口中频繁闭项集   总被引:2,自引:0,他引:2  
在线挖掘滑动窗口中的频繁闭项集是一类重要的数据流挖掘问题.提出了一种新的频繁闭项集挖掘算法FPCFI-DS.该算法能够在有限的存储空间中高速挖掘数据流滑动窗口中的频繁闭项集,并且能够在任意时刻维护当前窗口中精确的频繁闭项集.对于第一个窗口中的数据,FPCFI-DS算法采用单遍过程FPCFI进行挖掘,挖掘结果被保存于一棵全局闭项集树GCT中.当窗口向前滑动时,FPCFI-DS算法采用更新挖掘方式快速挖掘出当前窗口中的频繁闭项集.实验结果表明,FPCFI-DS算法的空间效率和时间效率都显著优于同类经典算法Moment.  相似文献   

6.
提出了通过逻辑蕴涵的演绎规则来构建频繁项集的简洁表示,而不是挖掘所有的频繁项,来降低频繁项集中的冗余性,并利用演绎规则来构建所有频繁项集的简洁表示,从而减少存取数据库和对项集进行计数的次数,最终提供一个更加紧凑的频繁项集输出.最后,通过试验说明了该方法的有效性.  相似文献   

7.
目前,我国基于交易上报制度和静态数据挖掘的可疑金融交易识别方法存在着监测覆盖面窄、识别时效性差两大瓶颈问题。一种可行的改进是在现有方法中引入对可疑金融交易的动态识别,其中需解决的关键问题是如何及时有效地从大规模动态数据集中发现相应的可疑交易特征。设计一种基于数据流频繁子图挖掘的可疑关联特征动态识别算法,并用实验证明该算法的可行性和有效性。  相似文献   

8.
在线挖掘数据流滑动窗口中最大频繁项集   总被引:1,自引:0,他引:1  
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率.提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS.该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术-"子集等价剪枝技术",有效缩小搜索空间的大小.基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+.FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集.仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快.  相似文献   

9.
改进的增量式关联规则维护算法   总被引:4,自引:0,他引:4  
在分析现有的关联规则算法 IUA的基础上 ,指出了该算法的不足和错误之处 ,并加以改正 ,进而提出了一种改进的增量式更新算法 EIUA. EIUA算法解决了在数据库 D不变的情况下 ,当最小支持度和最小置信度二阈值发生变化时如何高效更新关联规则的问题 .实验分析表明了新算法的有效性和优越性.  相似文献   

10.
基于关联规则的购物篮分析对实体或在线零售企业改善品类管理、优化门店布局陈列、实现关联促销与推荐等起着重要作用. 本文针对企业需求,应用邻接矩阵和截矩阵技术,提出了挖掘商品关联性的AC算法和进一步求频繁k-项集的M-AC算法,证明了这类方法运算简单,应用成本低,具有记忆性质,当数据更新时,无须重新运算. 通过在零售企业的成功应用,论证了这种商品关联度分析方法的有效性.  相似文献   

11.
提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,该算法对稠密型数据集和稀疏型数据集均适用,并且特别适于挖掘具有长频繁项集的数据集。  相似文献   

12.
一种挖掘频繁模式的数据库划分新方法   总被引:3,自引:1,他引:2  
提出了一种新的数据库划分方法。该方法应用于需要产生候选项的频繁模式的挖掘过程,可以大大减少对数据库的扫描操作,提高数据挖掘效率,特别是对于较长模式的数据挖掘更是如此。该方法是将交易数据库按照交易的长度(或者说模式的长度)划分成若干个子数据库,将等长度的交易划分到同一个子数据库中,这样在获取候选项的支持度时,只需要扫描模式长度大于等于相应候选项长度的子数据库即可,从而减少了对数据库的扫描操作。给出了基于数据库划分的挖掘算法,通过理论推导和实验证明了该方法的有效性。  相似文献   

13.
一种关联规则增量更新算法   总被引:6,自引:0,他引:6  
针对一个新的事物数据库加到原有的事务数据库中,在最小支持度和最小置信度都不变的情况下相应关联规则的更新问题,提出了一种简单高效的增量式关联规则挖掘算法。该算法从集合的角度出发,将事物数据库分为频繁项集集合和非频繁项集集合,从而在两个事务数据库可能出现的关系中,准确找出能够生成新的频繁项集的集合。在此基础上,利用给出的算法能够较为容易地发现新的关联规则。最后,分析了此算法的优越性。  相似文献   

14.
频繁子图已成为数据挖掘领域研究的热点之一。在经典的Apriori算法的基础上,提出了一种图挖掘的新算法Apriori-Graph。首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可加速子图规范编码序列匹配的速度。其次,对候选子图的生成进行了规范。最后,针对频繁性检验这一瓶颈过程,给出了若干性质,从而较大地降低了候选子图频繁性判断的代价。实验结果表明,Apriori-Graph算法具有较高的挖掘效率。  相似文献   

15.
针对分布式系统,提出了自适应哈希链结构的频繁模式挖掘算法。该算法首先在每个站点产生局部频繁1-项集,再产生全局频繁1-项集,根据全局频繁1-项集产生各站点的投影数据库,在各个站点分别扫描投影数据库中的交易,并根据站点可用内存情况形成相应大小的哈希链结构。通过挖掘各站点的哈希链结构得到全局频繁项集。给出了基本步骤和挖掘算法。研究表明该算法不但效率高,而且适应性强。  相似文献   

16.
给出一个新的序列规则挖掘算法,该算法在挖掘规则以前将数据库预先存贮为序列邻接网络,在序列邻接网络中每个项目集顶点都有一个域来记录它的支持度,算法把频繁序列规则的发现问题转化为网络中的顶点搜索问题,大大提高了搜索过程的效率,为了有效地解决网络生成过程中的序列支持计算问题,采用了一种纵向的数据库表示格式。  相似文献   

17.
为了向驾驶者自动提供个性化的交通服务信息,需要对车辆行驶路径进行分析和预测.面向基于RFID的个性化交通服务系统,提出改进的车辆行驶路径关联规则挖掘方法,挖掘车辆历史行驶路径数据中的频繁序列模式,由频繁序列模式产生序列关联规则,根据当前行程车辆已行驶的路径,实现对车辆未来行驶路径的预测.本方法主要通过0-N数据结构和候选2-序列产生方法的改进,提高车辆行驶路径序列模式挖掘的效率.最后,通过数据测试验证了改进算法在运行效率上与GSP相比的性能优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号