首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法.该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程.算法只需扫描数据库一次,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点.又不同于BOM算法,挖掘频繁k_项目集时,需要进行 次k个向量的与运算.因此,BOFPV_MMFIA算法的效率明显高于Apriori、DMFIA及BOM算法.  相似文献   

2.
针对关联规则数据挖掘中频繁项目集的二次挖掘问题,提出了一种能够解决当最小支持度发生变化而交易数据库不变情况下进行二次挖掘的改进算法(UMSA)。该算法充分利用频繁项目集的特性,通过新的拼接方法来减少候选项目集的生成,在扫描交易数据库确定k维频繁项目集时,采用在交易数据库中剔除无用的交易,达到不断减小交易数据库规模的目的,克服了一些算法中存在的漏采现象,并在一定程度上解决了非确定性问题。通过举例说明该算法的执行过程及其算法的正确性和有效性,并对其性能进行了分析。  相似文献   

3.
频繁模式在许多数据挖掘任务中都起着十分关键的作用,现有的支持度计算方法存在着效率不高I、/O和时间开销较高等缺点.本文以提出了一种用多级位图目录来实现项集支持度计算的方法,给出了多级位图目录的结构和相应算法;对位图的组织采用了一种可伸缩的动态分块管理机制,在此基础上对位图进行了编码压缩(即以一个短码来替代一个长向量块),在较大程度上减少了对磁盘及主存空间的需求;最后,在实验的基础上对算法的性能进行了分析.基于多级位图目录的项集支持度计算算法具有结构简单、空间和时间开销小等优点.  相似文献   

4.
给出一个新的序列规则挖掘算法,该算法在挖掘规则以前将数据库预先存贮为序列邻接网络,在序列邻接网络中每个项目集顶点都有一个域来记录它的支持度,算法把频繁序列规则的发现问题转化为网络中的顶点搜索问题,大大提高了搜索过程的效率,为了有效地解决网络生成过程中的序列支持计算问题,采用了一种纵向的数据库表示格式。  相似文献   

5.
基于关联规则的ABC库存分类方法   总被引:3,自引:0,他引:3  
库存管理是工业工程中普遍存在的基础管理,由于库存项目繁多,一般需要进行有重点的分类管理.ABC分类法一直被广泛应用于很多场合,其基础是将库存项目按照某类价值进行由高到低的排序,然后根据2-8原则分段划分ABC类型.然而,商品项目的价值不仅仅来源其自身的销售价值,还受到其它项目的影响,如"交叉销售"效应(cross-sal e effect).本文研究了在考虑交叉销售效应影响下的项目重要度评价问题,给出了一种基于关联规则的项目重要度评价指标,称为"期望金额占用",并在此基础上给出了新的库存 ABC分类方法.通过简单算例和benchmark数据集的计算,验证了算法的效率和效果.实验计算表明,新算法下的分类结果与传统ABC分类结果之间存在着不可忽略的较大差异.  相似文献   

6.
基于网络的数值关联规则挖掘方法   总被引:2,自引:0,他引:2  
关联规则 ( Association Rules)发现的是属性间的关系 .属性可以是逻辑型的 ,也可以是数值型的 .在从逻辑型属性描述的数据中发现关联规则方面已经有许多比较成熟的算法 ,而在数值型属性方面则不然 .将数值关联规则挖掘问题映射成逻辑关联规则挖掘问题是一种方便有效的方法 .本文给出了一个新的数值属性关联规则挖掘算法 ,该算法利用数据本身的特征决定对数值属性值域的划分 ,进而将划分后的所有区间映射为逻辑属性 (项目 ) ,在此基础上可以挖掘出更容易理解、更具有概括性的有效关联规则 .本文给出了一个发现频繁项目集搜索算法 ,并采用一种纵向数据库格式来简化项目集支持度的计算.  相似文献   

7.
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。  相似文献   

8.
基于包含索引的频繁闭序列模式挖掘的新算法   总被引:1,自引:0,他引:1  
频繁闭序列模式惟一确定全体频繁序列模式,且规模小得多.传统的闭序列模式挖掘算法对每个频繁项目都进行扩展,往往会产生大量的非闭合序列.为解决这一问题,提出了一种新的基于包含索引的频繁闭序列模式挖掘算法,其主要思想是只对闭项集进行扩展,大大减少了非闭合序列的产生.首先,论证了闭序列模式只能由闭项集组成;其次,说明了如何利用包含索引来快速发现闭项集;最后,给出了一种深度优先的挖掘频繁闭序列模式的新算法.实验结果表明,该算法具有较高的效率.  相似文献   

9.
为提高项目集管理的有效性,提出了一种考虑资源调配灵活度的项目集缓冲监控方法.首先,基于项目集内部和外部不同资源的供应风险和延误风险,确定资源调配弹性风险指标;其次,基于确定的单项目缓冲和项目集缓冲,确定双层缓冲分配方案;最后,在项目集的执行过程中进行缓冲监控,根据缓冲消耗情况对后续缓冲计划进行调整.通过蒙特卡罗模拟实验对案例仿真,与经典的缓冲监控方法对比结果表明,本文方法通过有效的缓冲管理,降低了不确定性影响,提高了项目集工期和成本的综合绩效.  相似文献   

10.
排样图形预处理中的几个实用算法   总被引:4,自引:0,他引:4  
提出了一种基于位图排样的外包圆、外包矩形集、近似长短轴的计算方法;并将其应用于排样零件的编码中,提高检索所需图形的匹配速度;作为排样图形聚类和分类的图形特征依据,用于进行排样图形预处理;并给出了示例说明。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号