首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法.该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程.算法只需扫描数据库一次,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点.又不同于BOM算法,挖掘频繁k_项目集时,需要进行 次k个向量的与运算.因此,BOFPV_MMFIA算法的效率明显高于Apriori、DMFIA及BOM算法.  相似文献   

2.
针对关联规则数据挖掘中频繁项目集的二次挖掘问题,提出了一种能够解决当最小支持度发生变化而交易数据库不变情况下进行二次挖掘的改进算法(UMSA)。该算法充分利用频繁项目集的特性,通过新的拼接方法来减少候选项目集的生成,在扫描交易数据库确定k维频繁项目集时,采用在交易数据库中剔除无用的交易,达到不断减小交易数据库规模的目的,克服了一些算法中存在的漏采现象,并在一定程度上解决了非确定性问题。通过举例说明该算法的执行过程及其算法的正确性和有效性,并对其性能进行了分析。  相似文献   

3.
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。  相似文献   

4.
基于关联规则的ABC库存分类方法   总被引:3,自引:0,他引:3  
库存管理是工业工程中普遍存在的基础管理,由于库存项目繁多,一般需要进行有重点的分类管理.ABC分类法一直被广泛应用于很多场合,其基础是将库存项目按照某类价值进行由高到低的排序,然后根据2-8原则分段划分ABC类型.然而,商品项目的价值不仅仅来源其自身的销售价值,还受到其它项目的影响,如"交叉销售"效应(cross-sal e effect).本文研究了在考虑交叉销售效应影响下的项目重要度评价问题,给出了一种基于关联规则的项目重要度评价指标,称为"期望金额占用",并在此基础上给出了新的库存 ABC分类方法.通过简单算例和benchmark数据集的计算,验证了算法的效率和效果.实验计算表明,新算法下的分类结果与传统ABC分类结果之间存在着不可忽略的较大差异.  相似文献   

5.
改进的增量式关联规则维护算法   总被引:4,自引:0,他引:4  
在分析现有的关联规则算法 IUA的基础上 ,指出了该算法的不足和错误之处 ,并加以改正 ,进而提出了一种改进的增量式更新算法 EIUA. EIUA算法解决了在数据库 D不变的情况下 ,当最小支持度和最小置信度二阈值发生变化时如何高效更新关联规则的问题 .实验分析表明了新算法的有效性和优越性.  相似文献   

6.
一种挖掘最大频繁子图的新算法   总被引:2,自引:0,他引:2  
如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一.由于其内在的计算复杂性,挖掘全部频繁子图非常困难,且得到的频繁子图过多,影响着结果的理解和应用.解决方案之一是挖掘最大频繁子图.在经典的Apriori算法的基础上,提出了一种挖掘最大频繁予图的新算法Apriori-MaxGraph.首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可以加速子图规范编码序列匹配的速度.其次,针对最大频繁子图,对候选子图的生成进行了规范.最后,采用双向搜索与剪枝策略,大大减小了搜索空间,提高了算法的效率,实验结果表明,Apriori-MaxGraph算法具有较高的挖掘效率.  相似文献   

7.
李伟  马萍  杨明 《系统仿真学报》2012,24(7):1378-1380
针对复杂分布式仿真系统实时精度分析困难以及分析方法较少的情况,提出了一种基于规则的仿真精度实时分析方法。首先概述了仿真精度和精度分析的概念;然后重点讨论了实时精度分析方法的原理,包括仿真事件及其关系的形式化描述方法,规则的表现形式,以及精度分析的流程和规则库设计;最后结合应用实例,给出结论及下一步研究方向。  相似文献   

8.
在大型数据库中 ,数据不是静止的 ,新的记录需要不断地增加到旧的数据库中 ,而从旧的数据库中挖掘出来的关联规则必须加以维护 ,为此提出了一种关联规则更新算法。该算法既能有效地利用已经发现的知识 ,又能减少数据库的扫描次数 ,同时只需产生少量候选集。实验表明 ,该算法的执行效率比现有的典型更新算法高 ,是一种有实际应用价值的、高铲的关联规则更新算法。  相似文献   

9.
以格论及位图索引技术为基础给出了一个新的频繁项目集发现算法.1)该算法利用有向图进行一次性数据预处理,在预处理过程中将数据库预先存贮为每个结点都用一个域来记录其支持度的项目集格,从而把复杂的频繁项目集的发现问题转化为图搜索问题,提高了频繁项目集发现过程的效率.2) 支持度计算是关联规则发现中I/O及计算开销都非常大,算法引入了位图索引技术,提高了项目集支持度的计算速度.存储完整位图需要较大空间,针对该问题算法对位图进行了分块管理并对其进行了有效的编码压缩;不仅可以有效地对原始位图进行有效压缩,另外也可以在较大程度上提高支持度的计算效率.最后,对算法进行了计算实验与分析.  相似文献   

10.
在超市等零售机构中,如何根据历史记录选择商品组合进行促销是一个重要的问题,这不仅需要考虑商品组合的直接收益,还要考虑该商品组合间交叉销售的效果而获得的间接效益.本文利用关联规则的特点,建立一个多目标优化模型.该模型把商品直接收益和由于交叉销售因素产生的间接利润作为两个独立的优化目标,并设计多目标遗传算法进行求解.为了增加种群多样性和提高算法搜索能力,加入个体修补,填充策略和局部搜索策略.最后,用实际零售数据集对该多目标优化模型和多目标遗传算法进行了验证.通过实验分析表明,这种多目标优化算法可以获得丰富信息,为决策者制定具有针对性营销策略提供比较全面的信息.  相似文献   

11.
Association rule mining plays an important role in knowledge and information discovery. Often for a dataset, a huge number of rules can be extracted, but many of them are redundant, especially in the case of multi-level datasets. Mining non-redundant rules is a promising approach to solve this problem. However, existing work (Pasquier et al. 2005, Xu & Li 2007) is only focused on single level datasets. In this paper, we firstly present a definition for redundancy and a concise representation called Reliable basis for representing non-redundant association rules, then we propose an extension to the previous work that can remove hierarchically redundant rules from multi-level datasets. We also show that the resulting concise representation of non-redundant association rules is lossless since all association rules can be derived from the representation. Experiments show that our extension can effectively generate multilevel non-redundant rules.  相似文献   

12.
针对大数据中的乱序数据缺少关联规则的问题,提出了一种动态调整的改进型BP 算法,运用了动态自适应结构调整机制,根据环境要求自适应调整网络训练结构,自动删除无效训练神经元,优化迭代训练过程;并在网络学习过程中动态调整网络参数中的三因子,即动量因子、权学习指数、阈学习指数,来达到加快学习响应速度、增强网络稳定性的目的. 仿真结果表明,通过动态自适应调整结构、动态调整三因子的改进型算法,能够获得更多的收敛次数,并能有效地提高收敛率,进而提高整体网络性能.  相似文献   

13.
一种关联规则增量更新算法   总被引:6,自引:0,他引:6  
针对一个新的事物数据库加到原有的事务数据库中,在最小支持度和最小置信度都不变的情况下相应关联规则的更新问题,提出了一种简单高效的增量式关联规则挖掘算法。该算法从集合的角度出发,将事物数据库分为频繁项集集合和非频繁项集集合,从而在两个事务数据库可能出现的关系中,准确找出能够生成新的频繁项集的集合。在此基础上,利用给出的算法能够较为容易地发现新的关联规则。最后,分析了此算法的优越性。  相似文献   

14.
1 .INTRODUCTIONWiththewideapplicationofdatabasetechniquesanddatabasemanagementsystem ,datastorageindatabasehassharplyincreased .Thedataminingisjusttodiscovereffective ,novel,potentiallyvaluableknowledgefromthesedata .Associationruleisanim portantmeansinda…  相似文献   

15.
Extraction of interesting and general spatial association rules from large spatial databases is an important task in the development of spatial database systems. In this paper, we investigate the generalization-based knowledge discovery mechanism that integrates attribute-oriented induction on nonspatial data and spatial merging and generalization on spatial data. Furthermore, we present linguistic cloud models for knowledge representation and uncertainty handling to enhance current generalization-based method. With these models, spatial and nonspatial attribute values are well generalized at higher-concept levels, allowing discovery of strong spatial association rules. Combining the cloud model based generalization method with Apriori algorithm for mining association rules from a spatial database shows the benefits in effectiveness and flexibility.  相似文献   

16.
针对信用分类数据集中常见的高维性特征,本文基于特征袋装法和关联规则挖掘算法,构建了新的赋权特征选择集成模型AR-WSAB.该模型能根据频繁项集的支持度和置信度,对各特征的重要度进行测度,进而选择出各特征子集,训练子分类器,再通过集成得到最终结果.通过在贷款违约预测数据集上进行实证分析,结果表明该模型分类正确率相对于Bagging集成模型和PCA算法都有显著优势,所提方法能够有效处理高维性特征,并且在各分类算法上都具有普适性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号