首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
关联规则的挖掘是数据挖掘领域的重要研究内容之一.关联规则的挖掘算法大都在用户设置的支持度阈值的限制条件下,挖掘出数据属性之间的关系.但是没有相关领域的专门知识,用户很难设置合适的支持度阈值得到合适的结果.本文在Apriori算法的基础上,提出一种无支持度的关联规则挖掘方法.  相似文献   

2.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

3.
对基于商品分类信息的多层关联规则挖掘进行了深入研究,提出了一种改进的基于商品分类信息的多层关联规则挖掘算法,该算法可以有效提高其挖掘性能。  相似文献   

4.
提出了一种分布式多层关联规则算法,并给出了相关算法描述及算法实现方法,讨论了如何将分布式多层关联规则算法应用于大学图书馆图书流通量挖掘中,以达到优化图书馆藏结构的目的.  相似文献   

5.
针对传统数据挖掘技术的劣势,提出一种以利润为基础的约束关联规则挖掘算法.在使用关联规则进行数据挖掘之前,算法按照商品利润的权重信息对购物篮中的原始商品交易信息实施预处理,可以使后续的数据关联规则挖掘更加的精确可靠,提升数据挖掘的效果.结果表明:基于利润的约束关联规则挖掘算法对数据库的原始数据实施了利润约束修正,增加了利润加权阈值,可有效提升数据挖掘算法的知识挖掘性能.  相似文献   

6.
空间跨层关联规则挖掘算法的研究   总被引:1,自引:0,他引:1  
在空间关联横向挖掘中,针对现有基于空间事务的挖掘算法不能快速地挖掘空间跨层关系,提出一种空间跨层关联规则挖掘算法,其适合在空间关联横向挖掘中提取空间跨层关联规则;该算法将空间事务的跨层关系转换为整数,采用自顶向下搜索策略,按非频繁项对应的属性位数递减的方式产生候选频繁项,有效地提高挖掘效率;在提取空间跨层关联规则时,实验证明它是快速的.  相似文献   

7.
基于关联规则挖掘技术,结合销售数据特征,提出了一个基于SQL的多层关联规则挖掘算法,允许用户自定义概念层次.实验结果表明,该算法可行且有效,有良好的用户交互性,能够支持品类管理中高效陈列和促销的应用.  相似文献   

8.
利用Rough集理论中关于等价类的概念,提出了单维布尔关联规则问题挖掘算法,考虑到关联规则设定单一最小支持度阈值的局限性,提出使用多个最小支持度的办法进行频繁项集的发现,利用兴趣度对单维布尔关联规则进行评价.  相似文献   

9.
基于.NET架构和数据仓库技术开发经理人决策支持平台,使用多层关联规则算法挖掘购物小票的频繁项集,发现顾客的购物模式,为超市货架陈列优化提供帮助。文章分析了决策支持平台的体系设计,多层关联规则挖掘模型的设计,最后进行频繁项集和规则的挖掘示例,并给出超市货架陈列的优化建议。  相似文献   

10.
在分析广义关联规则基本模型和求解在规则的基本性质基础上,提出一个新的基于关系操作的挖掘广义关联规则算法,该算法既使用了成熟的关系操作又充分利用先验,在多概念层上交互挖掘关联规则,有很好的实用性。  相似文献   

11.
为了表示复杂庞大的概念层次树,文中提出了一种更加通用的编码方案,将概念分层应用于模糊关联规则的挖掘.此外,为解决隶属度函数难以主观确定的问题,引入一种SOFM网络来确定样本数据的隶属度函数.基于改进的概念层次树的编码方案和SOFM网络,将模糊集引入关联规则挖掘中,设计了一种新的多层模糊关联规则挖掘算法.实验结果表明,该算法可以有效地挖掘出易于理解的、有意义的多层次模糊关联规则,具有很好的效率和伸缩性.  相似文献   

12.
关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率.  相似文献   

13.
张志锋 《科学技术与工程》2012,12(26):6640-6643
如何有效地从具有连续属性的数据中挖掘关联规则,是目前数据挖掘领域的一个研究热点。论文基于遗传算法,提出了一个连续属性关联规则挖掘方法。在该方法中,首先采用三段式编码将连续属性离散化、属性约简和规则提取集成在一起,然后将小生境引入到遗传算法中,以避免早熟、提高挖掘效率。实验表明,该方法是有效的。  相似文献   

14.
随着数据挖掘技术的不断改进和数据挖掘工具的不断完善,数据挖掘必将在各行各业中得到广泛的应用.该文首先介绍数据挖掘的常用模式和常用的解决方案,并着重介绍关联规则、多层和多维规则以及聚类分析在商务中的应用.  相似文献   

15.
联机分析处理与关联规则挖掘的集成化模型研究   总被引:2,自引:0,他引:2  
通过分析关联规则挖掘和联机分析处理(OLAP)的特点,提出了一种联机分析处理与关联规则挖掘的集成化模型,并给出了其代数结构描述;在此基础上,提出了一种基于OLAP的关联规则挖掘理论,从而为简化挖掘步骤,提高挖掘效率奠定了理论基础;使用超市的实际数据进行实验分析,验证了该模型及其挖掘理论的正确性和可行性.  相似文献   

16.
关联规则挖掘是数据挖掘技术的一种简单又很实用的方法,有着广泛的应用。该文利用部分支持度树的结构提出了对关联规则的增量式更新算法,用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。实验结果表明,该算法能有效地解决关联规则的更新问题,提升挖掘效率。  相似文献   

17.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

18.
针对传统数据挖掘方法时间开销大的问题,提出一种新的多层次分布式网络数据挖掘改进方法,给出多层次分布式网络结构。介绍了常用的随机扰动数据挖掘方法,通过概率歪曲技术完成对多层次分布式网络中原始数据集的扰乱处理,对项集的实际支持度进行重构,经概率转换获取数据挖掘结果。随机扰动方法具有时间效率低的弊端,在时间复杂度要求较低的情况下,通过XMASK方法对随机扰动方法进行改进;在时间复杂度要求较高的情况下,给出相应的改进过程。对提出的多层次分布式网络数据挖掘方法进行实验测试,结果表明,该方法准确性高、挖掘时间短、效果优。  相似文献   

19.
针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。  相似文献   

20.
网络数据包安全指标关联规则挖掘应用与研究   总被引:2,自引:2,他引:0  
对网络通信中,安全指标间关联规则的挖掘速度缓慢问题进行研究。网络通信数据的高容量、多样性和复杂性,使网络安全指标间关联规则挖掘的信息处理难度较高、时间效率低,为此提出一种基于并行FP-树频集算法的关联规则数据挖掘方法并成功应用于网络通信的安全指标挖掘中。首先对网络通信数据进行Netflow流量数据采集,对其进行预处理以信息熵的形式存储。然后将频集压缩到频繁模式树上,再引入并行算法在多个处理器上为频繁模式树的节点创建条件模式库和条件模式树,在不同的并行处理器上进行同时处理,最后生成反映网络安全信息的关联规则。该方法提高了网络信息安全指标间关联规则挖掘的效率,在同样的支持度阈值和置信度阈值的条件下,可减少处理时间4~7 s。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号