共查询到19条相似文献,搜索用时 62 毫秒
1.
针对分布式数据库和约束条件的特点,提出了2种在分布式环境下挖掘约束性关联规则的有效算法,即基于Apriori算法的DMAIC算法和基于频繁模式树的DAMICFP算法.此外,进行了实例验证和测试分析,指出了这2种算法各自的优缺点及适用条件.研究结果表明:DMAIC算法可靠性高,通信协议简单,适用于对通信性能要求不高的分布式数据库;DAMICFP算法执行效率高,通信性能好,适用于对通信性能要求较高的多项目分布式数据库;这2种算法均能有效地解决分布式挖掘约束性关联规则的问题. 相似文献
2.
定量关联规则的挖掘 总被引:2,自引:0,他引:2
聂永红 《广西大学学报(自然科学版)》2000,25(4):316-319
介绍在关系数据库中包含定量和范围属性关联规则的挖掘问题,给出一些定义和方法,引人局部完备性来度量由于划分而引起大量信息的丢失程序,决定是否划分一个定量属性及划分数。 相似文献
3.
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系 ,利用该关系设计分布数据库关联规则挖掘算法 .该算法的局部频繁集挖掘利用FP -树实现 ,不需生成候选频繁集 ,全局频繁集在局部频繁集基础上直接生成 ,不需重新扫描各局部数据库 ,不会造成过度的网络通信开销 ,具有很好的挖掘效率 相似文献
4.
在分析广义关联规则基本模型和求解在规则的基本性质基础上,提出一个新的基于关系操作的挖掘广义关联规则算法,该算法既使用了成熟的关系操作又充分利用先验,在多概念层上交互挖掘关联规则,有很好的实用性。 相似文献
5.
关联规则挖掘中的关联推理 总被引:3,自引:0,他引:3
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的。现基于覆盖运算,讨论已知关联规则可导出其它关联规则,并指出存在能覆盖全部关联规则的最小规则集。 相似文献
6.
关联规则挖掘算法研究 总被引:5,自引:0,他引:5
本文论述了关联规则的基本概念、分类、基于频繁项集思想的关联规则挖掘算法——Apriofi算法,以及在基础上对Apfiofi算法的各种改进算法。然后对基于非频繁项集的各种关联规则挖掘算法,多维多层次挖掘算法思想进行了讨论。最后指出了关联规则挖掘的未来研究方向。 相似文献
7.
在原有的关联规则挖掘算法的研究中,认为所有的属性的重要程度相同,提出标准加权关联规则的挖掘算法,能够解决因属性重要程度不一样带来的问题。 相似文献
8.
基于数据库约简的关联规则挖掘算法 总被引:7,自引:0,他引:7
通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法ApioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.ApioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中. 相似文献
9.
在高校图书馆进行数字化建设的今天,图书馆个性化服务已成为迫切需要。高校图书馆开展个性化服务的一个关键之处是如何有效自动获取读者的个性化信息需求,从而指导个性化服务。使用关联规则技术对图书馆服务过程中产生的事务数据进行挖掘,能够全面获取各类型读者的信息需求模式。个性化服务系统通过学习这些需求模式知识,可以为读者提供准确的服务。 相似文献
10.
11.
在对分布式关联规则挖掘的三种主要算法:CD算法、DD算法及FD算法的原理及实现步骤进行详细的阐述的基础之上,得出其各自的优缺点,并指出FD算法在网络通信效率和算法灵活性方面更具有优越性。 相似文献
12.
提出一种基于AprTidRec算法的分布武关联规则挖掘算法,并通过实验验证了算法运行的有效性。给出基于局部一全局通信模式的分布式关联规则挖掘方案,并在此方案基础之上进行了系统实现。 相似文献
13.
提出了一种分布式关联规则增量更新算法(IUAAR),它可对数据库发生变化的情况进行归类.该算法主要采用改进了的FP树结构,通过传送被约束子树来挖掘全局频繁项目集,并充分利用快速分布式挖掘算法建立的各局部FP树,只对新增加了的全局频繁项目修改相应的改进FP树,挖掘其对应的被约束子树,同时利用已挖掘的全局频繁项目集对原全局频繁项目对应的被约束子树进行有效修剪.实验结果表明,该算法的运算速度比快速分布式挖掘算法提高了1倍,在最坏的情况下,对各局部数据库也仅需要扫描一遍,从而可提高数据库的维护效率. 相似文献
14.
提出了在分布式环境下对于每一层使用不同支持度的时态关联规则挖掘问题及其算法DMARM。该算法使用轮询方法处理分布式系统中各个节点间的通讯问题,在各个节点上利用集合“或”和“与”运算,在求候选频繁模式的同时求出了模式的支持度,减少了数据库的扫描次数。 相似文献
15.
曹文梁 《东莞理工学院学报》2014,(3):35-40
数据挖掘本质上是一种新的商业信息处理技术,通过对数据进行统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识,用以指导高级商务活动。由于需要,对数据间的关联性的数据挖掘算法模型已成为数据库及相关领域的一个研究热点,给出了一种基于分布式数据库的挖掘模型及其相应的一种有效的挖掘算法,其由若干个站点集合而成,各个站点拥有各自的数据库、中央处理机、客户端,以及各自的局部数据库管理系统,依靠通讯网络连接。采用购物篮分析式关联规则,将各个数据库文件的数据合成,从而得到挖掘结果,对挖掘的方法又进一步挖掘,即将不满足条件的规则重新传送到各分布式站点上进行更加精确的挖掘处理,从而避免了频繁的网络通讯。该算法在减轻网络频繁的通讯负担,体现并行计算以及异构数据挖掘方面具有独特优点。 相似文献
16.
17.
本文介绍了关联规则的概念,关联规则挖掘的方法;分析了Apriori算法的核心方法,以及基于Apriori算法的改进方法,提出关联规则的价值衡量方法和关联规则挖掘今后进一步的研究方向。 相似文献
18.
通过加权平均算法(ML_TWA)发现多层关联规则.该算法针对现有多层关联规则挖掘中存在阈值定义不合理的情况,依据多层数据的特点,提出了一种加权平均阈值估计方法,来提高挖掘效率和结果的准确性.实验结果证明这种算法是有效的. 相似文献
19.
关联规则挖掘中的关联推理 总被引:1,自引:0,他引:1
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的.现基于覆盖运算,讨论已知关联规则可导出其它关联规则,并指出存在能覆盖全部关联规则的最小规则集. 相似文献