首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 546 毫秒
1.
关联规则研究综述   总被引:10,自引:0,他引:10  
关联规则挖掘是近年来数据挖掘研究中一个相当活跃的领域.本文给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式、最大频繁模式、并行/分布式挖掘及增量挖掘算法作了简单评述,着重介绍了近三年来发表的一些新算法,并对未来的发展趋势进行了预测和展望.  相似文献   

2.
提出一种有效的基于概念格的分布式挖掘算法,重点讨论由部分量化规则格提取的部分关联规则的合并技术,由于能对已存在关联规则的再利用,从而更有利于用概念格来挖掘关联规则.该算法根据对局部关联规则挖掘结果的分布式合成,有利于减轻网络频繁的通讯负担,体现并行计算、异步异构数据挖掘的优点.  相似文献   

3.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

4.
提出了一种分布式多层关联规则算法,并给出了相关算法描述及算法实现方法,讨论了如何将分布式多层关联规则算法应用于大学图书馆图书流通量挖掘中,以达到优化图书馆藏结构的目的.  相似文献   

5.
提出一种基于AprTidRec算法的分布武关联规则挖掘算法,并通过实验验证了算法运行的有效性。给出基于局部一全局通信模式的分布式关联规则挖掘方案,并在此方案基础之上进行了系统实现。  相似文献   

6.
针对分布式数据库和约束条件的特点,提出了2种在分布式环境下挖掘约束性关联规则的有效算法,即基于Apriori算法的DMAIC算法和基于频繁模式树的DAMICFP算法.此外,进行了实例验证和测试分析,指出了这2种算法各自的优缺点及适用条件.研究结果表明:DMAIC算法可靠性高,通信协议简单,适用于对通信性能要求不高的分布式数据库;DAMICFP算法执行效率高,通信性能好,适用于对通信性能要求较高的多项目分布式数据库;这2种算法均能有效地解决分布式挖掘约束性关联规则的问题.  相似文献   

7.
在相关矩阵理论的研究基础上,将网格与Web服务技术融合,以分布式问题求解环境和开源数据挖掘类库weka为底层支撑,构建了网格环境下面向服务的分布式数据挖掘体系,提出一种基于矩阵的分布式关联规则算法.该算法不需要进行复杂的寻找频繁项集的过程,直接通过关联矩阵就可以判断出,给出了算法的理论证明,并通过实例验证了算法的正确性、有效性和体系结构的可行性,对于解决分布式关联规则挖掘问题有了一个新的突破.  相似文献   

8.
正关联规则与负关联规则有着同样重要的作用,而传统的关联规则算法只能挖掘正关联规则.本文对关联规则的相关度进行判断,并在此基础上提出了一个能同时挖掘正负关联规则的算法,实验证明改进算法是有效的.  相似文献   

9.
数据挖掘技术在试题质量评价中的应用   总被引:1,自引:0,他引:1  
介绍了关联规则基本概念及Apriori算法,分析了关联规则挖掘在试题评价中存在的不足,提出了一种基于信息量的关联规则挖掘改进算法ARMABI.实验结果表明,该算法性能明显优于传统的关联规则挖掘算法,具有较高的推广价值.并且,对下一步工作进行了展望.  相似文献   

10.
基于FP-Growth算法,提出一种并行加权的关联规则挖掘(PWARM)算法,证明其满足加权向下封闭性.使用MapReduce计算模型,在分布式集群中并行挖掘出关联规则.实验结果表明:该算法可以满足数据权重不同的需求,且在处理大数据集时能有效地提高挖掘的效率.  相似文献   

11.
分布数据库关联规则挖掘   总被引:4,自引:0,他引:4       下载免费PDF全文
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系 ,利用该关系设计分布数据库关联规则挖掘算法 .该算法的局部频繁集挖掘利用FP -树实现 ,不需生成候选频繁集 ,全局频繁集在局部频繁集基础上直接生成 ,不需重新扫描各局部数据库 ,不会造成过度的网络通信开销 ,具有很好的挖掘效率  相似文献   

12.
主从关系数据库中关联规则挖掘算法研究   总被引:1,自引:1,他引:0  
数据挖掘是计算机科学研究的重要领域之一.文章从主从关系数据集的角度开展关联规则挖掘研究,首先构建了主从关系数据库模型,在此基础上提出一种基于元组ID逆传输的关联规则挖掘算法(TIDRP),避免了挖掘过程中数据的集成过程,减少了资源的消耗,并使挖掘出的规则更符合实际情况.  相似文献   

13.
提出了在分布式环境下对于每一层使用不同支持度的时态关联规则挖掘问题及其算法DMARM。该算法使用轮询方法处理分布式系统中各个节点间的通讯问题,在各个节点上利用集合“或”和“与”运算,在求候选频繁模式的同时求出了模式的支持度,减少了数据库的扫描次数。  相似文献   

14.
数据挖掘本质上是一种新的商业信息处理技术,通过对数据进行统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识,用以指导高级商务活动。由于需要,对数据间的关联性的数据挖掘算法模型已成为数据库及相关领域的一个研究热点,给出了一种基于分布式数据库的挖掘模型及其相应的一种有效的挖掘算法,其由若干个站点集合而成,各个站点拥有各自的数据库、中央处理机、客户端,以及各自的局部数据库管理系统,依靠通讯网络连接。采用购物篮分析式关联规则,将各个数据库文件的数据合成,从而得到挖掘结果,对挖掘的方法又进一步挖掘,即将不满足条件的规则重新传送到各分布式站点上进行更加精确的挖掘处理,从而避免了频繁的网络通讯。该算法在减轻网络频繁的通讯负担,体现并行计算以及异构数据挖掘方面具有独特优点。  相似文献   

15.
分布式数据库的关联规则更新算法   总被引:1,自引:0,他引:1  
提出一种分布式数据库的频繁项目集更新算法.该算法主要考虑分布式数据库记录总数不变,增加新项目集后的频繁项目集更新情况.算法排除原数据库已挖掘的频繁项目集,减少了各站点候选频繁项目集数目,同时减少了各站点之间传送的频繁项目集数目,减少网络流量,提高了频繁项目集挖掘的效率.通过理论分析,该算法比FDM算法效率高,并通过实例和实验证明了算法的有效性和可行性.  相似文献   

16.
一种基于可信度最优的数量关联规则挖掘算法   总被引:2,自引:0,他引:2  
研究了数量关联规划挖掘过程中的连续属性离散化问题,描述了连续属性离散化方程,包括连续属性区间划分算法和数据库样本大小的确定,提出了基于可信度最优的数量关联规则挖掘算法。该算法首先利用等深度划分算法对连续属性进行离散化,然后利用凸包处理技术提取强规则中可信度最高的数量关联区间,它对于数量关联规则的优化有着重要的应用价值。应用该算法对股票行情进行了数量关联分析,提取股票涨跌与股票价格之间可信度最高的关联规则。实验表明该算法是非常有效的。  相似文献   

17.
基于时间段的时序规则发现   总被引:1,自引:0,他引:1  
时序规则挖掘用以挖掘数据库中与时间相关的规则及模式.现今大部分时序数据挖掘均是针对基于时间点的,基于时间段的挖掘相对较少.在此提出一个新的基于时间段的时序规则挖掘算法,通过挖掘频繁闭模式集取代完整频繁模式集,减少了挖掘时间,算法效率很高.  相似文献   

18.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号