首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
给出了一个基于约束的关联规则挖掘算法,首先依赖加权支持度产生频繁项目集,然后利用兴趣度产生关联规则,并对过滤掉的频繁项目集进一步分析发现包含负项集的关联规则。  相似文献   

2.
提出一种有效的基于频繁闭项目集的关联规则挖掘算法RIFCI.该算法采用挖掘频繁项目闭集取代传统的频繁项目集,同时在项目集和事务集中展开搜索.通过对UCI机器学习库中10个数据集的测试,与工业标准C4.5比较,错误率低于19.48%,在准确度不变的情况下,生成规则数目低于传统算法,提高了算法的效率.  相似文献   

3.
关联规则挖掘的AprioriTid算法的改进   总被引:1,自引:0,他引:1  
关联规则挖掘是数据挖掘中常见的一种形式。高效地找出频繁项目集是关联规则挖掘的中心问题.文章在分析生成频繁项目集的AprioriTid算法的基础上,指出了算法中存在由于项目的重复存储而使数据量偏大的问题,提出并证明了“Ck—l中支持率小于minsupport的项目集在Ck-1中是无用的”的定理。并以此为依据改进了算法.实验表明,改进算法在缩小数据规模方面是行之有效的.  相似文献   

4.
在大型数据关联规则开采过程中,采用动态项目集计算算法寻找大项目集,以空间换取时间方案提高执行效率,同时,用坚信度作为构造关联规则的依据,更好地反映逻辑上的因果关系。  相似文献   

5.
数据挖掘中关联规则的研究与论证   总被引:2,自引:0,他引:2  
数据挖掘由一些大型零售机构面临的“决策支持”问题所激发。对数据挖掘中的关联规则的概念和作用进行了探讨,对关联规则中寻找大项集的部分用程序流程的方式加以说明,对自连接操作的提高效率问题加以论证。通过例子说明了数据挖掘关联规则中最大项目集的子集必为最大项目集。  相似文献   

6.
关联规则挖掘中的关联推理   总被引:3,自引:0,他引:3  
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的。现基于覆盖运算,讨论已知关联规则可导出其它关联规则,并指出存在能覆盖全部关联规则的最小规则集。  相似文献   

7.
 关联规则挖掘能使我们发现数据库中大量项目与项目之间的相关关系,但是用传统关联规则生成方法所生成的规则一是数量庞大,二是其中包含许多具有相同意义的规则,这必然对用户理解和提取信息带来干扰.通过求封闭项目集大大消减了频繁项目集数量,再由封闭项目集构造一种新的存储机制——-近似格,基于近似格可以得到冗余度较小的关联规则,从而提供用户简洁紧凑又无信息丢失的关联规则集.  相似文献   

8.
基于数组的频繁项目集的挖掘算法   总被引:4,自引:0,他引:4  
挖掘关联规则是数据挖掘研究的一个重要方面.然而,目前提出的算法仍存在一些问题,如复杂的数据结构、大量的候选频繁项目集生成等等.本文提出使用了一种简单的数据结构——数组,并提出了基于数组的一种新的频繁项目集的挖掘算法.  相似文献   

9.
考虑事务数据库D长度不变、项目集I发生变化并且带有权重时的关联规则挖掘问题,提出了一种针对项目集增加的加权关联规则更新算法,解决了增加项目集的加权关联规则更新问题,与对新数据库重新运行算法相比,其运行效率有显著提高.  相似文献   

10.
基于规则的推荐技术在数据集上挖掘项目关联和用户关联为当前用户做推荐.用户关联挖掘是使用用户关联进行推荐的关键.首先证明在整个数据集上挖掘到的关于当前用户的用户关联集是只在包含当前用户评价的数据集上挖掘到的关于当前用户的用户关联集的子集,提出基于两阶段计数的用户关联挖掘框架,然后应用概念格技术实现了基于两阶段计数的用户关联挖掘算法,并通过实验表明该算法具有更好的性能.  相似文献   

11.
Typical association rules consider only items enumerated in transactions. Such rules are referred to as positive association rules. Negative association rules also consider the same items, but in addition consider negated items (i. e. absent from transactions). Negative association rules are useful in market-basket analysis to identify products that conflict with each other or products that complement each other. They are also very convenient for associative classifiers, classifiers that build their classification model based on association rules. Indeed, mining for such rules necessitates the examination of an exponentially large search space. Despite their usefulness, very few algorithms to mine them have been proposed to date. In this paper, an algorithm based on FP tree is presented to discover negative association rules.  相似文献   

12.
探讨了Web挖掘的相关理论,包括Web文本信息的表示及特征提取,关联规则分析和信息分类,综合Web挖掘的关键技术,提出了一个基于Web挖掘技术的信息分类模型系统,使用户能够对已分类的资源进行浏览、检索,从而更方便、快捷地获取所需信息。  相似文献   

13.
网络数据包安全指标关联规则挖掘应用与研究   总被引:2,自引:2,他引:0  
对网络通信中,安全指标间关联规则的挖掘速度缓慢问题进行研究。网络通信数据的高容量、多样性和复杂性,使网络安全指标间关联规则挖掘的信息处理难度较高、时间效率低,为此提出一种基于并行FP-树频集算法的关联规则数据挖掘方法并成功应用于网络通信的安全指标挖掘中。首先对网络通信数据进行Netflow流量数据采集,对其进行预处理以信息熵的形式存储。然后将频集压缩到频繁模式树上,再引入并行算法在多个处理器上为频繁模式树的节点创建条件模式库和条件模式树,在不同的并行处理器上进行同时处理,最后生成反映网络安全信息的关联规则。该方法提高了网络信息安全指标间关联规则挖掘的效率,在同样的支持度阈值和置信度阈值的条件下,可减少处理时间4~7 s。  相似文献   

14.
模因论对英语口语教学的启示   总被引:2,自引:0,他引:2  
模因论(Memetics)是基于新达尔文进化论观点解释文化进化规律的新理论,它是语用学的一个新理论。从模因论的角度来看,语言模因揭示了语言发展规律,也为外语教学提供了可供借鉴的理论依据和方法,启示我们重新反思我们的外语教学。在英语口语教学方面,我们有必要重视如背诵、模仿、联想等创造性的使用语言,以及重视语言输入的学习资料。  相似文献   

15.
王现君  高莉 《河南科学》2007,25(6):988-991
通过加权平均算法(ML_TWA)发现多层关联规则.该算法针对现有多层关联规则挖掘中存在阈值定义不合理的情况,依据多层数据的特点,提出了一种加权平均阈值估计方法,来提高挖掘效率和结果的准确性.实验结果证明这种算法是有效的.  相似文献   

16.
指出了时序关联规则在支持度度量上的不足,存在处理高密度海量数据时往往要耗费大量的时间处理规模巨大的频繁候选集,同时需要多次重复扫描数据库,执行效率低等问题,提出了重新定义支持度度量方法的时序关联规则.针对时序关联规则在解决项分类时涉及到的分层不确定、不准确情形,引入了基于隶属度的模糊层次分类结构,定义了项间距离、项集间距离,最终得到一种新的关联规则间距离的度量方法.实现了模糊层次分类,将时序关联规则结果进行聚类分析,得到规则和规则之间相似性,实验验证了该方法的有效性.  相似文献   

17.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

18.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

19.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

20.
为了解决缺省关联规则的增量挖掘问题,在算法DRMBAR的基础上,结合粗糙集理论及频繁模式树结构,提出了一种基于关联规则的缺省规则更新算法IADRBAR,该算法主要考虑最小支持度发生变化时缺省规则的更新问题,即在新的最小支持度下,如何高效地生成新的关联规则. IADRBAR在最坏的情况下仅须扫描决策表一遍,并利用上一次已经挖掘出的频繁项目集及关联规则,有效地提高缺省规则的更新效率.理论分析和实验结果表明算法是有效可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号