首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
关联规则挖掘算法FP-Growth在挖掘大型数据库时,占用内存大、运行速度慢或根本无法构造基于内存的FP-tree。针对这些问题,文章提出一种适合于挖掘较大型数据库的新的关联规则挖掘算法DFP-Growth,新算法将数据库分解,然后对分解得到的各个数据库子集用FP-Growth算法进行约束频繁项集挖掘,以满足大型数据库挖掘的需求。  相似文献   

2.
目的解决在关联规则挖掘中存在大量无用的候选项集和频繁项集以及效率不高的问题。方法提出了一种基于十字链表的关联规则改进算法。结果利用用户给定的条件和剪枝算法减少了候选项集的数量,再遍历十字链表确定频繁项集,结果表明算法提高了挖掘效率。结论基于十字链表的关联规则改进算法避免了重复扫描数据库,提高了挖掘效率。  相似文献   

3.
提出了一种基于数字化的目标关联规则挖掘算法,适合于从大型数据仓库中挖掘出与特定目标相关的隐含规则.其基本原理是用二进制的形式将数据库事务转换成数字事务,并在以数字事务为记录的数据库中,运用二进制的逻辑"与"运算计算出目标的效用度、包含目标的数字事务支持度和置信度,形成数字化的目标关联规则,接着根据数据库中的属性值信息解释关联规则.此算法的原理简单,扫描数据库仅需一次,算法执行效率比基于Apriori和Disjunctive-free的算法有明显提高.  相似文献   

4.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

5.
关联规则挖掘是数据挖掘技术的一种简单又很实用的方法,有着广泛的应用。该文利用部分支持度树的结构提出了对关联规则的增量式更新算法,用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。实验结果表明,该算法能有效地解决关联规则的更新问题,提升挖掘效率。  相似文献   

6.
提出一种基于粗糙集理论和布尔矩阵的关联规则挖掘算法,作为对Apriori算法的改进,通过构造布尔矩阵,利用粗糙集划分等价类的方法对事务数据库的记录进行分类,然后通过等价类的取交或取并运算产生更高阶的频繁项目集,算法能有效减少数据库的扫描次数,实验表明算法在对事务数据库进行挖掘时显示出良好的性能.  相似文献   

7.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

8.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

9.
关联规则挖掘是数据挖掘中的一个重要课题,常用的Apriori 算法要多次扫描数据库,会产生大量的候选项集.利用向量的内积运算和逻辑运算提出了一种关联规则挖掘的改进算法.研究表明,该算法运算简单,只需要扫描一次数据库,不需要产生候选项集,且具有处理大型数据库的优点.  相似文献   

10.
在挖掘关联规则的过程中,关键步骤是产生频繁项集.基于频繁项集支持矩阵的思想,提出一种有效的频繁项集挖掘算法-FIMA,并给出了算法的基本设计思想和算法描述.本算法利用矩阵挖掘频繁项集,不需要产生候选项集,且只需扫描数据库一次。所以此算法是非常有效的.  相似文献   

11.
提出了一种使数据挖掘与数据库系统无缝集成的方案.该方案基于关联规则挖掘和关系数据库系统的通用查询算法,采用一种扩充的嵌套关系代数作为关联规则和其它数据查询的一种内部表达方式.通过一个典型实例展示了这种代数表达式.代数表达式也被表达为一种查询树,查询树中代数运算的公共操作序列模块化后,具有更多的灵活性,能方便地处理约束关联规则查询和其它各种关联规则描述.  相似文献   

12.
根据数据挖掘中关联规则的性质以及高校成绩管理数据库的自身特点,在经典关联规则算法Apriori算法的基础上提出了一种改进的算法——A 算法,并利用该算法对学生成绩管理数据库进行了关联规则挖掘,得到了隐含在数据库中的有用信息.  相似文献   

13.
在对数据库聚类分析的基础上进行分层抽样,并使用关联规则,得出了数据之间的潜在关系.同时,对网民健身情况调查数据进行了实证分析,在SQL Server 2005上实现了抽样后的关联规则挖掘,提高了关联的效率,并取得了良好的效果.另外,对关联规则的评估作了一定的改进创新.  相似文献   

14.
因初始项集中的数据特征相关,使关联规则Apriori算法的数据挖掘结果存在误差.为了解决这个问题,结合粗糙集理论(RST),提出一种改进的关联规则数据挖掘算法;然后,将该算法应用到软件工程风险因素和风险缓解因素管理分析中,提出一种新的软件工程适应性结构.仿真结果表明,该改进算法提高了挖掘数据的效率.  相似文献   

15.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

16.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数.  相似文献   

17.
Apriori算法是经典的关联规则挖掘算法,主要缺点是可能产生大量的候选集和需要多次扫描数据库.从幂集运算的角度提出了一种新的关联规则挖掘算法P_DM算法,实现了只需要扫描一次数据库就产生所有频繁集.实验证明这种算法在中小规模数据挖掘上效率优于Apriori算法.  相似文献   

18.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号