首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数.  相似文献   

2.
改进购物篮分析的关联规则挖掘算法   总被引:5,自引:1,他引:5  
基于改进传统购物篮分析的关联规则挖掘是在数据处理时引入兴趣度加权的思想,将所有交易中同一类商品的交易量进行归一化处理,根据用户领域知识的要求,计算该类商品的兴趣度加权阈值,从而改进传统的购物篮分析,使所挖掘出的关联规则符合实际,同时减少关联规则挖掘的工作量,提高规则挖掘的效率和准确性.  相似文献   

3.
针对经典Apriori算法中挖掘到的结果不能实现商家利益最大化和推荐权值人为设定的问题,在考虑商品利润和销量的基础上,提出基于Apriori算法的加权关联规则模型.最后,在实际购物篮数据的测试中,验证了改进后算法实用性.  相似文献   

4.
关联规则研究有助于发现数据库中不同商品之间的联系。其分析结果可以应用于制定营销策略,寻求最佳的商品货架布局。从关联规则挖掘算法和关联模式的评估两方面对购物篮数据进行关联分析。  相似文献   

5.
介绍数据挖掘中关联规则的情况.在分析关联规则挖掘算法的基础上,对经典Apriori算法进行改进,改进算法意在通过减少生成候选频繁项集的数量和扫描数据库次数.从而,加快算法的执行效率和节省空间.  相似文献   

6.
典型的关联规则仅考虑事务中所列举的项目,这样的规则主要是正关联规则.负关联规则不但要考虑事务中所包含的项目集,还要考虑事务中所不包含的项目,它有利于进行购物篮分析以发现那些相关的商品或互斥的商品.而已有的负关联规则挖掘的算法具有很大的局限性.为此,文中提出了一种基于位矩阵的负关联规则挖掘新算法.通过算例表明,该算法是有效可行的.  相似文献   

7.
Apriori算法是关联规则数据挖掘领域中最重要的挖掘方法,针对Apriori算法中挖掘频繁项集的效率问题和产生关联规则的合理性问题,改进相关定义及其使用,并提出改进的Apriori算法,然后将改进算法用于教学评价仿真系统.仿真结果表明,改进算法可高效、合理地挖掘关联规则,为做好课程安排和教学工作提供支持.  相似文献   

8.
针对传统数据挖掘技术的劣势,提出一种以利润为基础的约束关联规则挖掘算法.在使用关联规则进行数据挖掘之前,算法按照商品利润的权重信息对购物篮中的原始商品交易信息实施预处理,可以使后续的数据关联规则挖掘更加的精确可靠,提升数据挖掘的效果.结果表明:基于利润的约束关联规则挖掘算法对数据库的原始数据实施了利润约束修正,增加了利润加权阈值,可有效提升数据挖掘算法的知识挖掘性能.  相似文献   

9.
文章介绍了知识发现中关联规则挖掘算法的基本思想及其性能,分析了FP-tree算法在关联规则挖掘中存在耗费巨大空间存贮的问题,提出了一种运用投影技术改进的频繁模式增长算法,该算法改善FP-tree构造,实验结果表明,运用投影技术改进的频繁模式增长算法可以提高关联规则挖掘效果。  相似文献   

10.
在关联规则挖掘中,大量的数据是多维的,且带有时态特性,所以往往需要在时态约束的前提下挖掘多维关联规则.本文从一个实际问题出发,在单维Apriori算法和已有的工作基础上,提出了一种新的多维时态关联规则挖掘算法,并与类似算法进行了比较.  相似文献   

11.
为了解决基于Apriori的分类关联规则算法挖掘数值型数据时效率和准确率偏低的问题,提出基于定量关联规则树的分类及回归预测算法。采用改进的定量关联规则算法挖掘数值型数据生成关联规则库,并基于关联规则树结构实现分类及回归预测。研究结果表明:改进的Apriori定量关联规则挖掘算法提高了分类预测的准确率并降低了计算复杂度;而采用关联规则树结构可使分类与回归预测时间明显加快,提高了样本匹配学习的速度。  相似文献   

12.
基于数据挖掘技术,以集中供热管理为研究对象,提出了关联数据挖掘的设计思想及实现方法。采用了属性构造法进行数据预处理,建立了数据挖掘模型,实现了关联规则算法,并对挖掘结果进行解释与分析。分析表明:对于供热系统的温度、压力和流量,其热量消耗应满足最小支持度和最小置信度阈值。  相似文献   

13.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

14.
时序关联规则的研究具有重要的现实意义,因而根据传统的FP-树思想,提出了一种基于改进的FP-树的时序关联规则挖掘的方法.根据FP-树的思想,将时间序列中的频繁项映射到树中,以降低频繁时序模式的搜索空间,该算法在挖掘过程中不用生成大量的频繁模式候选集,提高了时序关联规则的挖掘效率.  相似文献   

15.
一种基于闭项集的无冗余关联规则挖掘方法   总被引:1,自引:0,他引:1  
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小-最大精确规则基和无冗余最小-最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

16.
对海量的时间序列进行处理,挖掘其背后蕴涵的价值信息具有重要的意义。本文结合了时序逻辑和数据挖掘的知识对基于FP_树的时序关联规则展开了研究,并在传统的算法基础上提出了一种改进算法。该方法不用生成大量的频繁模式候选集,从而提高了时序关联规则的挖掘效率。  相似文献   

17.
提出了一种使数据挖掘与数据库系统无缝集成的方案.该方案基于关联规则挖掘和关系数据库系统的通用查询算法,采用一种扩充的嵌套关系代数作为关联规则和其它数据查询的一种内部表达方式.通过一个典型实例展示了这种代数表达式.代数表达式也被表达为一种查询树,查询树中代数运算的公共操作序列模块化后,具有更多的灵活性,能方便地处理约束关联规则查询和其它各种关联规则描述.  相似文献   

18.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

19.
在对数据库聚类分析的基础上进行分层抽样,并使用关联规则,得出了数据之间的潜在关系.同时,对网民健身情况调查数据进行了实证分析,在SQL Server 2005上实现了抽样后的关联规则挖掘,提高了关联的效率,并取得了良好的效果.另外,对关联规则的评估作了一定的改进创新.  相似文献   

20.
隐私保持关联规则挖掘方法   总被引:1,自引:0,他引:1  
介绍了隐私保持关联规则挖掘的研究概况,提出了考虑隐私保持的关联规则挖掘分类方法,对现有的隐私保持关联规则挖掘方法进行了分析和评价,并对隐私保持关联规则挖掘的未来研究方向进行了展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号