首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文重点研究了关联规则经典算法Apriori算法的基本思想,并通过实例说明发现频繁项集的方法,提出了Apriori算法的不足,并结合spss clementine软件将关联挖掘应用于某超市的销售数据,从大类及二级类商品之间两个方面进行挖掘,针对挖掘结果进行了分析,同时提出建议,为超市提供辅助决策信息.  相似文献   

2.
针对传统关联规则各项目具有着相似的出现频率和相同的重要性两个前提假设,提出了加权关联规则的概念,重点研究了水平加权关联规则MINWAL(O)算法的基本思想,指出该算法的不足及优化算法,旨在对加权关联规则挖掘算法的扩展和改进奠定基础.  相似文献   

3.
在Apriori算法的递归链接-剪枝概念上,设计了面向海洋异常事件的关联规则挖掘算法.首先给出事件的相关概念与定义、事件的规则表达及评价指标.根据事件的定义和支持度阈值,生成事件频繁1-项集,并设计面向事件的链接-剪枝算法,实现频繁k-项集到(k+1)-项集的产生.根据事件强关联规则评价指标,提取海洋事件强关联规则.通过太平洋海洋异常事件的关联规则挖掘和典型异常事件间的关联规则分析,验证了该方法的正确性和可行性.  相似文献   

4.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向.  相似文献   

5.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题.  相似文献   

6.
在数据挖掘研究领域中,数据的关联规则占有重要研究地位和突出现实作用。本文论述了关联规则产生的背景,描述了关联规则的相关概念,并对Apriori挖掘算法进行了详细分析。  相似文献   

7.
较为详细地介绍了关联规则挖掘的基本内容和相关算法,给出了在web个性化网站的建设中,利用关联规则挖掘对用户数据进行分析和预测用户行为的一个实例.  相似文献   

8.
【目的】优化因消费者需求改变而受到局限的传统方法。【方法】通过收集沃尔玛超市两个时段9 835名顾客的消费数据,使用Apriori算法对数据进行挖掘和分析,得到3种推荐方法,分别为按商品销售排名推荐最畅销的前N件商品、根据Apriori算法挖掘出的关联规则进行商品捆绑销售、根据定义的强关联规则推荐系数来推荐商品。【结果】在运行程序后,发现后两种推荐方式挖掘出的关联规则商品不完全相同,且对相同关联规则商品的推荐度不同。【结论】推荐策略的实施将提高超市商品的销售量,有助于满足顾客的个性化需求。  相似文献   

9.
针对当前关联规则挖掘存在的不足,在充分利用本体特点的基础上,对关联规则挖掘方法进行了改进。提出了一种面向领域的噪音清除算法,结合Apriori算法优点,又提出了一种改进的关联规则挖掘算法,采用领域本体技术来优化规则,从而去除冗余规则。通过实验验证所提方法的有效性。  相似文献   

10.
把基于数据垂直分布的模糊关联规则挖掘算法引入到网络的入侵检测,利用该算法从网络数据集中对采集到的数据进行模糊化的处理,并将数据垂直分布于位图中.利用k-means聚类算法建立属性的模糊集和模糊隶属函数,该算法克服了传统的离散分区法的不足,同时改进了已有模糊关联规则,提取出具有较高可信性和完备性的模糊关联规则.  相似文献   

11.
首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集,该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少,该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能,通过大量的实验数据进行比较。该算法的速度约是Apriori算法的10倍。  相似文献   

12.
本文绍了关联规则挖掘的研究情况,提出了关规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。  相似文献   

13.
通过对传统决策树算法的介绍,阐述了改进后的C4.5算法将在挖掘时间上用时更少.通过对学生成绩进行预处理后,利用改进后的算法挖掘学生成绩之间的关联规则,分析并解释关联规则的结果.  相似文献   

14.
一个基于频繁项集的时态数据挖掘算法   总被引:5,自引:0,他引:5  
研究了基于频繁项集的一个时态效据挖掘算法。首先,引进了基于频繁项集关联规则的概念,性质,然后,给出了基于时态约束关联规则的相关概念的定义和性质分析。最后,给出了在时态效据库中挖掘具有时态约束的最大频繁项集,并在此频繁项集生成时态关联规则的算法,由此导出了一种具有一定意义的时态关联规则挖掘方法,这种方法可以崩于商品销售。股票价格等问题的知识发现,最后讨论了该算法在股票效据分析上的一个应用。  相似文献   

15.
随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘出相应的联知识愈来愈感兴趣,关联规则一个典型的应用实例就是市场购物分析.本文介绍了关联分析的概念Apriori算法及其改进技术,对Apfiori算法地优缺点进行了评价.  相似文献   

16.
提出一种基于关联规则的分类算法,这个算法即可以快速分类,又可以不受数据集规模的限制。  相似文献   

17.
传统的关联规则只关注于挖掘出项集间的正关联规则,但在实际应用中负关联规则同样隐含着有价值的信息.本文首先给出了正、负关联规则的定义及支持度和置信度的函数表示,重点分析了关联规则中"支持度—置信度"架构的局限性,提出了利用项集的相关性来解决关联规则中正、负矛盾规则出现的问题,同时针对置信度的设置进行了研究分析,最后对负关联规则挖掘的算法进行了讨论,旨在为关联规则的研究奠定基础.  相似文献   

18.
针对分类中如何有效利用负关联模式提高分类准确率,提出了一种基于正负关联模式的分类算法.利用类Apriori算法挖掘包含正项或/和负项且项与项之间互相关联的正负关联模式来产生分类规则.为提高挖掘效率,先找出能覆盖训练集的信息熵最小k个正,负项.然后,把这k个正/负项分别与其他项进行连接得到相应的正负关联模式.实验表明,该算法有效减少了挖掘的规则数,极大减少了挖掘时间,并提高了分类准确率.  相似文献   

19.
负关联规则挖掘算法研究   总被引:5,自引:0,他引:5  
典型的正关联规则仅考虑事务中所列举的项目.负关联规则不但要考虑事务中所包含的项目,还必须考虑事务中所不包含的项目,它包含了非常有价值的信息.然而,对于负关联规则挖掘的研究却很少,仅有的几种算法也存在一定的局限性.为此,文中提出了一种快速有效的负关联规则挖掘算法MNAR,并给出了一种基于二进制形式的支持数计算方法.理论和实验结果表明算法MNAR是有效和可行的.  相似文献   

20.
常项集产生的算法及兴趣度量   总被引:1,自引:0,他引:1  
本文引入在关系数据库中包含定量和范围属性关联规则的挖掘问题,这种技术的一个直接应用可以生成许多类似的规则。给出为挖掘定量关联规则所需的兴趣度量及常项集产生的算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号