共查询到20条相似文献,搜索用时 15 毫秒
1.
数据的挖掘是一门综合的学科,涵盖计算机数据库以及高等数学等诸多学科,对于如何更好地利用分析数据库,学者一直在探索。本文从关联规则基本理论入手,进一步对关联规则挖掘的经典算法Apriori算法和FP-growth(频繁模式增长)算法进行了详尽描述,并提出了两个算法不同的针对点,有助于使用者在应用时根据环境做出适当选择。 相似文献
2.
亓文娟 《哈尔滨师范大学自然科学学报》2015,(1):45-48
针对传统关联规则各项目具有着相似的出现频率和相同的重要性两个前提假设,提出了加权关联规则的概念,重点研究了水平加权关联规则MINWAL(O)算法的基本思想,指出该算法的不足及优化算法,旨在对加权关联规则挖掘算法的扩展和改进奠定基础. 相似文献
3.
负关联规则挖掘算法研究 总被引:5,自引:0,他引:5
典型的正关联规则仅考虑事务中所列举的项目.负关联规则不但要考虑事务中所包含的项目,还必须考虑事务中所不包含的项目,它包含了非常有价值的信息.然而,对于负关联规则挖掘的研究却很少,仅有的几种算法也存在一定的局限性.为此,文中提出了一种快速有效的负关联规则挖掘算法MNAR,并给出了一种基于二进制形式的支持数计算方法.理论和实验结果表明算法MNAR是有效和可行的. 相似文献
4.
模糊关联规则及其挖掘算法 总被引:2,自引:1,他引:2
通过定义模糊事务数据库,用模糊概念表示事务数据之间的关联关系,提出并定义了模糊关联规则的概念,研究了模糊关联的性质,并给出了一种模糊关联规则的数据挖掘算法. 相似文献
5.
关联规则(Association Rules)挖掘是数据挖掘研究领域的一个重要研究方向,1993年,美国IBM Almaden Research Center的Agrawal等人首先提出了从交易数据库中发现用户模式的相关性问题,并且提出了基于频繁集的Apriori算法。 相似文献
6.
本文重点研究了关联规则经典算法Apriori算法的基本思想,并通过实例说明发现频繁项集的方法,提出了Apriori算法的不足,并结合spss clementine软件将关联挖掘应用于某超市的销售数据,从大类及二级类商品之间两个方面进行挖掘,针对挖掘结果进行了分析,同时提出建议,为超市提供辅助决策信息. 相似文献
7.
8.
9.
本文分析了数据挖掘的经典Apriori算法存在的缺陷:处理规模巨大的候选项目集时需要消耗大量的时间;对候选项目集进行模式匹配时需要多次重复扫描事物数据库,降低算法的速度和效率。针对这些缺陷本文对经典的算法和优化策略进行了剖析,提出一种新的发现频繁项目序列集的算法DISS-DM。本算法是在算法ISS-DM的基础上加以改进,采用了数据分割法将数据库分成多个分片,对每个分片进行一次扫描找出局部频繁项集,对整个数据库扫描发现全局频繁项集。本算法只需要扫描数据库两次,就能发现全局频繁项集,能减少内存需求,有利于大型数据库的数据分割优化。 相似文献
10.
11.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向. 相似文献
12.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法. 相似文献
13.
较为详细地介绍了关联规则挖掘的基本内容和相关算法,给出了在web个性化网站的建设中,利用关联规则挖掘对用户数据进行分析和预测用户行为的一个实例. 相似文献
14.
基于Agent和关联规则挖掘技术的网络答疑系统的改进研究 总被引:1,自引:0,他引:1
在分析现有答疑系统功能的基础上,对网络答疑系统的总体框架和答疑机制进行探讨,提出在网络答疑系统中应提供基于"用户提问"库和"FQA"库的问题推荐.同时就如何实现基于"用户提问"库、"FQA"库、"用户信息"库的关联规则挖掘,以及如何以此为基础的问题推荐进行研究,设计并实现相应的系统. 相似文献
15.
采用粗糙集的理论思想,将传统数据库转换成更容易处理的基于属性的决策系统.无需产生候选项集,克服了Apriori算法频繁扫描数据库的缺陷,并采用分割思想.大大提高了算法的执行效率. 相似文献
16.
17.
针对FP-growth算法存在的不能进行增量更新,以及已有基于FP-growth的增量更新算法效率不高、不支持连续更新等问题,在FP-tree基础上,提出了增量更新改进算法FPIUA2,其适用于数据集连续增加的情形,适用于稀疏型数据集和稠密型数据集、支持连续执行.实验表明:该算法的效率远高于FPgrowth和已有的增量更新算法,其执行效率较FP-Growth、FPUA和FIUA2算法提高了1个数量级,并且具有很好的可扩展性. 相似文献
18.
通过关键字等相关属性之间的联系,在不进行连接操作的前提下,探讨任意多表间关联规则的数据挖掘问题。给出相关的数据结构以及具有较好并行度的算法,并对算法作定性分析。 相似文献
19.
20.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题. 相似文献