期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘黎明王水王乐《南开大学学报(自然科学版)》2009,42(4)

挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,如果采用Apriori类的候选项目集生成一检验方法,则候选项目集生成的代价通常很高.为寻求避免生成大量候选项集或生成频繁模式树的挖掘算法,提出一种从事务项集交集求最大频繁项集的迭代算法DIIP(Datasets Iteration and Intersection Pruning Algorithm),通过不断缩减事务集数据量和尽可能早地对项目集进行修剪实现最大频繁项集的挖掘,该算法有别于已有的最大频繁项集经典算法,实验表明该算法有效可行. 相似文献

2.

基于数据挖掘关联规则Apriori改进算法的入侵检测系统的研究 总被引：1，自引：1，他引：0

张浩景凤宣谢晓尧《贵州师范大学学报(自然科学版)》2011,29(3):84-87

在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷：需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。因而提出了一种新方法,使Apriori算法产生的候选项集再通过数据库查找是否为频繁项集,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,改进后的算法... 相似文献

3.

基于数组的关联规则挖掘算法的研究

李敏潘祥光曲云波《哈尔滨商业大学学报(自然科学版)》2011,27(5):705-708

频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高. 相似文献

4.

数据挖掘中关联规则算法的研究及应用

高杰李绍军钱锋《东南大学学报(自然科学版)》2006,(Z1)

针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性. 相似文献

5.

I-Apriori：一种基于Spark平台的改进Apriori算法

李庆鹏《科学技术与工程》2017,17(27)

针对Apriori算法在第二次迭代过程中产生大量候选集的弊端,在Spark大数据框架下,将Apriori算法进行并行化处理。提出一种基于Spark平台的改进Apriori算法——I-Apriori;该算法利用Spark基于内存计算的抽象对象(RDD)存储频繁项集,在第二次迭代中,通过使用改进的布隆过滤器存储频繁1项集,消除候选集生成,减少数据库扫描次数,提高算法效率。实验结果表明,相比基于Spark平台的Apriori算法进行性能评估,I-Apriori算法具有更优的性能,能够较大程度地提高大数据关联规则挖掘的效率。相似文献

6.

一种垂直结构的高效用项集挖掘算法

黄坤吴玉佳《大连理工大学学报》2017,57(5):524-530

挖掘高效用项集已成为关联分析中的热点问题之一.多数高效用项集挖掘算法需要产生大量的候选项集,影响了算法性能.HUI-Miner是一个不需要产生候选项集就能发现事务数据库中所有高效用项集的算法.但其需要产生大量效用列表,不仅消耗了过多的存储空间,而且影响了算法的运行性能.针对此问题,提出一个新的数据结构,称为项集列表,用于存储事务和项的效用信息.提出3种剪枝策略,减少项集列表的数量,通过扫描一次事务数据库完成所有项集列表的构建.提出算法MHUI,直接从项集列表中挖掘所有的高效用项集而不产生任何候选项集.在3个不同的稀疏数据集上和最新的算法进行对比实验证明,MHUI算法的运行时间和内存消耗优于其他算法. 相似文献

7.

基于十字链表的关联规则改进算法

王利钢陈平《宝鸡文理学院学报(自然科学版)》2016,36(4):27-30

目的解决在关联规则挖掘中存在大量无用的候选项集和频繁项集以及效率不高的问题。方法提出了一种基于十字链表的关联规则改进算法。结果利用用户给定的条件和剪枝算法减少了候选项集的数量,再遍历十字链表确定频繁项集,结果表明算法提高了挖掘效率。结论基于十字链表的关联规则改进算法避免了重复扫描数据库,提高了挖掘效率。相似文献

8.

概率频繁模式挖掘之U-apriori算法研究

杜戈王子《湖南城市学院学报(自然科学版)》2013,(3):71-75

不确定性数据的频繁项集挖掘的算法—U-apriori算法采用逐层迭代搜索方法,使用候选项集来找频繁项集.分析了U-apriori算法的流程和实现过程,并通过实验对比得出U-apriori算法花费较少时间和空间的优点,最后针对该算法的缺点提出了改进思路.结果表明:U-apriori算法是最佳概率频繁模式挖掘方法之一. 相似文献

9.

二项集剪枝技术研究

黄建业苏毅娟《广西师范学院学报(自然科学版)》2006,23(1):59-62

在现有的关联规则算法的基础上,深入分析了经典算法的内涵,提出了剪枝候选二项集的改进算法,有效的控制候选二项集的生成,得到传统算法中部分候选二项集,从而减少扫描数据库的运算量.与Apriori算法相比,效率明显提高. 相似文献

10.

基于图的频繁项集挖掘

刘丽《湖南城市学院学报(自然科学版)》2009,18(3)

通过对Apriori算法的频繁项目集的分析研究,给出了基于图的频繁项集挖掘算法.该算法在求频繁K-项集的过程中只需一次扫描数据库,避免了Apriori算法需多次扫描数据库的不足.同时,由于在有向图中利用有限节点之间的路径求频繁K-项集,该算法减少了Apriori算法中需多次进行连接运算的不足. 相似文献

11.

快速挖掘最大频繁项目集的新算法

杨君锐《长安大学学报(自然科学版)》2004,24(6):102-110

针对关联规则下最大频繁项目集的特性,提出了一种快速挖掘最大频繁项目集的新算法MMFI(miningmaximumfrequentitemsets)。该算法摆脱了传统的经典算法Apriori及其变种情况下的自底向上的搜索策略,利用集合枚举树(set enumerationtree)的变形结构采取了自顶向下的新的搜索方式,并通过其独特的启发式判断策略、候选项目集的生成策略等,大大减少侯选项目集的生成,从而降低了CPU搜索时间,提高了挖掘效率。相似文献

12.

基于高阶项目集的频繁项目集发现算法

刘兴丽骆力明《首都师范大学学报(自然科学版)》2011,32(1):22-25

为了提高关联规则数据挖掘的效率,在研究Apriori算法原理和相关文献的基础上,提出了一种基于高阶项目集的频繁项目集发现算法.本算法不同于逐层迭代的搜索方式,而是采用从求解所有的高阶频繁m-项目集入手的方式,来发现隐藏在事务数据库中的频繁项目集.本算法避免了大量的候选项目集的产生,并且对数据库仅需进行有限次数的扫描,从而体现了算法的高效性. 相似文献

13.

基于FP-Tree的最大频繁项目集更新挖掘算法 总被引：4，自引：1，他引：4

杨君锐赵群礼《华中科技大学学报(自然科学版)》2004,32(11):88-90

发现最大频繁项目集是多种数据挖掘应用中的重要问题．在应用中用户需要调整最小支持度,以发现更有用的最大频繁项目集．为此提出了一种最大频繁项目集更新算法(UMFPA),该算法通过对频繁模式树(FP-Tree)中的频繁项目头表(H Table)增加两个域,从而将减少在数据库不变而最小支持度变化的情况下的更新挖掘最大频繁项目集的费用．实验结果表明,算法在进行最大频繁项目集更新挖掘时具有很好的性能．相似文献

14.

一种快速发现最大频繁项集的挖掘算法 总被引：1，自引：0，他引：1

崔海莉袁兆山《合肥工业大学学报(自然科学版)》2006,29(11):1392-1395

文章分析了关联规则发现中关于频繁项集的生成与测试方法,提出一种快速挖掘最大频繁项集的算法MFIA_VTL。该算法针对数据库的垂直事务标识列表结构对项集搜索空间进行基于前缀的划分,来发现最大频繁项集。实验表明,该算法性能稳定,可扩展性好。相似文献

15.

模糊规则发现算法研究 总被引：3，自引：0，他引：3

陆建江徐宝文邹晓峰《东南大学学报(自然科学版)》2003,33(3):271-274

引入最小强度的概念来限制模糊属性集的搜索范围，提出一种能发现强模糊规则的快速算法．此算法利用Apriori算法的搜索技术来发现强模糊规则，因此具有较高的算法效率，并有效地解决了模糊系统的维数灾难问题．在快速算法的基础上，又提出一种能发现固定数目的强模糊规则的划分算法．该算法将数据库划分成多个子数据库，并在于数据库上通过发现划分强模糊属性集来限制全局强模糊属性集的搜索范围．实验表明，划分算法比快速算法更节省时间．相似文献

16.

分布式环境下全局模糊频繁项目集的快速挖掘

韦素云吉根林《江南大学学报(自然科学版)》2007,6(6):728-732

为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算法GFAM.该算法利用分布式K-Means聚类算法对每个数值型属性进行聚类,求得聚类中心,由此构造全局模糊集,定义全局隶属度函数.DFAR算法根据构造的全局模糊集及隶属度函数进行分布式模糊频繁项目集的快速挖掘,采用全局-局部站点模式,其中包括局部模糊频繁项目集产生算法FLF和全局模糊频繁项目集产生算法FGF.实验结果表明,该算法能准确地生成全局模糊频繁项目集,在求解全局模糊频繁项目集过程中,传送局部模糊候选项目集支持数的通信量为O(n),提高了算法的挖掘效率. 相似文献

17.

基于集合运算的频繁集挖掘优化算法 总被引：1，自引：0，他引：1

娄兰芳潘庆先《山东大学学报(理学版)》2008,43(11):54-57

挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。提出了一种基于集合运算的频繁项目集挖掘算法,并将该算法与经典算法Apriori进行比较。该算法只需要对数据库扫描一遍。实验表明该算法的效率较好。相似文献

18.

快速更新挖掘最大频繁项集

冯凤《合肥学院学报(自然科学版)》2007,17(4):46-49

更新挖掘最大频繁项目集是多种数据挖掘应用中的重要问题,其发现过程的高花费要求对高效更新挖掘算法进行研究.提出了一种快速的更新挖掘最大频繁项目集算法,其能够在原有挖掘结果的基础上,有效地挖掘出更新后的数据库中隐含的新最大频繁项目集. 相似文献

19.

基于免疫算法的频繁项集挖掘

段季芳梁雪芳别荣芳林定移《北京师范大学学报(自然科学版)》2009,45(2):161-163

设计了一种不同于传统关联规则挖掘算法(如Apriori算法等)频繁项集产生算法.该算法借鉴一般免疫算法思想,并从新的角度来看频繁项集的定义,避免了传统算法中存在的"项集生成瓶颈"问题.通过对mushroom数据的频繁项集挖掘的实验,与传统方法进行了比较,其结果表明,基于免疫算法的频繁项集挖掘算法在大数据集、低支持度情况下平均挖掘时间短. 相似文献

20.

一种新的多级关联规则高效挖掘算法 总被引：1，自引：1，他引：1

张勇苑森淼《东北师大学报(自然科学版)》2003,35(2):15-20

提出一种新的多级关联规则挖掘算法，该算法采用自中间开始并基于集合运算的方法来求频繁集，在求解过程中不需要建立复杂的hash树，并且避免了挖掘初期在每个模式中产生大量的支持事务集，从而减少了I／O操作，提高了挖掘的效率．相似文献