Apriori挖掘算法的优化研究 |
| |
引用本文: | 张青.Apriori挖掘算法的优化研究[J].河南科技,2014(22). |
| |
作者姓名: | 张青 |
| |
作者单位: | 河南化工职业学院,河南 郑州,450042 |
| |
基金项目: | 河南省社会科学院规划项目 |
| |
摘 要: | 本文分析了数据挖掘的经典Apriori算法存在的缺陷:处理规模巨大的候选项目集时需要消耗大量的时间;对候选项目集进行模式匹配时需要多次重复扫描事物数据库,降低算法的速度和效率。针对这些缺陷本文对经典的算法和优化策略进行了剖析,提出一种新的发现频繁项目序列集的算法DISS-DM。本算法是在算法ISS-DM的基础上加以改进,采用了数据分割法将数据库分成多个分片,对每个分片进行一次扫描找出局部频繁项集,对整个数据库扫描发现全局频繁项集。本算法只需要扫描数据库两次,就能发现全局频繁项集,能减少内存需求,有利于大型数据库的数据分割优化。
|
关 键 词: | Apriori 挖掘算法 优化 研究 |
本文献已被 CNKI 万方数据 等数据库收录! |
|