首页 | 本学科首页   官方微博 | 高级检索  
     

一种挖掘频繁模式的数据库划分新方法
引用本文:叶飞跃,王建东,庄毅,吕宗磊. 一种挖掘频繁模式的数据库划分新方法[J]. 系统工程与电子技术, 2004, 26(11): 1666-1668
作者姓名:叶飞跃  王建东  庄毅  吕宗磊
作者单位:1. 南京航空航天大学信息科学与技术学院,江苏,南京,210016;江苏技术师范学院计算机科学与技术系,江苏,常州,213001
2. 南京航空航天大学信息科学与技术学院,江苏,南京,210016
基金项目:江苏省高校自然科学研究计划(03KJD110089),航空基金(01F52036)资助课题
摘    要:提出了一种新的数据库划分方法。该方法应用于需要产生候选项的频繁模式的挖掘过程,可以大大减少对数据库的扫描操作,提高数据挖掘效率,特别是对于较长模式的数据挖掘更是如此。该方法是将交易数据库按照交易的长度(或者说模式的长度)划分成若干个子数据库,将等长度的交易划分到同一个子数据库中,这样在获取候选项的支持度时,只需要扫描模式长度大于等于相应候选项长度的子数据库即可,从而减少了对数据库的扫描操作。给出了基于数据库划分的挖掘算法,通过理论推导和实验证明了该方法的有效性。

关 键 词:数据挖掘  频繁模式  数据库划分
文章编号:1001-506X(2004)11-1666-03
修稿时间:2003-09-04

New database partition method for mining frequent pattern
YE Fei-yue. New database partition method for mining frequent pattern[J]. System Engineering and Electronics, 2004, 26(11): 1666-1668
Authors:YE Fei-yue
Affiliation:YE Fei-yue~
Abstract:A new database partition method for mining frequent patterns is proposed. In the process of mining frequent patterns, based on this method, the number of records to be scanned can be greatly reduced, especially for mining long patterns. In this method, database is partitioned according to the length of transactions or patterns. Transactions with the same length are partitioned to the same subdatabase. Therefore, it only need scan those subdatabases in which the transactions are longer than or equal to the candidate item set when calculating the support number of a candidate item set. As a result, the number of scanned database records will be reduced. The mining algorithm based on database partition is put forward, and the validity of the algorithm is proved by theoretical deduction and experiment.
Keywords:data mining  frequent pattern  database partition  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号