首页 | 本学科首页   官方微博 | 高级检索  
     检索      

宽度优先的频繁子图高效挖掘新算法
引用本文:王映龙,杨炳儒,宋威,宋泽锋.宽度优先的频繁子图高效挖掘新算法[J].系统工程与电子技术,2008,30(3):548-552.
作者姓名:王映龙  杨炳儒  宋威  宋泽锋
作者单位:1. 北京科技大学信息工程学院,北京,100083;江西农业大学计算机与信息工程学院,江西,南昌,330045
2. 北京科技大学信息工程学院,北京,100083
基金项目:国家自然科学基金资助课题(60675030)
摘    要:频繁子图已成为数据挖掘领域研究的热点之一。在经典的Apriori算法的基础上,提出了一种图挖掘的新算法Apriori-Graph。首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可加速子图规范编码序列匹配的速度。其次,对候选子图的生成进行了规范。最后,针对频繁性检验这一瓶颈过程,给出了若干性质,从而较大地降低了候选子图频繁性判断的代价。实验结果表明,Apriori-Graph算法具有较高的挖掘效率。

关 键 词:数据挖掘  频繁子图  邻接矩阵  规范编码  Apriori算法
文章编号:1001-506X(2008)03-0548-05
修稿时间:2007年4月23日

New efficient width-first algorithm for mining frequent subgraph
WANG Ying-long,YANG Bing-ru,SONG Wei,SONG Ze-feng.New efficient width-first algorithm for mining frequent subgraph[J].System Engineering and Electronics,2008,30(3):548-552.
Authors:WANG Ying-long  YANG Bing-ru  SONG Wei  SONG Ze-feng
Abstract:Frequent subgraph mining is an active research topic in the data mining field.Based on the classical Apriori algorithm,a novel graph mining algorithm,Apriori-Graph,is proposed.Firstly,to lower the complexity of computing canonical codes of the adjacency matrix of graphs,a new vertex sorting strategy is introduced.Meanwhile,the sorting strategy can also speed the matching process of sequences of canonical codes.Secondly,aiming at the frequent subgraph,the process of generation for candidates is standareized.Finally,to ease the burden of frequency-checking,which is the bottle-neck of Apriori-inspired algorithms,several properties are discussed.Thus,the cost of frequency-checking is lowered. Experimental results show the proposed algorithm is efficient.
Keywords:data mining  frequent subgraph  adjacency matrix  canonical code  Apriori algorithm
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号