首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于频繁模式半结构化数据的模式抽取
引用本文:李颖,张晓贤,孙佳慧.基于频繁模式半结构化数据的模式抽取[J].吉林大学学报(信息科学版),2012,30(5):540-543.
作者姓名:李颖  张晓贤  孙佳慧
作者单位:1. 吉林师范大学 计算机学院, 吉林 四平 136000; 2. 长春工程学院 软件学院, 长春130012;3. 空军航空大学 基础部, 长春 130022
摘    要:为克服半结构化数据存储复杂的缺点,提出一种基于动态树的半结构化的存储模型。对该模型进行模式抽取, 并将其引入到Apriori算法。通过设置最小支持度阀值过滤掉不必要的信息, 输出最长频繁路径的集合, 以实现半结构化数据的提取。实验结果表明, 该算法能同时有效地处理分支及环路问题, 避免了死循环的出现。

关 键 词:半结构化数据  数据挖掘  频繁模式  模式抽取  

Semi-Structured Data Model Extraction Based on Frequent Patterns
LI Ying , ZHANG Xiao-xian , SUN Jia-hui.Semi-Structured Data Model Extraction Based on Frequent Patterns[J].Journal of Jilin University:Information Sci Ed,2012,30(5):540-543.
Authors:LI Ying  ZHANG Xiao-xian  SUN Jia-hui
Institution:1. College of Computer Science, Jilin Normal University, Siping 136000, China;2. College of Software, Changchun Institute of Technology, Changchun 130012, China;3. Department of Basic, Aviation University of Air Force, Changchun 130022, China
Abstract:In order to overcome the complex characteristics of semi-structured data storage,we propose a semi-structured storage model based on dynamic tree.We extract mode by introducing the mode into the Apriori algorithm,and setting the minimu m support threshold filter unnecessary information to output the longest frequen t path collection.Experimental results show that this algorithm deal effect ivel y with the branch and loop part at the same time,and also it can avoid infinite loop.
Keywords:semi-structured data  data mining  frequent patterns mining  extracting schema
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《吉林大学学报(信息科学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(信息科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号