首页 | 本学科首页   官方微博 | 高级检索  
     

基于投影二维表的最大频繁模式挖掘算法
引用本文:王利军. 基于投影二维表的最大频繁模式挖掘算法[J]. 西昌学院学报(自然科学版), 2019, 33(4): 70-74
作者姓名:王利军
作者单位:安徽经济管理学院信息工程系,合肥 230031
基金项目:安徽省高校自然科学重点项目:基于spark分布式计算平台的高校教学大数据分析方法研究(KJ2019A0965)。
摘    要:PITable-MAX是基于投影二维表的最大频繁模式挖掘算法。算法只需要遍历一次事务数据库,并将数据信息存入投影数据库中,在挖掘事务项时才会从投影数据库中提取相关的数据信息生成投影二维表,从而减少对内存空间的占用,算法虽然采用递归方式,但组合策略可实现减少条件投影二维表的规模,以达到减少空间;并结合减挖策略来减少挖掘事务项的个数,以达到提高挖掘效率的目的;实验验证了算法的可行性和优越性。

关 键 词:投影二维表  算法改进  最大频繁项集

Maximum Frequent Pattern MiningAlgorithm Based on ProjectionTwo-Dimensional Tables
WANG Lijun. Maximum Frequent Pattern MiningAlgorithm Based on ProjectionTwo-Dimensional Tables[J]. Journal of Xichang College, 2019, 33(4): 70-74
Authors:WANG Lijun
Affiliation:Department of Information Engineering,Anhui Institute of Economics Management, Hefei 230031,China
Abstract:PITable-MAX is a maximum frequent pattern mining algorithm based on projection two-dimensionaltables. The algorithm only needs to traverse the transaction database once and store the data information in theprojection database, and the related data information can be extracted from the projection database to generate aprojection two-dimensional table when mining the transaction item, thus reducing the occupancy of memory space.Although the algorithm adopts recursive method, the combination strategy can reduce the size of conditionalprojection two-dimensional tables to reduce the space, and the number of mining items is reduced by combining thereduction strategy to improve the efficiency of mining. The experiment verifies the feasibility and superiority of thealgorithm.
Keywords:projection two-dimensional table   algorithm improvement   maximal frequent item set
本文献已被 CNKI 等数据库收录!
点击此处可从《西昌学院学报(自然科学版)》浏览原始摘要信息
点击此处可从《西昌学院学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号