关联规则挖掘的一种多剪枝概念格方法 |
| |
作者姓名: | 徐勇 秦小麟 |
| |
作者单位: | 安徽财经大学,信息工程学院,安徽,蚌埠,233041;南京航空航天大,信息科学与技术学院,江苏,南京,230009;南京航空航天大,信息科学与技术学院,江苏,南京230009 |
| |
基金项目: | 国家自然科学基金
,
安徽省自然科学基金 |
| |
摘 要: | 多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。
|
关 键 词: | 数据挖掘 关联规则 剪枝概念格 |
文章编号: | 1000-582X(2008)04-0451-06 |
修稿时间: | 2007-12-05 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《重庆大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《重庆大学学报(自然科学版)》下载全文 |
|