基于双向十字链表的频繁项集挖掘 |
| |
作者姓名: | 胡斌 张天 胡勇 |
| |
作者单位: | 北京科技大学,长春师范大学 计算机科学与技术学院,北京科技大学 计算机与通信学院 |
| |
基金项目: | 国家自然科学基金项目(面上项目,重点项目,重大项目)(No. 2011AA040101); |
| |
摘 要: | 有效地进行频繁项挖掘一直以来都是数据挖掘任务中最为重要的组成部分。已有的大部分频繁项挖掘算法在数据项多及支持度低的情况下,算法的效率急剧下降。为了有效地解决此类问题,提出了一种采用双向十字链表结构的频繁项挖掘算法(two-way crossed list for frequent itemsets mining,TCLFI)。极大地降低了搜索空间,加快了频繁项的筛选过程,减少了所需保存的数据项个数,从而降低了时间复杂度,提高了频繁项的挖掘效率。实验通过真实数据集和合成数据集验证了算法的有效性和扩展性。
|
关 键 词: | 条件模式基 频繁模式 频繁项挖掘 关联规则 |
收稿时间: | 2014-03-11 |
修稿时间: | 2014-04-19 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|