首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基因表达数据的频繁闭合模式挖掘新算法
引用本文:缪裕青,陈国良,徐云.基因表达数据的频繁闭合模式挖掘新算法[J].中国科学技术大学学报,2007,37(9):1080-1087.
作者姓名:缪裕青  陈国良  徐云
作者单位:1. 中国科学技术大学计算机科学与技术系,安徽合肥,230027;国家高性能计算中心,安徽合肥,230027;桂林电子科技大学计算机系,广西桂林,541004
2. 中国科学技术大学计算机科学与技术系,安徽合肥,230027;国家高性能计算中心,安徽合肥,230027
摘    要:基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事务集信息.该算法将频繁闭合模式挖掘问题转换成频繁闭合事务集挖掘问题,采取自顶向下分而治之的事务搜索策略,并组合了高效的修剪技术和有效的优化技术.实验表明,TPclose算法普遍快于自底向上事务搜索算法RERⅡ,最高达2个数量级以上.

关 键 词:数据挖掘  关联规则  频繁闭合模式  基因表达数据  自顶向下
文章编号:0253-2778(2007)09-1080-08
修稿时间:2006-04-30

A new algorithm for mining frequent closed patterns in gene expression datasets
MIAO Yu-qing,CHEN Guo-liang,XU Yun.A new algorithm for mining frequent closed patterns in gene expression datasets[J].Journal of University of Science and Technology of China,2007,37(9):1080-1087.
Authors:MIAO Yu-qing  CHEN Guo-liang  XU Yun
Institution:1. Department of Computer Science and Technology, USTC , He f ei 230027, China; 2. N H PCC, He f ei 230027, China; 3. Department of Computer Science and Technology, Guilin University of Electronic Technology, Cruilin 541004, China
Abstract:
Keywords:data mining  association rules  frequent closed pattern  gene expression data  top-down
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号