首页 | 本学科首页   官方微博 | 高级检索  
     

Gen-Cluster:一个基因表达数据的高维聚类算法
引用本文:熊贇,邱伯仁,张坤,朱扬勇. Gen-Cluster:一个基因表达数据的高维聚类算法[J]. 复旦学报(自然科学版), 2008, 47(2): 135-146
作者姓名:熊贇  邱伯仁  张坤  朱扬勇
作者单位:复旦大学,计算机与信息技术系,上海,200433;复旦大学,计算机与信息技术系,上海,200433;复旦大学,计算机与信息技术系,上海,200433;复旦大学,计算机与信息技术系,上海,200433
基金项目:国家自然科学基金 , 国家高技术研究发展计划(863计划)
摘    要:基因表达数据聚类是分析基因之间共调控关系的重要手段.挖掘子空间中表达值存在差异但变化趋势保守的序列已成为基因表达数据聚类的主要研究内容之一.在N-同维趋势相似定义的基础上,提出了一个基因表达数据的高维聚类算法Gen-Cluster,将基因表达值转化为序列形式,采用无重复投影且无候选生成的序列模式挖掘策略自底向上挖掘N-同维趋势模式,并解决了OP-Cluster算法不能挖掘含有项集的序列模式问题,最终得到表达值变化趋势保守的基因序列形成的N-同维趋势簇.实验采用Breast Tumor和MicroRNA表达数据集,验证挖掘结果是有效的,且较OP-Cluster算法表现更高效率,并涵盖其结果.

关 键 词:高维数据挖掘  聚类  基因表达数据  N-同维趋势相似
文章编号:0427-7104(2008)02-0135-12
修稿时间:2007-09-24

Gen-Cluster: An Efficient Gene Expression Data High Dimensional Clustering Algorithm
XIONG Yun,QIU Bo-ren,ZHANG Kun,ZHU Yang-yong. Gen-Cluster: An Efficient Gene Expression Data High Dimensional Clustering Algorithm[J]. Journal of Fudan University(Natural Science), 2008, 47(2): 135-146
Authors:XIONG Yun  QIU Bo-ren  ZHANG Kun  ZHU Yang-yong
Abstract:Gene expression data clustering is an important task in gene co-regulated relation analysis. It is one of main research subjects in gene expression data clustering to mine genes which possess conserved tendency while take quite different expression values in subspace. Based on N-same dimensional tendency similarity definition, a new gene expression data high dimensional clustering algorithm Gen-Cluster is proposed. Gen-Cluster first transforms gene expression value into sequence form, and then finds N-same dimensional tendency pattern adopting non-duplicate-projection and non-candidate-generation strategy from bottom to upper side. It can deal with sequential patterns containing item set while OP-Cluster algorithm cannot. The experiments on real world data set from Breast Tumor and MicroRNA expression profile are used to evaluate the efficiency and effectiveness of Gen-Cluster, the results suggest that Gen-Cluster can generate satisfactory clustering results.
Keywords:high dimensional data mining  clustering  gene express data  N-same dimensional tendency similarity
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号