首页 | 本学科首页   官方微博 | 高级检索  
     检索      

动态迭代聚类算法分析基因序列数据
引用本文:黄元江,汤德佑,胡红武.动态迭代聚类算法分析基因序列数据[J].南华大学学报(自然科学版),2004,18(4):57-60.
作者姓名:黄元江  汤德佑  胡红武
作者单位:1. 株洲工学院,计算机系,湖南,株洲,412008
2. 株洲工学院,计算机系,湖南,株洲,412008;华南理工大学,软件学院,广东,广州,510630
3. 华南理工大学,软件学院,广东,广州,510630
摘    要:聚类技术在知识发现方面发挥了很重要的作用,K—均值算法是聚类分析中最常用的算法,但K—均值算法必须预先选择类的数目作为先验值,即研究者需要确定数据空间内有意义类的数目.针对这个问题,本文提出一种新的聚类算法—动态迭代聚类算法,动态选取K个边缘相似度的数据对象作为最初的初始聚类点,并根据类内或类间的相似度离差程度不断地精练(合并或分割)初始类群.模拟实验结果表明,该算法提高了聚类质量,使聚类具有更高的准确性。

关 键 词:动态迭代聚类算法  基因数据库  知识发现  K—均值算法  基因序列  海量序列
文章编号:1673-0062(2004)04-0057-04
修稿时间:2004年10月8日

Analyzing Gene Sequence Data by Dynamically Iterative Clustering Algorithms
HUANG Yuan-jiang,TANG De-you.Analyzing Gene Sequence Data by Dynamically Iterative Clustering Algorithms[J].Journal of Nanhua University:Science and Technology,2004,18(4):57-60.
Authors:HUANG Yuan-jiang  TANG De-you
Institution:HUANG Yuan-jiang~1,TANG De-you~
Abstract:Clustering technology is very important in knowledge discovery,and K-Means Clustering Algorithms is the most frequently used in clustering analysis.But K-Means Algorithms must choose the amount of classes in advance,in other words,researchers need the exact number of significant classes in data spaces.In this paper,we propose a new Clustering Algorithm aiming at the matter mentioned above.The algorithm selects dynamically K marginal similar objects as original class points and refines constantly these class points based on the discrete degree inner classes or between classes.The simulation results show that this Algorithm has improved veracity and efficiency,compared to the original algorithm.
Keywords:Clustering  Gene database  knowledge discovery  K-Means Clustering Algorithms
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《南华大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《南华大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号