首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基因表达模式分析及软件系统   总被引:2,自引:0,他引:2  
研究和实现了4种基因表达模式的聚类方法,开发了基因表达模式分析软件系统.该软件包含了两两平均连锁聚类法、系统聚类法、自组织特征映射法和模糊聚类等聚类算法,其中模糊聚类算法是首次用于基因表达模式分析.该软件同时具有数据过滤、多种相似性度量选择、聚类方法选择和结果可视化等功能.对于同一组基因表达数据,可通过不同的聚类算法的组合,提供更多的基因分类信息,为生物体复杂的基因表达模式研究提供了一个重要的综合分析平台.  相似文献   

2.
聚类算法在基因表达数据分析中的应用   总被引:1,自引:0,他引:1  
聚类算法在基因表达数据的分析处理中得到日益广泛的应用.文中对几种典型的聚类算法进行描述,对各算法在基因表达数据处理中的特点,进行评价并提出改进的策略.最后,指出聚类算法在生物信息学应用中的发展趋势。  相似文献   

3.
为解决模糊层次聚类算法无法收敛的问题,提出一种改进的模糊层次聚类算法.算法在分群前先进行数据处理,将特征向量相同的群合并成一个新的群,再使用模糊层次聚类算法分群,最后使用K-means算法将类簇收敛为想要的数量.实验结果表明,本算法具有较好的稳定性和分群效果,聚类质量高.  相似文献   

4.
针对基因表达数据空间分布的特性,提出了一种基于模糊核判别分析的基因表达数据分析方法.方法综合了模糊数学以及核判别分析方法的优点,提高了对基因表达数据分类识别的准确性.以多发性骨髓瘤的基因表达数据为例进行了实验,从实验结果可以看出,采用模糊核判别分析方法可以得到最佳的识别效果.  相似文献   

5.
基因表达水平与密码子使用的关系及其预测   总被引:2,自引:2,他引:2  
研究了两个方面的问题.首先,对E.coli(121个基因),B.subtilis(111个基因)、Yeast(107个基因)三种生物的核酸序列,将同义密码子按使用频率统计值分成三种特性的密码子:最适密码子、非最适密码子和稀有密码子.对每一序列的编码区,算出它们各自出现的概率后,用信息聚类法聚类.发现每种生物的高低表达基因明显分开,将三种生物基因聚类结果综合来看,基因表达水平被分为四级:甚高表达基因(VH)、高表达基因(H)、较低表达基因(LM)和低表达基因(LL).每类基因的表达水平与实验结果保持了很好的相关性.在此基础上提出一个预测稀有密码子及基因表达水平的自洽信息聚类方法,E.coli、Yeast预测的结果与E.coli、Yeast的现有资料相比,符合很好.文中还预测了B.subtilis、Drosophila和Bacterio-phage三种基因的表达水平及稀有密码子.  相似文献   

6.
 随着现代生物技术的发展,基于基因表达数据的肿瘤分型诊断已成为DNA微阵列的重要应用领域。提出一种基于基因表达数据的肿瘤分型诊断新方法,并在理论上给出模型解释。该方法通过对高斯混合模型加上一个L1惩罚实现了肿瘤分类和信息基因选择的有机结合,从而用较少的变量达到更高的识别率。实验结果显示,无论是在模拟数据中还是五个微阵列数据集中,提出的方法都是高效稳定的。  相似文献   

7.
优选Atlas微阵列检测胶质瘤基因表达谱的分析方法   总被引:1,自引:0,他引:1  
从Atlas微阵列多种分析法中优选获得差异基因信息量大且较准确的方法。使用Atlas微阵列检测2例新鲜胶质母细胞瘤组织、获得相应的基因表达谱,选取不同的标准化基值及内参照共组合成8种不同方法,比较2例肿瘤组织的差异表达基因,并随机抽取部分基因行RT-PCR验证,由不同分析法得到的结果不同,以一种看家基因为标准化基值,且以所有基因表达值的中位数为内参照比较时得到的信息最多,且经RT-PCR证实可靠。证明以看家基因为标准化基值、并以所有差异基因表达值的中位数为内参照,可能是分析Atlas微阵列检测结果的较优方法  相似文献   

8.
孙震 《科学技术与工程》2012,12(8):1790-1794
近来自然图像的修复已经成了一个热门话题.提出了一种基于K-means聚类算法的自组织神经网络(SOM),称为SOM-K.它首先利用SOM来训练每一个像素的特征向量,并把一幅图像分层.这样就能把每个破损像素分到每层,同时SOM训练后的输出也通过K-means聚类算法来聚合,分别在各个层中修复破损的像素.最后把修复好的各层溶合到一起.与单独使用SOM相比,SOM-K具有更精确的分类能力.  相似文献   

9.
针对K-means聚类算法对初始聚类中心敏感问题,提出1种结合方差与误差平方和的优化算法.首先,该算法基于方差和距离选取k个位于不同区域且样本点相对集中的集合.然后,分别选取使这k个样本集合误差平方和最小的数据作为k个初始聚类中心.利用改进算法与其他算法将UCI数据库中所选取的数据集进行聚类划分,对比不同算法下的聚类结...  相似文献   

10.
文本聚类算法的比较   总被引:3,自引:0,他引:3  
聚类是一种重要的数据挖掘形式。介绍了常用的文本聚类算法,从各种聚类算法的适用范围、初始参数的影响、终止条件以及对噪声的敏感性等方面对其进行了分析比较。  相似文献   

11.
12.
13.
The differentiation process of round spermatids to spermatozoa during the late stage of spermatogenesis is called spermiogenesis. To explore spermiogenesis-related genes, cDNA microarray was used to study expression patterns of 1176 genes in pachytene spermatocytes, round spermatids and elongating spermatids of Balb/c mice. The results showed that 208 genes were detected in all the three cell types. Most of them were down-regulated from pachytene spermatocytes to round spermatids and elongating spermatids. However, up-regulation of 7 genes expression in round spermatids and 3 genes in elongating spermatids were found. Expression of 7 differentially expressed genes in cDNA arrays was further confirmed by semi-quantitative RT-PCR study. The RT-PCR results indicated that the expression of 6 genes was consistent with that in cDNA arrays, only one gene did not show differential expression by RT-PCR. These results may provide important clues for studying of expression, regulation, and function of spermiogenesis-related genes.  相似文献   

14.
基于Normalized Cut的基因表达数据聚类   总被引:1,自引:0,他引:1  
利用基因表达数据进行聚类分析可提高肿瘤诊断的正确率,对生物医学研究具有重要意义.该文将Normalized Cut应用于基因表达数据的聚类中,将样本映射为高维空间的点,利用亲近矩阵和度矩阵构造正规Laplacian矩阵,经SVD分解得到反映原始样本类别信息的指示向量,利用指示向量各分量的符号差异实现基因表达数据的聚类.通过对白血病和结肠癌数据集的实验,证明了该文方法的有效性.  相似文献   

15.
提出一种改进的非负矩阵因子分解算法.在非负矩阵因子分解的迭代计算过程中加入了数据平滑处理来解决抖动问题,并用于一组白血病微阵列数据分析.实验结果表明,改进过的非负矩阵分解算法提高了分类的准确率,同时这个方法避免了NMF算法的“零值”问题.  相似文献   

16.
Microarray technology, which permits rapid and large-scale screening for patterns of gene expressions, usually generates a large amount of data. How to mine the biological meanings under these data is one of the main challenges in bioinformatics. Compared to the pure mathematical techniques, those methods incorporated with some prior biological knowledge generally bring better interpretations. Recently, a new analysis, in which the knowledge of biological networks such as metabolic network and protein interaction network is introduced, is widely applied to microarray data analysis. The microarray data analysis based on biological networks contains two main research aspects: identification of active components in biological networks and assessment of gene sets significance. In this paper, we briefly review the progress of these two categories of analyses, especially some representative methods.  相似文献   

17.
Isomap在基因表达谱数据聚类分析中的应用   总被引:8,自引:0,他引:8  
基因表达谱数据的聚类分析对于研究基因功能和基因调控机制有重要意义。基于非线性降维算法等容特征映射 ,提出了一种新的大规模基因表达谱数据聚类算法 ,该方法改进了样本向量之间的距离度量 ,用测地距离代替传统的欧式距离 ,有助于挖掘高维数据内在的几何结构。将该算法应用于两个公开的基因表达数据集 ,并用一种新的评价方法Normalized Cut将聚类结果与其他聚类方法的结果进行了比较。结果表明 ,该文的聚类算法优于其他聚类算法 ,聚类结果具有明显的生物学意义 ,并能对数据的类别数作出较好的预测和评估  相似文献   

18.
聚类分析是从基因表达谱数据中提取生物医学信息的主要方法之一.针对传统谱聚类算法无法确定聚类个数的问题,提出一种改进的谱聚类算法并将其应用于基因表达谱聚类分析.首先用基因表达谱数据构造Laplacian矩阵,经特征值分解后得到相应的特征值和特征向量,用谱隙来描述相邻特征值的差值;然后通过寻找谱隙序列的最大值来确定聚类个数;最后从单位化的特征向量着手实现数据类别的划分.通过模拟数据与癌症数据的实验,证明了该文算法的有效性.  相似文献   

19.
 首先有目的地搜集了50个水稻花序相关基因,进行了探针的设计、筛选及合成纯化,用点样仪以微阵列的形式将其点于醛基化的玻璃片上;将3个不同生长阶段的水稻花序材料的总RNA经荧光标记反转录后与寡核苷酸芯片进行杂交.用ScanArray3000对获得的表达谱进行扫描分析显示,芯片图像背景均匀,信号清晰.用ImaGene4.0软件对表达谱分析表明,候选基因在水稻花序3个不同发育阶段的材料中,表达水平有显著差异.为进一步进行水稻寡核苷酸芯片的制备及应用奠定了基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号