首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
从蛋白质的氨基酸组成出发,用信息聚类方法给出了蛋白质的聚类树状图,发现树状图的分支与蛋白质二级结构的含量有较强的相关性.  相似文献   

2.
蛋白质复合物在生物生命活动中扮演着重要作用,基于蛋白质互作用(PPI,Protein-Protein Interaction)网络进行复合物检测是当前的一个研究热点.针对此,提出了一种基于层次图聚类的蛋白质复合物检测算法,其中结合网络拓扑结构和蛋白质复合物信息,给出一种网络结点的权重定义方式;边在蛋白质互作用网络的拓扑属性与层次图聚类算法相结合,提出了一种基于层次图聚类算法的蛋白质复合体识别算法HGCD(Hierarchy Graph Clustering based method for Protein Complexes Discovery).在Utez酿酒酵母PPI网络中进行蛋白质复合物识别结果表明,HGCD算法可以发现网络中的蛋白质复合体.  相似文献   

3.
将宣城市2015年、2016年道路货物运输企业的销售额和纳税额作为观测指标,分别使用k-means聚类分析和系统聚类方法,观测在两种分析方法下的企业分类结果。k-means聚类方法可以得出各分类的最终中心距离和企业分类结果,系统聚类方法可以根据实际需要解读树状图的企业分类结果,使企业精准归类,为地方政府的产业扶持与经济增长决策提供参考。  相似文献   

4.
XML文件可以利用树状结构来表示,于是把如何将XML文件做聚类看成如何对树状结构的数据作聚类.使用SOM聚类工具搭配上Jaccard 的距离测量公式来对XML 文件做聚类,然后在每个cluster 中利用GST(Graph Search Technique)算法从这些XML文件当中找出他们的最大序列,最后将这些最大序列融合起来成为共同的结构.  相似文献   

5.
利用蛋白质序列的循环关系,采用循环匹配算法对数据进行预处理,得到相关联蛋白质数据集,再利用该数据集构造蛋白质的网络图,在此基础上采用图聚类算法,对待预测的蛋白质相关的各个蛋白聚类,并进行子群分割,对各个子群采用z值进一步计算并得出作为预测结果的蛋白质功能.经实验,该方法与其它最新方法相比较,预测结果的最终衡量指标F1-measure具有明显的提升.  相似文献   

6.
基于聚类分析的油气成因类型判别   总被引:1,自引:0,他引:1  
油气成因类型的确定是油气成藏研究的重要基础,常规的定性描述与经验公式存在一定的局限。聚类分析从数学模型入手,通过相似统计量来衡量地质样品或分析指标间的相关性。通过介绍了树状聚类、逐步聚类和双向聚类的原理和方法,并分别应用于油气成因类型研究中,结果表明聚类分析适合多要求下的成因判别,克服了常规方法的局限,判别结果清楚、正确。  相似文献   

7.
蜡梅品种的RAPD分析   总被引:1,自引:0,他引:1  
从200个随机引物中筛选出16个多态性稳定的引物,对38个蜡梅品种进行遗传多样性和亲缘关系RAPD分析.共扩增出154条DNA片段,其中,多态性DNA带98条,占总扩增片段的63.6%.应用Popgene32软件进行Nei相似性系数和遗传距离计算,并利用UPGMA法构建聚类树状图,把供试的38个蜡梅品种分为7个大类,聚类结果与形态分类结果基本一致.结果表明,RAPD标记可用于蜡梅品种鉴定和亲缘关系探讨.  相似文献   

8.
提出一种新的不等保护分组码译码算法——树状图算法.该算法通过对生成矩阵的初等变换,把码字分解成数个码元组,用这些码元组构成树状图的分支字,并使树状图的每一级对应一位信息元,然后在该树状图上搜索最大似然码字,并由此译码.对于信息序列中所有保护能力大于或等于码字中错误比特个数的信息元,该算法都能保证其准确译出,并且大幅度降低了不等保护码译码的运算量,实现了快速译码.  相似文献   

9.
协议聚类是协议逆向工程技术中非常重要的一步,针对二进制协议更加透明且满足的协议种类更加广泛的特点,提出了一种基于基因和蛋白质生物信息的二进制协议聚类方法,能够从原始序列角度对大量协议直接进行聚类.本文方法首先将原始二进制报文转化成四进制基因形式,使用快速聚类方法计算碱基两两组合的k-seed值生成距离矩阵,并用UPGMA计算最小距离生成树得到初始分簇;其次,将每一簇四进制协议报文转化成十六进制蛋白质链,得到序列更有语义的方式并采用基于改进mBed算法的聚类方法将其进行高精度聚类.通过对已知和未知协议单纯和混合场景下的测试表明,该方法能够对二进制协议实现高效并且高准确率的聚类,具有较高的应用价值.  相似文献   

10.
图像聚类是当前的研究热点,非负矩阵分解(non-negative matrix factorization, NMF)算法在图像聚类领域得到了广泛应用。但是单一的NMF算法无法应用于所有数据集,并且NMF算法直接在数据的原始空间进行处理,抗噪能力较差。集成聚类可以解决上述问题,集成聚类将若干个基础聚类结果合成一个一致性结果,不仅可以提高聚类的求解质量,还可以增强算法的鲁棒性。因此本文提出一种层次预处理的NMF加权集成聚类算法。该算法将层次划分、集成聚类和二部图的思想引入到NMF算法中。在预处理阶段,利用层次划分得到聚类数目。之后采用局部加权的方法得到协关联矩阵。最后利用基于二部图的一致性函数进行划分得到最终的聚类结果。在5个数据集上进行实验,验证了本文算法相对于传统算法和其他集成算法的有效性。  相似文献   

11.
彰武松起源的研究   总被引:4,自引:0,他引:4  
用随机扩增多态性DNA(RAPD)技术对章古台地区的樟子松、油松、赤松及彰武松进行了基因组多态性分析,共选用24个10 bp随机引物扩增出147个DNA片段,其中,樟子松和彰武松显示出自身特征性标记,利用这些片段进行种间遗传关系分析,根据UPGMA方法构建聚类树状图研究结果表明:赤松×油松的天然杂交是彰武松形成的主要机制.  相似文献   

12.
总结图聚类几种主要算法,在此基础上详细介绍了一种较新的图聚类算法——基于模拟随机流的Markov图聚类算法(MCL),该算法是基于流这种自然现象的一种简单优美算法,应用在生物信息学网络聚类中比较高效.由于该算法具有运行速度慢、聚类数目过多的缺点,因此又介绍了一种改进的MCL算法——R-MCL算法.  相似文献   

13.
文档聚类和词聚类都是重要且被充分研究的问题.大多数现有的聚类算法针对文档和词是分别聚类,不是同时的.本文提出文档集作为文档和词间的一个二部图的模型思想,使用这个思想,联合聚类问题可以被看成二部图的分割问题.为了解决图的分割问题,使用一个新的联合谱聚类算法,即使用适度规模的词-文档矩阵的奇异向量产生好的分割结果.谱算法得到一些最佳的性能,表明奇异向量通过连续放松解决图划分的NP难问题.最后通过实验结果验证联合聚类算法在实践中非常有效.  相似文献   

14.
CFSFDP聚类算法适应于任意形状的类簇,不需要提前设定聚类数,通过对局部密度和距离的计算产生决策图,从而人工选择聚类中心.若聚类中心在决策图中基本重叠时,肉眼无法分辨,造成对聚类中心的漏选.文章采取基于密度权值平均变化率的CFSFDP聚类算法,增加数据点之间的差异性,以偏离的变化趋势求拐点,通过计算得到聚类中心,提高聚类的准确性.  相似文献   

15.
宋传超  王庚 《山东科学》2013,26(2):92-97
本文将位置敏感哈希算法(LSH)应用于图聚类,提出了概率化的图聚类法(PGC)。利用LSH技术比较图中各结点邻居集的相似度,并结合贝叶斯统计推断进行验证,在线性时间内找到图中最紧密的、非精确聚类。测试结果表明,随着图尺寸的增大PGC扩展性更强,在现实世界数据集上PGC比PageRank Cluster 聚类速度快约1倍,是一种有效的解决方案。  相似文献   

16.
针对FCM进行图像分割时需要人为确定聚类数的问题,提出一种改进的基于FCM的图像分割算法.该算法先对图像进行4叉树结构的子图分解(即原图等分为2×2的4幅子图,子图再等分为2×2的4幅子图),待子图满足一定条件时进行聚类数为2的FCM聚类分割;然后将分割好的区域根据其大小及相邻区域直方图的巴氏距离进行合并,得到最终的分割结果,从而避免了聚类数目的直接确定.实验结果表明:该算法能够获得很好的分割效果;对子图进行聚类分割减少了每次参与聚类的对象数,从而在一定程度上降低了算法的计算量.  相似文献   

17.
宗瑜  金萍 《皖西学院学报》2005,21(5):108-112
聚类分析是重要的数据挖掘技术,在科学研究、工程应用等领域有着广泛的应用背景。由于经典聚类算法的时间复 杂度高、聚类质量低,因此不适合处理图像分析。本文提出的网络流聚类算法则是一种新型的图像信息分析的算法,它适用于图 像分析、分割和聚类,并且具有线性的算法时间复杂度。  相似文献   

18.
基于分层排列图结构的流媒体应用层组播系统   总被引:3,自引:1,他引:3  
为增强基于应用层组播的流媒体广播性能,该文提出构建具有分层排列图结构的应用层组播系统.在该结构中,参与主机组合成多个排列图,每一个排列图中嵌入多个独立组播树;排列图间形成树状结构,对应组播树相互衔接并保证独立性.流媒体数据采用多描述编码(MDC),每一描述数据通过一个独立的组播树传输,使得单个主机故障至多影响一个数据流,以提高系统流媒体服务的稳定性.实验表明,在节点故障率为5%时,分层排列图结构的容错能力与传统随机多组播树结构相比提高20%以上.利用拓扑测量技术,分层排列图结构将参与主机根据相互距离进行聚类,以提高系统的传输效率.  相似文献   

19.
中医证候的多元统计分析及方法研究   总被引:1,自引:0,他引:1  
从“高脂血症及动脉粥样硬化痰瘀证候的蛋白质组学研究”的数据出发,研究影响中医证候的各主要因素。对11种可能的标志蛋白质(群)数据进行分析,以统计聚类为主导思想,给出变量聚类和样本数据聚类综合应用的方法,并结合医学角度对变量聚类结果的分析,指导组内和组间两种样本聚类讨论;同时,通过假设检验,从统计理论上对所得分类予以支持。最后得到标志蛋白质群{结合珠蛋白前体,α-胰蛋白酶抑制剂轻链,脂肪细胞脂质结合蛋白异构体3,补体C4}或{纤维蛋白原γ链,α-胰蛋白酶抑制剂轻链,未确定名称的蛋白(ID1485)}。考虑可能是区分高脂血症及动脉粥样硬化痰证和瘀证的标志蛋白质群,从而给出蛋白质水平上对痰证和瘀证判决方法的建议。  相似文献   

20.
中医证候的多元统计分析及方法研究   总被引:1,自引:0,他引:1  
从"高脂血症及动脉粥样硬化痰瘀证候的蛋白质组学研究"的数据出发,研究影响中医证候的各主要因素。对11种可能的标志蛋白质(群)数据进行分析,以统计聚类为主导思想,给出变量聚类和样本数据聚类综合应用的方法,并结合医学角度对变量聚类结果的分析,指导组内和组间两种样本聚类讨论;同时,通过假设检验,从统计理论上对所得分类予以支持。最后得到标志蛋白质群{结合珠蛋白前体,α-胰蛋白酶抑制剂轻链,脂肪细胞脂质结合蛋白异构体3,补体C4}或{纤维蛋白原γ链,α-胰蛋白酶抑制剂轻链,未确定名称的蛋白(ID1485)}。考虑可能是区分高脂血症及动脉粥样硬化痰证和瘀证的标志蛋白质群,从而给出蛋白质水平上对痰证和瘀证判决方法的建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号