期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王曦宋剑南房祥忠《北京大学学报(自然科学版)网络版(预印本)》2007,(4)

从"高脂血症及动脉粥样硬化痰瘀证候的蛋白质组学研究"的数据出发,研究影响中医证候的各主要因素。对11种可能的标志蛋白质(群)数据进行分析,以统计聚类为主导思想,给出变量聚类和样本数据聚类综合应用的方法,并结合医学角度对变量聚类结果的分析,指导组内和组间两种样本聚类讨论;同时,通过假设检验,从统计理论上对所得分类予以支持。最后得到标志蛋白质群{结合珠蛋白前体,α-胰蛋白酶抑制剂轻链,脂肪细胞脂质结合蛋白异构体3,补体C4}或{纤维蛋白原γ链,α-胰蛋白酶抑制剂轻链,未确定名称的蛋白(ID1485)}。考虑可能是区分高脂血症及动脉粥样硬化痰证和瘀证的标志蛋白质群,从而给出蛋白质水平上对痰证和瘀证判决方法的建议。相似文献

2.

蛋白质的二级结构序列和结构型 总被引：1，自引：0，他引：1

李晓琴王守源罗辽复《内蒙古大学学报(自然科学版)》2002,33(1):21-25

从蛋白质的二级结构序列出发 ,提出了冗余的概念 ,定义了冗余数量和冗余长度 ,给出了不同结构型蛋白的冗余数量和长度的分布特性 .统计结果表明 α类蛋白中 30 %、β类蛋白中84 %、α/β类蛋白中 95 %的序列不同程度的存在冗余 ,冗余数量和冗余长度主要分布在 1～ 3的范围 .以主二级结构序列三联体为参数 ,利用信息聚类方法对 α类、β类、α/ β类、α β类的6 0 0个蛋白进行了聚类 ,结果表明 ,对冗余较少的α类蛋白 85 %以上能够较好地聚类在一枝中 ,但对于冗余较多的其它类蛋白不能分在一个大支中 ,大部分可以分散在多个小支中 .以主二级结构序列三联体为参数 ,利用 Mahalanobis距离方法对上述四种结构型进行预测 ,预测的总体准确率为 81 .1 % .聚类结果和利用 Mahalanobis距离分类结果充分展示了蛋白质二级结构序列对结构型的特殊作用 ,但由于冗余的影响使得二级结构序列的信息并未充分显示出来 .说明从蛋白质二级结构序列出发预测结构型和构建蛋白质框架结构是合理的选择相似文献

3.

基于图聚类的蛋白质功能预测方法

郭金文林劼《福建师范大学学报(自然科学版)》2015,(3):26-31,38

利用蛋白质序列的循环关系,采用循环匹配算法对数据进行预处理,得到相关联蛋白质数据集,再利用该数据集构造蛋白质的网络图,在此基础上采用图聚类算法,对待预测的蛋白质相关的各个蛋白聚类,并进行子群分割,对各个子群采用z值进一步计算并得出作为预测结果的蛋白质功能.经实验,该方法与其它最新方法相比较,预测结果的最终衡量指标F1-measure具有明显的提升. 相似文献

4.

覆盖聚类算法 总被引：9，自引：0，他引：9

赵姝张燕平张铃张媛陈传明《安徽大学学报(自然科学版)》2005,29(2):28-32

首先比较几类主要的聚类算法,给出每类算法的基本概念、原理、每类的代表性算法,及这些算法的主要特征。在此分析基础上,提出一种新的聚类算法———覆盖聚类算法,该算法采用覆盖的概念将比较集中的样本聚合在一起,从而发现隐含在样本集中的类,对于周围稀疏的样本结合最短距离法,获得聚类效果,并用实验数据对分层聚类方法、LBG方法与覆盖聚类算法进行比较,证明了覆盖聚类算法的可行性和有效性。最后给出了算法的研究方向。相似文献

5.

全国各省旅游业发展的多元统计分析

郑珩高扬《科技资讯》2009,(24):207-208

旅游业的发展对于各省的经济起着重要的作用,本文从国际旅游竞争力．星级饭店实力、旅行社规模与收益、旅游业从业人员、旅游技术人员培养这五个方面选取14个指标组成各省份旅游业发展评价指标体系,运用多元统计中的因子分析提取了五个公因子,并结合因子得分给出了31个省际城市的旅游业发展综合排名,最后分别对原变量和公因子进行6种方法的系统聚类,通过比较聚类结果,给出了中国各省旅游业发展的评价与建议。相似文献

6.

符号数据最佳聚类个数的确定方法

赵兴旺梁吉业曹付元《广西师范大学学报(自然科学版)》2009,27(3)

在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题.尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题.结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法.在UCI数据集上的实验结果表明该方法是有效的. 相似文献

7.

多维数据的聚类结果可视化技术综述 总被引：1，自引：0，他引：1

王开军《福建师范大学学报(自然科学版)》2012,28(4):115-124

在很多情况下,人们不仅需要聚类算法给出类标,还需要掌握聚类结构和数据分布情况.为满足后一项需求,出现了许多聚类结果的可视化(简称聚类可视化)技术,以图形的方式将多维数据和其聚类结果显示在二维或三维空间.从直接在二维或三维空间显示数据及其聚类结果、数据经降维(或映射)后显示以及其它显示方式3种角度综述了常用的30多种聚类可视化方法,并对各种方法的优缺点和适用性进行了分析和讨论. 相似文献

8.

基于密度聚类算法的异常检测

张晓《伊犁师范学院学报(自然科学版)》2010,(4)

聚类算法通常用于数据的聚类,但只要对算法结果从另一角度进行分析,则可发现它还可以用于异常数据的检测. 首先介绍了数据挖掘中的聚类算法,进而结合具体实例给出应用基于密度的聚类算法DBSCAN进行异常检测的过程,最后指出最终异常数据集的确定还应结合领域专家意见. 相似文献

9.

聚类算法在电信客户细分中应用效果的对比研究

成娅辉张英杰《邵阳学院学报(自然科学版)》2009,6(4):69-73

聚类算法是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法．目前其研究已深入到数据库、数据挖掘、统计等领域并取得了很大的成绩。但是由于聚类算法的多样性,使其在很多行业应用中有着不同的应用效果,基于此。本文通过聚类算法三种指标的比较,给出了一种聚类方法应用效果评估的方法．该方法结合电信的案例应用与K-Means、SOM、BIRCH等聚类方法结果的分析,最后得出K-Means方法在电信客户细分中的应用优越性．相似文献

10.

用信息聚类方法研究蛋白质的氨基酸组成和二级结构含量的关系 总被引：3，自引：2，他引：3

李晓琴罗辽复《内蒙古大学学报(自然科学版)》1997,(1)

从蛋白质的氨基酸组成出发，用信息聚类方法给出了蛋白质的聚类树状图，发现树状图的分支与蛋白质二级结构的含量有较强的相关性．相似文献

11.

Hierarchically Clustered HMM for Protein Sequence Motif Extraction with Variable Length 总被引：1，自引：0，他引：1

Cody Hudson ;Bernard Chen ;Dongsheng Che 《清华大学学报》2014,(6):635-647

Protein sequence motifs extraction is an important field of bioinformatics since its relevance to the structural analysis. Two major problems are related to this field：（1） searching the motifs within the same protein family; and（2） assuming a window size for the motifs search. This work proposes the Hierarchically Clustered Hidden Markov Model（HC-HMM） approach, which represents the behavior and structure of proteins in terms of a Hidden Markov Model chain and hierarchically clusters each chain by minimizing distance between two given chains＇ structure and behavior. It is well known that HMM can be utilized for clustering, however, methods for clustering on Hidden Markov Models themselves are rarely studied. In this paper, we developed a hierarchical clustering based algorithm for HMMs to discover protein sequence motifs that transcend family boundaries with no assumption on the length of the motif. This paper carefully examines the effectiveness of this approach for motif extraction on 2593 proteins that share no more than 25% sequence identity. Many interesting motifs are generated.Three example motifs generated by the HC-HMM approach are analyzed and visualized with their tertiary structure.We believe the proposed method provides a unique protein sequence motif extraction strategy. The related data mining fields using Hidden Markova Model may also benefit from this clustering on HMM themselves approach. 相似文献

12.

基于关联规则的中医症状组团分析 总被引：2，自引：2，他引：0

王亚强金晖于中华蒋永光张学红《四川大学学报(自然科学版)》2009,46(6):1650-1654

症状组团分析是中医学研究的热点问题,具有重要的理论意义和临床应用价值,也是中医诊断进一步发展的基础,目前尚处于探索阶段。本文以数据挖掘为技术手段,提出了基于关联规则的中医症状组团分析算法,该算法通过分析证素与证候、证候与症状的关联关系,得出症状与症状之间的联系,从而自动发现具有相似或相同意义的症状组团。充分的实验结果表明,所提出的算法可以有效地发现症状组团,准确率达到85.11%。相似文献

13.

基于ART和Yu范数的聚类方法在齿轮故障诊断中的应用

下载免费PDF全文

徐增丙李友荣王志刚轩建平《武汉科技大学学报》2016,39(2):116-120

针对传统聚类方法需预先指定类别个数而导致应用受限的问题,提出一种基于ART和Yu范数的聚类方法,可自适应地确定类别个数。通过对齿轮无标记故障样本的诊断分析对该方法进行验证。从多个角度提取反映故障信息的特征参数集,利用距离区分技术对其进行优选,并结合ART的机制和基于Yu范数的聚类技术,对齿轮故障类别进行诊断分析,并与Fuzzy ART方法的诊断结果进行比较。结果表明,该方法可以有效地对齿轮故障进行区分,且效果优于Fuzzy ART方法。相似文献

14.

基于均值漂移的舌体分割算法

刘静仇大伟《山东科学》2014,27(2):58-62

本文针对舌体图像的特点,提出了一种基于均值漂移的舌体图像分割算法。该算法首先对输入图像进行平滑,可有效消除舌苔裂纹和色块噪声对舌体分割的干扰,然后根据空域和值域的邻近性原则进行聚类,根据聚类结果对舌体图像进行分割。实验结果表明,对不同的舌体图像进行分割,分割结果符合中医医师的诊断要求,对有噪声的图像,该方法也可较好地实现舌体分割。相似文献

15.

增量聚类算法综述 总被引：2，自引：1，他引：1

李桃迎陈燕秦胜君李楠《科学技术与工程》2010,10(35)

给出了增量聚类的概念,分析了增量聚类方法可以用于解决数据的变化和大量存储空间的需求问题。增量聚类算法选择恰当时,可以保证数据在变化时有效地提高聚类的精度和效率。从传统聚类、生物智能聚类和数据流聚类三个角度研究了增量聚类问题,分析了增量聚类问题的研究进展,包括发展的过程及特点,阐述了研究增量聚类问题的关键技术,最后给出了未来的发展趋势。相似文献

16.

基于模糊神经网络的MVB故障诊断算法

吕洪武赵航王宏志胡黄水《吉林大学学报(理学版)》2002,58(1):104-108

针对多功能车辆总线具有随机性和不确定性导致故障诊断准确率较低的问题, 设计一种基于模糊神经网络的MVB故障诊断算法. 首先根据MVB故障类型给出诊断模型, 然后采用减法聚类生成数量较少的模糊规则, 最后采用T-S模糊神经网络对故障进行分类. 在MATLAB环境下对该算法的拟合能力及诊断准确率进行仿真分析的结果表明, 该算法简化了模糊神经网络结构, 有效提高了故障诊断准确率. 相似文献

17.

基于模糊神经网络的MVB故障诊断算法

吕洪武赵航王宏志胡黄水《吉林大学学报(理学版)》2020,58(1):104-108

针对多功能车辆总线具有随机性和不确定性导致故障诊断准确率较低的问题, 设计一种基于模糊神经网络的MVB故障诊断算法. 首先根据MVB故障类型给出诊断模型, 然后采用减法聚类生成数量较少的模糊规则, 最后采用T-S模糊神经网络对故障进行分类. 在MATLAB环境下对该算法的拟合能力及诊断准确率进行仿真分析的结果表明, 该算法简化了模糊神经网络结构, 有效提高了故障诊断准确率. 相似文献

18.

中英双语混合语音识别研究

张晴晴潘接林颜永红《重庆邮电大学学报(自然科学版)》2008,20(4):391-396

介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题：①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法（TCM）,并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明：利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率（PER）相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。相似文献

19.

基于模糊聚类算法的精炼过程真空系统故障诊断 总被引：1，自引：0，他引：1

王庆巴德纯靳雨菲王晓冬《东北大学学报(自然科学版)》2003,24(11):1085-1087

针对大型真空冶金系统(DVMS)的故障点多、故障征兆不明显且要求其故障诊断快速、准确的特点,提出了一种基于模糊聚类算法的智能诊断模型·该模型具有很强的自学习、自组织能力适用于大型复杂真空系统的故障诊断·在介绍了模糊聚类算法的理论同时,给出了模糊故障诊断的步骤·以RH KTB真空冶金系统的智能故障诊断为例给出了模糊诊断的实际过程·通过分析证实了该算法对大型复杂真空冶金系统智能故障诊断的有效性· 相似文献

20.

基于离群点检测的K-means算法

冷泳林张清辰赵亮鲁富宇《锦州师范学院学报(自然科学版)》2014,(1):34-38,48

K-means算法以其简单、快速的特点在现实生活中得到广泛应用。然而传统K-means算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高。针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子。然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中。算法有效降低离群点对K-means算法的影响,提高聚类结果的准确率。实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效降低离群点对K-means算法的影响,提高了聚类的精确率和稳定性。相似文献