共查询到20条相似文献,搜索用时 62 毫秒
1.
为了快速、准确预测siRNA(Small interfering Ribonucleic Acid)的干扰效率,通过对2431条siRNA的统计学分析找到了一个可靠的预测新方法.通过统计学方法从众多特征中筛选出了19个与siRNA抑制效率相关的序列特征,并用这些特征给出了siRNA抑制效率水平的聚类方法,准确率达到81... 相似文献
2.
在时间序列经典滑动预测基础上,给出了模糊滑动预测方法,并举例说明了它比传统的滑动预测有更强的修匀能力。 相似文献
3.
基于全序列比对相似度预测信号肽 总被引:1,自引:0,他引:1
针对信号肽预测问题,提出采用全序列比对度量序列相似度,以避免以往算法借助滑动窗将整个氨基酸序列分割成等长序列片断所导致的信息丢失及不平衡样本等问题.在此基础上证明基于全序列比对的相似度可嵌入欧式空间,进而借助支持向量机(SVM)进行分类预测.在目前广泛应用的Neilsen数据集上进行实验并与相关结果比较,结果表明所提出的算法确实可以保证稳定的高预测率. 相似文献
4.
本研究构建了一个线粒体基因之间的功能连锁网络,通过该网络来反映基因之间的功能关系,然后利用基于网络的算法计算网络中的基因与线粒体复合物Ⅰ缺陷的相关程度,从而进行疾病基因的预测. 相似文献
5.
王卓 《西北民族学院学报》1997,18(1):18-23
将RFDE(Retarted Functional Differential Equation)和NFDE(Neutral Functional DifferentialEquation)引入到时间序列单元分析预测中,建立了RFDE和NFDE进行预测的理论基础和几个新的预测方法,并解决了其它一些预测方法难以解决的预测问题。 相似文献
6.
Microsoft EXCEL的应用领域是十分广泛的,它的优势是统计计算与绘图制表。是企事业界的不可缺少的工具,随着计算机科学的迅猛发展Microsoft EXCEL也逐步向教学试验跨入如物理、化学实验数据分析与整理以及对数据的提前预测。在实验的过程中利用EXCEL的时间序列分析和预测实验结果,可以大大地节省人力、时间。老师作为引导者不仅要叫他们如何在实验室正确做实验,而且要指引他们如何利用计算机辅助试验,更快更好的完成实验,这也是教学中的新突破。 相似文献
7.
考虑样本数据集的差异性和相关性对疾病预测结果有着直接影响,提出一种基于多特征属性患者相似的糖尿病早期预测方法,根据患者之间特征具有相似性这一特点,对患者特征进行混合属性相似预分组,再把分组结果导入随机森林分类器进行疾病预测。首先以临床概念作为患者的特征项,通过聚类定量化分析不同特征属性类型间的距离来度量患者之间的混合相似度,根据患者混合相似度将患者集预分组为多个患者相似组。最后以随机森林分类器对相似组进行细分类,得到最终的疾病预测结果,该结果与基于全样本数据的随机森林分类结果相比,分类准确率提高了8.3%;与基于单一属性相似组的随机森林分类结果相比,分类准确率提高了5.1%。结果表明该方法具有较高的预测准确率,可为糖尿病诊断预测提供支持。 相似文献
8.
凌佳 《沈阳师范大学学报(自然科学版)》2012,30(4):473-478
以时间序列模型为基础,对未来中国经济发展和工资增长的形势进行分析,经过合理的假设和筛选,确立工资的6个影响因素,继而引入国家效应、企业效应和个人效应3个影响因子。运用SPSS的相关性分析,对影响山东省职工年平均工资的因素进行分析,分别研究了国家效应、企业效应和个人效应与该地区年平均工资的关系,进一步运用SPSS,综合分析这3个因素对该地区平均工资的影响。最后,通过综合国家效应、企业效应和个人效应这3个因素建立的时间序列自回归模型,得到2011—2035年山东省职工年平均工资的预测值。通过时间序列的自回归模型预测值与实际值的Sequence Plot曲线,证实模拟效果较好,预测值符合模拟趋势。 相似文献
9.
时间序列预测法是一种根据动态数据揭示系统动态结构和规律的统计方法.本文给出了时间序列模型的模式识别和实现方法,建立了能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,具有一定的自适应性,能更好地预测实际问题. 相似文献
10.
枯水径流的序列分析和预测 总被引:6,自引:0,他引:6
利用枯水径流的年际变化具有长波性变化这一规律,对汉中盆地主要河流的枯水流量序列进行谐波分析,揭示其周期性变化的规律,为枯水径流长年变化的预测提供依据。 相似文献
11.
ZHOU Yanhong ZHOU Quanxiong LIU Huailan WAN Honghui 《科学通报(英文版)》2005,50(18):2028-2032
Familial dilated cardiomyopathy (FDC) is a common monogenic disease mostly with autosomal dominant inheritance. Fifteen different loci for autosomal dominant FDC have been mapped; however, only eight FDC genes have been found, and it is still a big challenge to identify additional seven FDC genes in their chromosomal regions. We found that the codon usage frequencies in most of known FDC gene sequences are consistently biased, and significantly different from the average codon usage frequencies of human genes. This unique feature of codon usage was used to develop a novel approach to predicting FDC genes. Leave-oneout cross-validation results demonstrate that this approach can effectively detect FDC genes from numbers of genes in their chromosomal regions. Another advantage of this approach is that it is solely based on DNA sequences and therefore has the ability to identify potential FDC genes whose functions are completely unknown. Further, this approach has been used to analyze the seven FDC loci in which the FDC genes are still unknown. Both the detailed prediction results and the prediction program are available at http:// infosci.hust.edu.cn, which might provide help for relevant experimental researches to find new FDC genes. 相似文献
12.
对果蝇胚胎低表达和高表达水平基因内含子的序列结构进行分析,发现2种表达水平的基因内含子序列特征有明显差异.高表达基因的内含子一般比低表达基因的长,其中高表达基因第1内含子的平均长度是低表达基因的2.62倍,第2内含子的平均长度是低表达基因的1.79倍.两类基因第1内含子中的CpG岛含量最高,并且高表达基因内含子中CpG岛含量要高于低表达基因.此外,与低表达基因相比,TATA box、CAAT box和GC box在高表达基因内含子中出现的频数明显要高些,尤其是在第1内含子中.作者还提取出果蝇胚胎2种表达水平基因第1内含子中高频出现的6-mer简单重复序列,发现一些重复序列与实验得到的转录因子结合位点相符合.这些结果提示内含子特别是第1内含子有可能调控果蝇胚胎基因的转录从而影响基因的表达水平. 相似文献
13.
相关疾病基因的发现和预测是人类基因组研究的重要目标.近些年,一些研究者通过基于网络结构的方法来解决这个难题.然而,大多数方法在推理过程中仅使用了局部的网络信息,并且仅限于推理单一基因的关联.并且这些方法很少考虑到疾病-基因关联网络的网络拓扑性.笔者提出一种改进的基于二部图网络结构推理(improved network-based inference)的计算方法.该方法基于已知的疾病-基因网络拓扑相似性来发现更多潜在致病基因.文中使用的是OMIM数据库中的203种疾病的数据,通过留一交叉验证法验证实验,并获得了88.9%的AUC值.与文中提到的另外两种方法相比,该文方法能够有效地预测潜在致病基因. 相似文献
14.
Li Li-jia Song Yun-chun Key Laboratory of MOE for Plant Developmental Biology Wuhan University Wuhan Hubei China 《武汉大学学报:自然科学英文版》2003,8(4):1167-1172
0 IntroductionMaizeisamongthemostintensivelystudiedspeciesingeneticsandoneofagronomicallythemostimportantplants.Therearemanydis easemicrobesandpeststoattackmaize,whichre sultsinlowproductionandbadquality .Withthedevelopmentofverydensegeneticmapconstruc tion ,avarietyoftheimportantdiseaseresistancegenesofmaizeincludingHelminthosporiumtur ciumPassresistancegenesHt1,Htn1andHt2 ,HelminthosporiummaydisNisikresistancegenesRhm1andRhm2 ,maizedwarfmosaicvirusresis tancegeneMdm1,wheatstreakmosaicvi… 相似文献
15.
The focus of almost all the association studies of candidate genes is to test for their importance. We recently developed a LOD score approach that can be used to test against the importance of candidate genes for complex diseases and quantitative traits in random samples. As a complementary method to regular association analyses, our LOD score approach is powerful but still affected by the population admixture, though it is more conservative. To control the confounding effect of population heterogeneity, we develop here a LOD score exclusion analysis using case?parents design, the basic design of the transmission disequilibrium test (TDT) approach that is immune to population admixture. In the analysis, specific genetic effects and inheritance models at candidate genes can be analyzed and if a LOD score is ≤-2.0, the locus can be excluded from having an effect larger than that specified. Simulations show that this approach has reasonable power to exclude a candidate gene having small genetic effects if it is not a disease susceptibility locus (DSL) with sample size often employed in TDT studies. Similar to association analyses with the TDT in nuclear families, our exclusion analyses are generally not affected by population admixture. The exclusion analyses may be implemented to rule out candidate genes with no or minor genetic effects as supplemental analyses for the TDT. The utility of the approach is illustrated with an application to test the importance of vitamin D receptor (VDR) gene underlying the differential risk to osteoporosis. 相似文献
16.
讨论了最大频繁序列模式和公平竞争层次模型(HFC),设计了最大频繁序列模式的挖掘算法(MFSPMA),把MFSPMA同HFC结合起来,提出了基于序列挖掘技术的分等级搜索可持续进化算法(SEAHSM).该进化算法设置多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁子模式挖掘算法挖掘种群中的优良基因,并将具有优良基因模块的新个体注入到不同适应度水平的种群,从而实现遗传信息的稳定继承,有效避免优良基因的丢失.实验结果表明:SEAHSM在维持遗传信息稳定性、避免早熟收敛、提高搜索精度等方面表现良好. 相似文献
17.
Using a polymerase chain reaction (PCR) based method six distinct candidate disease resistant gene (R) homologs from rice have been isolated. The rice sequences are organized into two phylogenetic groups with contrasting genomic
organization patterns. The first group, represented by a single sequence, Osh359-1, is more similar to non-riceR sequences than to rice ones and has a simple genomic organization. The second group, represented by Osh359-3, contains the
remaining five rice sequences. Osh359-3 consists of a multi-gene family. The members of Osh359-3 family are further found
to be clustered together in the genome. 相似文献
18.
针对线性可分与非线性可分问题,讨论了支持向量机分类模型及核函数的选择.为避免支持向量机的核函数及参数选择的不确定性,提出一种近似于支持向量机的分类模型,并通过心脏病预测实例对两种模型进行了比较. 相似文献
19.
利用多颜色空间特征融合方法检测近似目标 总被引:7,自引:0,他引:7
以棉花中羊毛、白头发、塑料膜等杂质的检测为应用背景,提出一种利用多颜色空间特征融合方法。该方法构建了颜色特征评价函数,对近似目标在不同颜色空间的特征表现进行评估,从中抽取近似目标的若干最优特征;再利用区域信息相关度权值小波分析算法进行多特征融合,获取近似目标的图像。实验结果表明,融合图像比原始图像及单色空间图像具有较高的图像信息量值,近似目标视觉特征明显增强。此方法为提取与背景特征相近的近似目标提供一条新思路。 相似文献
20.
松辽盆地南部坳陷期层序地层研究 总被引:5,自引:0,他引:5
在综合分析钻井、测井、地震等各种资料的基础上,对松辽盆地南部坳陷期的层序地层进行了划分。结果表明,此地区坳陷期的层序地层可划分为2个超层序,9个三级层序,其中三级层序的内部结构具有三分(低水位体系域、湖侵体系域和高水位体系域)和二分(湖侵体系域、湖退体系域)两种。在层序的划分过程中建立了浅水区域层序界面的识别标志,即暴露剥蚀面、河道冲刷面、地层叠加型式转换面及泥岩颜色突变面。将△lgR法和锰、铁元素法用于深水区域层序界面的识别,层序界面对应△lgR和叫(Mn)/ω(Fe)的低值,最大湖泛面对应△lgR和叫(Mn)/叫(Fe)的峰值。详细研究了二分层序和三分层序的层序特征,并阐述了其与油气的分布关系,即二分层序以下生上储型油藏组合为主,三分层序以上生下储型油藏组合为主。 相似文献