首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
为降低基因剪接位点识别算法复杂度和计算量,根据剪接位点上下游序列的保守特性及碱基组成随位点邻近序列GC含量变化等统计特征,建立Takagi-Sugeno模糊模型.通过模型输出值和阈值比较,判断真实的剪接位点.基于模糊似然函数的模糊聚类算法确定模型结构和前件参数,并结合最小二乘法完成该模型后件参数的识别.仿真结果表明,该算法简单,可使模糊模型的结构辨识和参数辨识同时完成,从而实现模糊模型的快速识别;能够很好地提取剪接位点附近保守序列的统计特征,为剪接位点的识别提供一种新的方法.  相似文献   

2.
基于特征挖掘与融合的剪接位点识别   总被引:3,自引:1,他引:3  
在基于保守序列这一信号特征识别剪接位点的基础上.挖掘了可用于剪接位点识别的其他多个特征(包括剪接位点上、下游序列的碱基组成。剪接位点信号和上、下游序列的碱基组成随位点邻近序列C+G含量的变化等统计特征),建立了描述这些特征的模型。设计了能有效融合这些特征对剪接位点进行识别的对数线性模型,开发了剪接位点识别程序SpliceKey.测试结果表明:SpliceKey识别剪接位点的精度不仅较WAM方法有显著的提高,而且也优于国际上最新发布的剪接位点识别软件DGSplice.SpliceKey已提供网络服务:http://infosci.hust.edu.cn/SpliceKey/.  相似文献   

3.
利用RNA二级结构的预测程序,通过对148个人类基因由EST验证的发生剪接的784个供体位点和受体位点以及101个人类基因由EST验证的发生选择性剪接的418个供体位点和受体位点附近的二级结构的预测,寻找真核基因剪接位点及选择性剪接位点的二级结构特征。通过详细研究剪接位点及选择性剪接位点在RNA二级结构中的结构分布,获得了一些剪接位点及选择性剪接位点在RNA二级结构中结构分布的规律性。结果表明,在RNA剪接及选择性剪接过程中,顺式作用元件具有结构特定性。这种结构特定性可以从结构上对真核基因剪接及选择性剪接机制进行一些合理的解释,有利于对真核基因剪接位点的识别及其表达调控机理的进一步理解。  相似文献   

4.
为提高剪接位点识别的精度,提出一种基于综合信息的剪接位点识别方法.通过分析供体位点与受体位点的剪接信号、剪接序列、位点附近序列的二级结构,以及剪接因子作用过程等特征,分别为供体位点与受体位点建立信号模型和序列模型;应用Vienna软件中的Mfold包预测每个剪接位点附近序列最稳定的二级结构,将传统的四字符核酸表转化为八字符核酸表,每个序列用八字符进行描述,用结合了结构信息的序列对信号模型和序列模型进行训练学习;最后用训练好的模型进行剪接位点的识别.实验结果证明:该方法对剪接位点的识别取得了很好的效果,其识别精度可达95%以上.  相似文献   

5.
本文对人类基因供体剪接位点的数据进行词频统计,分析了位点序列的特征及其特征碱基之间的关系。通过改进传统隐马尔可夫模型(HMM),使其能将各特征碱基以相应权值关联识别位点。结果显示改进模型的识别能力要强于传统模型。同时对特征位点较相似的序列有了更好的区分度。  相似文献   

6.
研究剪接位点可以更深入地探索剪接机制和基因预测方法,准确预测剪接位点至关重要。基于深度学习技术提出一种新的预测方法,无需人工提取样本特征,以基因序列的K-MER编码向量作为输入,采用训练后的卷积神经网络(CNN)模型进行预测。基于人类基因HS3D供体数据集,与传统机器学习方法进行预测比较,结果表明预测模型的主要性能指标,包含马修斯相关系数(MCC)、灵敏度(SN)均超过传统的机器学习方法。  相似文献   

7.
为解决传统的基因识别算法主要关注编码区的整体特性,而并不着重考虑个别位点的信息,因此难以准确地识别出剪接位点的缺点,提出了基于条件随机场的剪接位点预测方法,条件随机场能够更好的处理标记数据之间的依赖关系,并且能够避免数据标记偏置的问题。实验结果表明基于条件随机场的剪接位点预测方法是一种合适的方法,能够取得更好的效果。  相似文献   

8.
提出一种混合模型,即将隐马尔可夫模型(HMM)和小波神经网络(WNN)相结合应用于说话人识别的模型.该方法利用HMM的时序建模能力以及小波神经网络较强的模式分类能力,进行与文本无关的说话人的识别.实验表明,采用这种混合模型可以提高系统的识别率,特别在噪声环境中具有一定的噪声鲁棒性,提高了识别性能.  相似文献   

9.
基于快速傅里叶变换的剪接特征提取   总被引:1,自引:1,他引:0  
挖掘剪接特征是剪接位点识别算法的基础,在频域空间挖掘对位点识别有帮助的特征至关重要.利用基于快速傅里叶变换的剪接特征提取方法对其进行特征提取,该方法能够将时域信息转化到频域中,以此来构建所需的频域特征,为了比较还构建了位置特征与统计特征. 实验结果表明将频域特征加入剪接位点识别中能够有效地提高识别精度,这也表明将信号处理方法应用于生物信息学领域是可行有效的.   相似文献   

10.
老鼠和人类基因组的同源性超过90%,老鼠基因组的研究为人类基因组序列研究提供了参考数据.统计分析了老鼠盒式外显子和内含子保留型剪接位点附近的序列保守性特征,并据此分别利用基于多样性指标的支持向量机和二次判别法对老鼠基因组中这两种剪接类型的供体端和受体端可变剪接位点进行了预测.独立检验结果表明,盒式外显子和内含子保留型的供体端和受体端可变剪接位点的预测均能达到较高的识别精度.  相似文献   

11.
Motivation: It was found that high accuracy splicing-site recognition of rice ( Oryza satlva L. ) DNA sequence is especially difficult. We described a new method for the splicing-site recognition of rice DNA sequences. Method: Based on the intron in eukaryotic organisms conforming to the principle of GT-AG, we used support vector machines (SVM) to predict the splicing sites. By machine learning, we built a model and used it to test the effect of the test data set of true and pseudo splicing sites. Results : The prediction accuracy we obtained was 87.53% at the true 5‘ end splicing site and 87.37% at the true 3‘ end splicing sites. The results suggested that the SVM approach could achieve higher accuracy than the previous approaches.  相似文献   

12.
Alternative splicing of pre-messenger RNAs diversifies gene products in eukaryotes and is guided by factors that enable spliceosomes to recognize particular splice sites. Here we report that alternative splicing of Saccharomyces cerevisiae SRC1 pre-mRNA is promoted by the conserved ubiquitin-like protein Hub1. Structural and biochemical data show that Hub1 binds non-covalently to a conserved element termed HIND, which is present in the spliceosomal protein Snu66 in yeast and mammals, and Prp38 in plants. Hub1 binding mildly alters spliceosomal protein interactions and barely affects general splicing in S. cerevisiae. However, spliceosomes that lack Hub1, or are defective in Hub1-HIND interaction, cannot use certain non-canonical 5' splice sites and are defective in alternative SRC1 splicing. Hub1 confers alternative splicing not only when bound to HIND, but also when experimentally fused to Snu66, Prp38, or even the core splicing factor Prp8. Our study indicates a novel mechanism for splice site utilization that is guided by non-covalent modification of the spliceosome by an unconventional ubiquitin-like modifier.  相似文献   

13.
14.
真核基因表达调控是生命科学研究的前沿、热点。RNA的选择性剪接在真核基因表达调控中起着十分重要的作用。该文从已有数据出发 ,对真核基因的剪接机制以及选择性剪接的机制进行了初步的研究。结果表明 ,在真核基因的剪接过程中 ,可能存在一种“粗定位—细定位”的过程 ,即在剪接过程中首先有一粗略的定位过程 ,根据序列的嘌呤、嘧啶浓度特征寻找出剪接位点的大致位置 ;然后在这一基础上 ,根据几个保守碱基所提供的信息找到准确的剪接位点。这一结果对于进一步研究真核基因的剪接机制 ,特别是选择性剪接发生的机理有很大的启发。  相似文献   

15.
16.
Zorio DA  Blumenthal T 《Nature》1999,402(6763):835-838
Introns are defined by sequences that bind components of the splicing machinery. The branchpoint consensus, polypyrimidine (poly(Y)) tract, and AG at the splice boundary comprise the mammalian 3' splice site. Although the AG is crucial for the recognition of introns with relatively short poly(Y) tracts, which are termed 'AG-dependent introns', the molecule responsible for AG recognition has never been identified. A key player in 3' splice site definition is the essential heterodimeric splicing factor U2AF, which facilitates the interaction of the U2 small nuclear ribonucleoprotein particle with the branch point. The U2AF subunit with a relative molecular mass (Mr 65K) of 65,000 (U2AF65) binds to the poly(Y) tract, whereas the role of the 35K subunit (U2AF35) has not been clearly defined. It is not required for splicing in vitro but it plays a critical role in vivo. Caenorhabditis elegans introns have a highly conserved U4CAG/ R at their 3' splice sites instead of branch-point and poly(Y) consensus sequences. Nevertheless, C. elegans has U2AF, 12). Here we show that both U2AF subunits crosslink to the 3' splice site. Our results suggest that the U2AF65-U2AF35 complex identifies the U4CAG/R, with U2AF35 being responsible for recognition of the canonical AG.  相似文献   

17.
基于CDHMM/SOFMNN噪声背景下的语音识别方法   总被引:2,自引:0,他引:2  
针对噪声背景下传统语音识别系统识别率较低的问题,提出了一种将自组织特征映射神经网络(SOFMNN)与隐马尔可夫模型(HMM)相结合的方法,训练出适应噪声的混合模型.该模型适合于对噪声背景下的语音进行识别.同传统的CDHMM模型以及直接在语音中加入加性噪声训练出的CDHMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2~12 dB),识别率比传统CDHMM模型有明显提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号