首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 859 毫秒
1.
本文对人类基因供体剪接位点的数据进行词频统计,分析了位点序列的特征及其特征碱基之间的关系。通过改进传统隐马尔可夫模型(HMM),使其能将各特征碱基以相应权值关联识别位点。结果显示改进模型的识别能力要强于传统模型。同时对特征位点较相似的序列有了更好的区分度。  相似文献   

2.
基于特征挖掘与融合的剪接位点识别   总被引:3,自引:1,他引:3  
在基于保守序列这一信号特征识别剪接位点的基础上.挖掘了可用于剪接位点识别的其他多个特征(包括剪接位点上、下游序列的碱基组成。剪接位点信号和上、下游序列的碱基组成随位点邻近序列C+G含量的变化等统计特征),建立了描述这些特征的模型。设计了能有效融合这些特征对剪接位点进行识别的对数线性模型,开发了剪接位点识别程序SpliceKey.测试结果表明:SpliceKey识别剪接位点的精度不仅较WAM方法有显著的提高,而且也优于国际上最新发布的剪接位点识别软件DGSplice.SpliceKey已提供网络服务:http://infosci.hust.edu.cn/SpliceKey/.  相似文献   

3.
隐Markov模型在剪接位点识别中的应用   总被引:6,自引:0,他引:6  
剪接位点的识别是基因识别中的一个重要环节。由于现有的基因识别算法主要关注编码区的整体特性 ,而并不着重考虑个别位点的信息 ,因此难以准确地识别出剪接位点。考虑到剪接位点附近的保守序列的相邻碱基之间应该存在某种相关性 ,利用一阶 Markov链建立了表述这种相关性的模型 ,在此基础之上 ,设计了专门用于剪接拉点识别的隐马氏模型 (HMM)方法。实验结果表明 ,用 HMM描述剪接位点附近序列符合实际情况 ,并且利用这一方法进行剪接位点的识别可以很好地提取位点附近保守序列在边缘分布与条件分布 (转移概率 )上的统计特征。使用该方法对真实剪接位点和虚假剪接位点进行识别 ,识别率均可达 90 %以上。  相似文献   

4.
为提高剪接位点识别的精度,提出一种基于综合信息的剪接位点识别方法.通过分析供体位点与受体位点的剪接信号、剪接序列、位点附近序列的二级结构,以及剪接因子作用过程等特征,分别为供体位点与受体位点建立信号模型和序列模型;应用Vienna软件中的Mfold包预测每个剪接位点附近序列最稳定的二级结构,将传统的四字符核酸表转化为八字符核酸表,每个序列用八字符进行描述,用结合了结构信息的序列对信号模型和序列模型进行训练学习;最后用训练好的模型进行剪接位点的识别.实验结果证明:该方法对剪接位点的识别取得了很好的效果,其识别精度可达95%以上.  相似文献   

5.
蛋白质与DNA的相互作用在细胞的转录调控和DNA修饰等活动中至关重要.将改进的共鸣识别模型应用于预测酵母蛋白质与DNA的相互作用,运用小波变换找出阳性数据和随机数据的信噪比分布的差异,并通过阈值的选取达到了较好的预测结果.同时,将阳性数据与相应复合物的序列进行序列联配,找到了保守位点,进而从结合位点的角度验证了本方法的正确性.  相似文献   

6.
提出一种融合智能检测的DNA序列预处理新方法。该方法不需要预先给出载体序列、剪接位点和克隆适配片段等信息,通过统计分析、随机搜索和构建图操作等方法自动发现并定位垃圾信息。以Zebrafish DNA序列为样本进行的预处理实验结果证明该方法能够显著提高DNA序列预处理的效率和准确性,在处理超长序列时更稳定、错误率更低。  相似文献   

7.
基于知识编码的剪切位点预测   总被引:1,自引:0,他引:1  
在现有生物统计中,对脱氧核糖核酸中碱基的编码表达主要限于腺嘌呤,鸟嘌呤,胞嘧啶和胸腺嘧啶4种.但这种编码方式的变量太少,同时没有考虑碱基在脱氧核糖核酸中的位置信息,在剪切位点预测中,准确率不会超过90%.据此采用基于知识的编码方式,即真剪切位点与假剪切位点的统计差表,结合支持向量机方法,大大提高了剪切位点识别的准确率,并进一步采用碱基的统计特征的多变量编码方式使真给体位点和假给体位点的预报率分别达到96.4%和93.0%,真受体位点和假受体位点的预报率分别达到94.4%和93.0%.  相似文献   

8.
老鼠和人类基因组的同源性超过90%,老鼠基因组的研究为人类基因组序列研究提供了参考数据.统计分析了老鼠盒式外显子和内含子保留型剪接位点附近的序列保守性特征,并据此分别利用基于多样性指标的支持向量机和二次判别法对老鼠基因组中这两种剪接类型的供体端和受体端可变剪接位点进行了预测.独立检验结果表明,盒式外显子和内含子保留型的供体端和受体端可变剪接位点的预测均能达到较高的识别精度.  相似文献   

9.
分形在DNA碱基序列分析中的应用   总被引:2,自引:0,他引:2  
介绍了分形原理和方法在DNA碱基序列分析中的应用,包括DNA碱基序列的一维行走、二维行走、子序列 分解及分形维数的计算,表明用分形的方法不仅可以对DNA碱基序列中的长程关联性作定量描述,而且有利于人们 进一步认识DNA中碱基序列的关联规律.  相似文献   

10.
为降低基因剪接位点识别算法复杂度和计算量,根据剪接位点上下游序列的保守特性及碱基组成随位点邻近序列GC含量变化等统计特征,建立Takagi-Sugeno模糊模型.通过模型输出值和阈值比较,判断真实的剪接位点.基于模糊似然函数的模糊聚类算法确定模型结构和前件参数,并结合最小二乘法完成该模型后件参数的识别.仿真结果表明,该算法简单,可使模糊模型的结构辨识和参数辨识同时完成,从而实现模糊模型的快速识别;能够很好地提取剪接位点附近保守序列的统计特征,为剪接位点的识别提供一种新的方法.  相似文献   

11.
Rough set theory is a new mathematical tool to deal with vagneness and uncertainty. But original rough sets theory only generates deterministic rules and deals with data sets in which there is no noise. The variable precision rough set model (VPRSM) is presented to handle uncertain and noisy information. A method based on VPRSM is proposed to apply to fault diagnosis feature extraction and rules acquisition for industrial applications. An example for fault diagnosis of rotary machinery is given to show that the method is very effective.  相似文献   

12.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

13.
粗糙集理论及其应用进展   总被引:90,自引:0,他引:90  
粗糙集理论是一种新型的处理模糊和不确定知识的数学工具。目前已在人工智能、知识与数据发现、模式识别与分类、故障检测等方面得到了广泛应用。首先描述了粗糙集的基本算法及其复杂度 ,包括等价关系 ,上下近似及各种约简算法 ;接着对粗糙集扩展理论 ,如可变精度模型 ,相似模型等进行了讨论 ,然后对粗糙集在数据挖掘、大数据集、粗糙逻辑、多方法融合等领域中的应用进展情况进行了论述 ,最后给出了建议的研究方向  相似文献   

14.
郭冬梅 《科技信息》2011,(3):I0060-I0060,I0068
数据挖掘的技术很多,其中粗糙集理论得到了广泛的应用。粗糙集理论是一种研究不完整、不确定知识处理的数学工具,它可对不完整的数据进行分析和归纳,从中发现知识。本文介绍了数据挖掘基本概念,阐述了粗糙集理论的基本思想,探讨了基于粗糙集理论的数据挖掘方法。  相似文献   

15.
粗糙集的不确定性度量是粗糙集理论中的关键问题之一。粗糙隶属函数为粗糙集提供了新的解释,并为粗糙集的不确定性度量提供了方法。Tsang对覆盖近似空间中的近似算子进行了研究,提出了一种较已有模型更合理的覆盖粗糙集模型。但是,该覆盖粗糙集的不确定性度量却没有被研究。针对第三类覆盖粗糙集模型,定义了第三类覆盖粗糙集的粗糙隶属函数,并据此定义了第三类覆盖粗糙集的模糊度。  相似文献   

16.
粗糙集理论及其在数据挖掘中的应用   总被引:6,自引:0,他引:6  
Rough sets理论被广泛运用于不确定环境下的信息处理.基于粗糙集理论的数据挖掘技术正日益受到计算机科学家和数学家的重视.笔者介绍了粗糙集理论的发展过程和基本特点,粗糙集理论在数据挖掘中的应用,以及典型的基于粗糙集的数据挖掘系统,并介绍了粗糙集理论的研究方向和研究领域,最后论述了粗糙集理论与其他智能化方法结合起来处理信息的必要性.  相似文献   

17.
基于粗集理论的数据离散化技术研究   总被引:3,自引:0,他引:3  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义。它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

18.
基于粗集理论的数据离散化技术研究   总被引:2,自引:0,他引:2  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义,它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

19.
粗糙集理论是一种新的处理模糊和不确定性知识的数学工具.相似度是用于比较2个相似的模糊粗糙集所包含信息的精确性大小的,是模糊集理论和粗糙集理论的热点问题之一.文章利用一种改进的相似度定义了模糊粗糙近似算子,重新定义了粗糙集的一些概念,给出并证明了模糊粗糙近似算子的几个性质.  相似文献   

20.
覆盖粗糙集的模糊度   总被引:5,自引:0,他引:5  
粗糙集的不确定性度量是粗糙集理论中的关键问题之一.粗糙隶属函数为粗糙集提供了新的解释,并为粗糙集的不确定性度量提供了方法.Tsang对覆盖近似空间中的近似算子进行了研究,提出了一种较已有模型更合理的覆盖粗糙集模型.但是,该覆盖粗糙集的不确定性度量却没有被研究.针对第三类覆盖粗糙集模型,定义了第三类覆盖粗糙集的粗糙隶属函数,并据此定义了第三类覆盖粗糙集的模糊度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号