首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
首先基于频率分析方法抽提出果蝇核糖体蛋白(RP)基因外显子上游直至第1个内含子结束的序列(称为启动子)中潜在的调控模体,这些模体中有85%与实验上的转录因子匹配.然后将抽提出的模体两两配对,运用超几何分布找出出现条数比例在RP基因中显著高于在背景启动子中的模体对,并进一步用K-S检验提取出它们在RP基因中的距离分布与背景距离分布有显著差异的模体对,这些模体对被认为具有转录协同作用.它们中的一部分与实验结果匹配.分析提取出的模体对在序列中的位置分布,发现它们主要的协同作用区域是上游区,而上游和内含子之间的协同作用也是一种重要的组合调控形式,同时发现模体对的模体间距离大部分位于300bp以内,并且在第一外显子附近较为集中.这些结果将有助于对RP基因转录调控机制的认识.  相似文献   

2.
刘咏梅 《应用科技》2011,38(5):66-68
作为转录因子结合位点的模体,在真核生物的启动子识别以及基因转录和表达中起着重要的作用,找到这些模体之间的特征是非常有意义的研究课题.针对用于启动子特征的模体的相关性检测问题,利用独立成分分析技术将观测到的模体频率矩阵分解成小的组成部分,给出了一个将模体进行分组的方法,可以得到趋于共同出现的模体的集合.在实验结果分析中,...  相似文献   

3.
为了有效度量2个模体的相似度,提出一种带有信息容量的用于模体比较的非比对度量算法ICBSN.该算法通过将一个模体的位置频率矩阵在另一个模体的带有信息容量的位置赋权矩阵上滑动,计算出2个模体间的相似度,算法依赖参数少,计算效率高.与其他7种度量法进行比较分析,结果表明:ICBSM可以在数据库查找中更准确地匹配模体,并且能够更有效地聚类相似模体,区分出不相关的模体,为找回模体和分组密切相关模体等方面的研究工作提供有效的计算工具.  相似文献   

4.
提出了生物序列模体发现的最优化模型,该模型适用于搜索资源(如计算时间)有限的情况,传统的模体发现方法可能在资源耗尽后仍不能得出任何结果.基于最优搜索理论给出了一种在有限的时间资源下的最优模体发现策略和算法实现,并得到了一些实验结果.  相似文献   

5.
基于KL散度和BP神经网络的人类基因启动子识别   总被引:2,自引:0,他引:2  
人类基因启动子预测和识别是DNA序列分析中的一项重要任务.提出了一个基于KL散度和BP神经网络的人类基因启动子识别算法.利用KL散度提取分辨力最强的六联体来区分启动子和非启动子区域,将这些六联体的出现频率作为识别启动子的组成成分特征,结合CpG岛特征,应用BP神经网络技术建立人类启动子识别系统.该系统有3个分类器,即启动子-外显子分类器,启动子-内含子分类器和启动子-3’UTR分类器,每个分类器都是一个BP神经网络,通过3个分类器的结果来综合预测启动子序列.对测试集的实验结果为:敏感性达到51.4%,特异性达到52.9%.  相似文献   

6.
针对概率模体发现算法中非树形子图的挖掘和在得分函数最大化的过程中得分函数值计算的2个难点.首先提出基于划分的非树形子图的搜索算法,其次将子图同构应用于最小错配的求解以缩小智能优化算法对得分函数求解的解空间,最后将基于模拟退火算法和遗传算法的混合算法应用于得分函数的求解过程.在大肠杆菌基因调控网络中的实验结果表明,与其他算法相比,混合智能算法可以大大减少非树形子图的搜索时间,并以相对较快的收敛速度收敛到一个较优的解,因此所提出的方法有效地提高了概率模体发现的效率.  相似文献   

7.
为了提高社团发现算法的效率,提出了一种基于三角模体和期望极大的社团结构发现(Community structure discovery based on triangular motifs and expectation-maximization,CSDTME)模型的社团发现算法。CSDTME模型采用三角模体对网络进行表示,考虑了节点的混合隶属度及社团间的链接关系,用期望极大算法计算模型涉及的参数,采用全三角模体和两边三角模体作为计算对象,通过减少计算对象来提高算法的效率,根据参数结果可得到节点的社团隶属度及社团间的链接关系。实验结果表明:在保证社团发现能力的同时,该算法能够提高社团发现的效率。  相似文献   

8.
通过整合果蝇已有的ChIP数据集,采用模体发现算法FisherNet及高性能并行的模体聚类算法CLIMP对果蝇的顺式调控模块进行从头预测.与已知的顺式调控模块进行比对分析,结果表明该方法预测结果覆盖了数据集中已知顺式调控模块的82.93%,证明该方法具有一定的普适性.与较新的DePCRM算法进行比较,结果表明本算法在从头预测顺式调控模块上速度更快、精度更高.  相似文献   

9.
基于蛋白质相互作用的网络有明显模块化特征, 其对预测蛋白质功能、解释特定的生物进程具有重要作用, 网络模体是复杂网络演化的 重要拓扑结构, 其代表了复杂系统中的重要功能单元, 具有进化保守性的特性, 提出一种新的基于网络模体为核心节点组的蛋白质复合物识别算法. 该算法根据蛋白质相互作用网络的拓扑特性, 将模体作为蛋白质复合物的中心结构体, 并基于中心结构体进行二层节点扩充, 能准确有效地识别蛋白质复合物. 并且将复合物二维网络进行三维转化, 从而更直观清晰地展示复合物的结构体特征. 实验结果验证了该算法的有效性及可行性.  相似文献   

10.
MCL聚类算法求解植入(l,d)模体识别问题   总被引:1,自引:0,他引:1  
模体识别是指寻找一系列功能相近且形式相似的基因片段.为此将MCL聚类算法引入模体识别应用,设计出一种适用于这个问题的新算法,在一组目标DNA序列中找到拟识别的模体.该方法基于马尔科夫链原理,构建概率转移矩阵,按随机游走方式对矩阵进行扩展、膨胀迭代,最终形成各个样本的分类.在此基础上进行贪心算法求精计算,得出若干组模体.实验表明该算法是有效的.  相似文献   

11.
植物启动子识别是真核启动子识别中的重要研究领域.针对目前植物启动子识别算法的特异性较低的问题,提出了一种基于GC碱基偏好分析和支持向量机(SVM)的植物启动子识别算法.首先通过对GC含量的分析将DNA序列分类为GC偏好序列和非GC偏好序列,然后进行结构特征和信号特征的提取,最后通过SVM分类器进行启动子识别.SVM分类器由四个SVM子分类器组成,即启动子-3’UTR子分类器,启动子-5’UTR子分类器,启动子-Intergenics子分类器和启动子-CDS子分类器.实验结果表明,该算法比其他算法具有更高的特异性,对植物启动子识别具有积极意义.  相似文献   

12.
蛋白质超家族模体保守性及物理化学性质的分析   总被引:1,自引:1,他引:0  
分析了全β类4个典型的蛋白质超家族中模体的功能,发现免疫球蛋白超家族和纤维结合蛋白类型Ⅲ超家族中的模体有相似的结构,但是它们行使不同的功能.血小板-白细胞C激酶底物的同源物结构域超家族和核酸结合超家族中的模体类型较多,虽然这些模体只是部分结构相似,然而它们却在各自的超家族中分别执行着相同的功能.文章进一步运用统计学方法研究了蛋白质超家族中保守模体的亲疏水特征、物理化学特征和结构特征.结果表明,模体差异有显著意义的残基存在于序列模体的保守位点上,相同的序列模体具有相似的二级结构.这些特征将对进一步识别超家族提供帮助.  相似文献   

13.
Montgomery模幂运算的一种改进方案   总被引:1,自引:0,他引:1  
在RSA算法中,大数模幂运算的核心是大数模乘运算.本文在传统的Montgomery算法的基础上,利用快速大整数平方运算,提出了Montgomery算法的一种改进方案,有效缩短了大数模幂运算的时间,从而提高了RSA算法的加解密速度.  相似文献   

14.
选取了全α类中序列一致性小于等于40%和25%的四个有代表性的超家族,并从中提取序列模体和结构模体,分析了其结构和功能特征的差异. 结果表明,细胞色素C超家族和EF手超家族中已知功能的模体类型相对单一,而类同源域超家族和翼螺旋DNA结合域超家族中序列模体类型较多,但是主要以HTH和wHTH两种结构模体为主. 进一步对模体的相对位置进行统计分析和比较,发现无论是已知功能的模体还是基于统计学方法识别的模体,它们相对于序列N端和C端的分布均呈现一定的规律性. 这些特征和规律将对蛋白质超家族的识别以及结构域的研究提供有力的帮助.  相似文献   

15.
对实验证实的683条大肠杆菌sigma70启动子的序列进行保守性计算分析,获得四个保守的区域:-10区域是启动子最保守的功能元件,-35区域、转录起始位点附近及启动子上游UP单元.从保守区中选取M 6(1)值较大的10个保守位点的六联体频数作为参数、引入伪计数构建位置权重矩阵,利用位置关联打分函数对683条sigma70启动子进行预测.负集分别从编码区和非编码区选取700条序列进行算法检验,获得很好的结果,敏感性分别为91%和90%.进而利用位置关联打分函数对大肠杆菌整条序列进行搜索,获得1567条预测序列.这些序列可能是实验未测定的启动子序列.  相似文献   

16.
研究表明将边表示的网络转换为三角形模体表示形式,可以有效解决基于模型社区发现方法由网络规模庞大带来的计算瓶颈问题.提出一个三角形模体社区发现模型MCDTM(a Model for Community Detection based on Triangular Motifs),其将网络表示为一系列三角形模体,利用categorical分布对各三角形模体的生成过程建模,用最大似然参数估计方法给出参数估计的推理过程,根据参数估计结果可得节点、边及三角形模体的社区隶属度.人工网络和实际网络上的实验证明MCDTM模型可快速准确地发现网络的潜在结构.  相似文献   

17.
模2k求逆算法是RSA密码体系的核心运算之一.通过分析现有算法及RSA算法中求逆运算的特点,在扩展Euclidean算法基础上,提出了一种改进的模2k求逆算法.该算法与原算法相比迭代次数减少1/3,不仅简化加法进位的处理,而且省去了部分大数加减法操作.同时给出新算法硬件电路结构及数据验证方法,并实现了2 048位模2k求逆硬件电路设计.仿真验证结果表明,改进后的算法与原算法相比,电路面积减小了18.5%,运算速度提高了34.2%.  相似文献   

18.
模因(meme)是文化传递单位,它的核心是模仿.模因有复制保真度、多产性和长久性三个特点,模因的生命周期可分为同化、记忆、表达、传输四个阶段.语言模因复制和传播的方式可以是内容相同、形式各异,即基因型语言模因;或者是形式相同、内容各异,即表现型语言模因.根据对模因生命周期及语言模因复制传播方式的分析,可发现语言模因对英语口语、写作、阅读、词汇教学都有一定的启示.  相似文献   

19.
多体连续变量纠缠态是量子信息中非常重要的核心资源.非对称EPR态是实验上可以产生的一类重要的多体连续变量纠缠态.我们利用多模压缩系数发展的判据微观地对四模非对称EPR态的纠缠结构进行了判定.研究表明压缩参数r取0到1时,四模非对称EPR态所有划分方式的子系统间都存在纠缠,且纠缠程度随着压缩参数r增大而增大.同时,对A,B模式上分别增加信道损耗时,发现四模非对称EPR态所有划分方式的子系统间的纠缠程度会减弱,但是依然存在纠缠.  相似文献   

20.
基于酵母单碱基精度的核小体位置数据,提取核小体中心及连接序列分析两类序列的精细结构和模体偏好。结果显示,区分两类序列最主要的是稀有模体(GCG、CGC、CGG和CCG),其次是富含模体(AAA和TTT)。将核小体中心序列等分为3个单元,发现中单元与核小体中心序列相对偏差的分布相似,两翼单元分布部分类似于连接序列,表明中单元的核小体定位信号强而两翼具有连接序列的部分序列特征。通过分析11个核小体连接序列长度组的G+C含量发现其长度与G+C含量成负相关,而MEME模体搜索结果显示11个长度组主要有4类保守模体,意味着连接序列的多样性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号