首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
刘西奎  李艳  许进 《自然科学进展》2004,14(9):1032-1038
在DNA序列研究中,对长DNA序列进行有效表示,可以为DNA序列的分类、分析和比较等研究提供创新性的方法. Nandy,Leong和Mogenthaler,Randic等已经给出了DNA序列的二维或三维图表示. 这些图表示给出了DNA序列的可视化特征. 文中给出了一个改进的DNA序列的图表示:在2维指数坐标系内用4个特定的向量分别表示DNA序列中的4个碱基,从而使DNA序列可以用有向路表示. 给出了一个例子说明该方法的有效性,可以证明该种改进的DNA序列图表示方法具有较低的退化度甚至没有退化.  相似文献   

2.
为了提高多模信号的均衡效果,提出一种新变异DNA遗传人工鱼群优化DNA序列的频域加权多模算法(nm DNAGAFS-DNA-FWMMA)。该算法利用新型变异DNA遗传人工鱼群算法收敛速度快和全局搜索能力强的优点,通过DNA约束模型和代价函数来寻找最优DNA序列,将该序列解码后作为频域加权多模算法(FWMMA)初始最优权向量,以提高收敛速度并减小剩余均方误差。仿真结果表明,nm DNAG-AFS-DNA-FWMMA的收敛速度快、均方误差小。  相似文献   

3.
DNA序列特征提取方法研究   总被引:3,自引:0,他引:3  
针对DNA序列分类问题提出了两种特征提取方法,利用可分支持向量分类机间隔大、推广能力强的原理建立了DNA序列特征提取方法优劣的评价标准,利用该标准把本文的两种特征提取方法进行了比较,且跟以往的DNA序列特征提取方法进行了比较.实验表明,提出的两种特征方法得到的DNA序列特征完全能够代表DNA序列,对已知分类样本的预测率为100%,且此特征提取方法有很强的推广能力.  相似文献   

4.
为了提高效率,基于时间序列的数据挖掘,采用了近似的方法取代原有时间序列,这导致了数据挖掘准确性的降低,文章的主要目标在于有效率地搜寻时间序列中的相似子序列向量,且希望能够兼顾准确性及效率,进而提供不同领域对于时间序列的不同需要.  相似文献   

5.
基于DNA序列4种核苷酸的物理化学性质,考虑相邻两个碱基组合形式,提出一种新的DNA序列4D表示.基于这种表示,可以把DNA序列简化成4D空间的一系列点,根据点坐标抽取序列数值特征,再根据数值特征给出方法对DNA序列进行相似性分析.以10个不同物种的a-球蛋白基因的第一个外显子碱基序列的为例子,说明基于4D表示的DNA序列分析方法是有效的.  相似文献   

6.
利用隐马尔可夫模型训练中不同结构的DNA序列的L值分布范围不同的特点,对传统多类投票模型进行改进,提出一种优于传统算法的快速训练算法,该算法只需训练出一类隐马尔可夫模型参数.对DNA内含子和外显子序列进行识别,平均识别率达到了90.8%.与支持向量机相比,隐马尔可夫模型在解决多分类问题方面具有优势,不但计算时间少,而且识别率高.  相似文献   

7.
基于DNA序列上A,G,C,T等4种碱基的含量能反映序列的一些结构特征的假设,通过将4种碱基出现的相对频率视为向量分量,而将一条DNA序列抽象成R4空间的一个向量,然后按类似欧氏距离定义了A类、B类序列集的中心和半径,将问题转化为讨论任一向量与球域的相对位置关系,从而得到了一种几何分类方法.  相似文献   

8.
研究了DNA序列高维空间数字编码的更一般的运算法则:充分利用陈惟昌等人提出的DNA序列高维空间的表观维数Nv,数值维数Nx以及差异维数Nd,讨论了当Nd=0,1,2,2n或2n+1(n=0,1,2,…)时,具体刻画了DNA序列的首段碱基及其数值取值范围;推导出DNA序列多点突变(单核苷酸多态性SNP)的运算法则;利用DNA序列的定值部Xi和定位部Qi及其计算公式,从新的角度导出DNA重复序列的编码法则和运算法则.  相似文献   

9.
利用衍生DNA研制定量检测基因芯片   总被引:1,自引:0,他引:1  
 为了建立基因芯片定量检测技术体系,在同一张芯片上完成不同浓度DNA的梯度测定,本研究以检测探针序列为基础,合成不同的衍生DNA作为标准曲线测定的探针序列.由于衍生序列与检测探针序列之间不改变碱基配对关系,同时具有相同的PCR扩增序列,使得标准品的浓度与测定值之间具有较好的相关性,从而解决了基因芯片定量测定中的标准曲线制作问题.结果显示,用衍生DNA序列作为标准DNA,其基因芯片测定值与浓度之间的相关性系数达到0.995以上,用此方法建立定量基因芯片测定的浓度与实际浓度一致.本研究为研制定量检测基因芯片提出了新的思路.  相似文献   

10.
研究了DNA序列能否成为信息隐藏的载体.通过对DNA序列进行分析证实了:由于核苷酸序列中有强的随机噪声,DNA序列可以作为信息隐藏的载体;进而通过对DNA序列特征进行分析,提出了一个嵌入对策:秘密消息嵌入非编码区的高复杂度区域有很好的安全性.该文的研究对提出以DNA序列为载体的信息隐藏算法具有重要的指导作用.  相似文献   

11.
熊文萍  孙季丰 《科学技术与工程》2012,12(29):7505-7509,7514
将DNA序列分成64个碱基一组的短序列。根据每个小段落不同的碱基排列特点,通过对每段中重复频率最高的三碱基组合片段采用特定码书编码,提出了基于统计分析与分段码书的DNA序列压缩方法,以达到对DNA数据压缩的目的。实验表明,本算法在大部分常用基准测试序列中达到了比较好的压缩性能。  相似文献   

12.
对67种微生物基因组全序列进行分析,发现某些碱基组合(及其反向互补序列)在某些基因组中不存在,而这种不存在的概率很低;发现6个11bp的寡核苷酸序列(及其反向互补序列)--AGGGGGGGGTC(GACCCCCCCCT)、AGGGTCCCTG(CTAGGGACCCT)、ACGTACCTAGG(CCTAGGTACGT)、GACACACGTAG(CTACGTGTGTC)、CGCGTAACTAG(CTAGTTACGCG)、CTAGGGACCCA(TGGGTCCCTAG)在这67种基因组中都不存在。上述每个寡核苷酸序列(及其反向互补序列)在由这67种细菌基因组连接而成的DNA分子(长度为169660265bp)中不存在的概率至少小于2.5e-26。  相似文献   

13.
针对DNA序列类别的分属问题,提出采用支持向量机(Support Vector Machine,SVM)的方法进行分类。根据SVM分类器的要求建立特征属性空间,首先由每个DNA中4个碱基的含量得到4个特征属性,然后在此空间中扩充DNA序列长度的属性,最后根据SVM分类器对已知的DNA分类样本做训练得到分类超平面。利用此超平面检测所要分类的DNA序列,实验结果表明这种方法具有很好的分类精度。  相似文献   

14.
DNA序列的一种分类方法   总被引:1,自引:0,他引:1  
基于小波变换和相关技术,提出了一种DNA序列的分类方法.首先将DNA序列转换成数字序列,然后对此序列进行Matlab快速分解,计算未知类别序列与已知类别序列的相关系数,由此判定序列的类别.结果表明,该方法是切实可行的.  相似文献   

15.
基于DNA序列的混沌游戏表示,利用对应测度矩阵的最大特征值组成的6维向量来刻画DNA序列,并利用向量间的相关距离对11种物种的beta球蛋白基因的第1个外显子编码序列进行相似性分析,所得结果与生物学中的进化关系基本一致.  相似文献   

16.
一种基于核苷酸二联体的DNA序列编码规则   总被引:1,自引:1,他引:0  
序列比较的基本任务有:(1)对于两条长度相近的序列相似,找出序列的差别;(2)判断一条序列的前缀与另一条序列的后缀相似;(3)判断一条序列是否是另一条序列的子序列;(4)判断两条序列中是否有非常相似的子序列.对核苷酸二联体给出DNA序列一种编码规则,利用异或操作进行序列比较.  相似文献   

17.
通过PSI-BLAST搜索与人类胰岛素原(含有86个氨基酸)相似的蛋白质序列,并进行比对,计算比对矩阵的相似得分和期望值,同时运用ClustalW算法对不同物种编码前胰岛素原mRNA及其翻译的蛋白质和DNA序列进行多重比对.结果发现,脊椎动物的胰岛素蛋白质一级结构(A链和B链)和mRNA非常相似,但部分动物C肽的部分序列有差异;系统进化分析表明,人和猴、小鼠和大鼠编码胰岛素的mRNA在进化上关系相近.各物种间编码相同氨基酸的核苷酸序列(CDS)相同,但编码胰岛素的DNA序列不同.各物种胰岛素原蛋白质序列中,A链和B链序列保守,C肽有一定的差异;DNA序列差异较大.  相似文献   

18.
异常检测是数据挖掘的重要研究方向之一.工业设备的各项指标以多元时间序列的形式被传感器监测,多元时间序列的异常检测对保障安全和提高服务质量至关重要,但是异常的定义相对模糊,具有异常标签的数据很稀少.此外,多元时间序列具有复杂的时间依赖性和随机性,使异常检测存在许多问题.提出CPCGAN模型,使用自监督学习的方法对多元时序数据进行异常检测.首先使用对比学习的方法得到多元时序数据的表示向量,再将具有先验信息的表示向量作为输入用来训练生成式对抗网络,通过生成式对抗网络的重构误差来确定异常.在五个数据集上与五种无监督异常检测方法进行对比,实验结果证明提出的方法能有效地检测两类异常,并且,在大多数数据集上的表现更好.  相似文献   

19.
故障样本具有复杂多样性,而不同故障类型存在于不同维数的多流形子空间中,将样本统一降维到同一维数的单流形上则不能进行高效的特征提取.提出了一种基于局部线性嵌入(Local Linear Embedding,LLE)的多流形学习(Multi-LLE)故障诊断方法,将单流形故障诊断方法扩展到多流形,首先利用Multi-LLE分别提取各故障数据集在其本征维数流形上的特征,再通过各特征向量的聚类中心与故障新样本在不同维数下的嵌入向量的距离比较,将距离最近者归为一类实现分类识别.利用转子实验故障数据对算法进行了验证,并将Multi-LLE方法与LLE和海赛局部线性嵌入(HLLE)方法进行了比较,结果表明该方法能够有效的实现故障诊断.  相似文献   

20.
参考鳗Li等鱼类线粒体DNA序列进行了中国花鲈线粒体DNA细胞色素b基因片断的引物设计、PCR扩增及其序列测定。得到中国花鲈的碱基序列为410bp,其A、T、G、C含量分别为101bp(24.63%)、112bp(27.32%)、72bp(17.56%)、125bp(30.49%),与鳗Li等其他鱼类相同基因片断序列碱基含量相似。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号