首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种基于广义相似性的共调控基因聚类算法   总被引:1,自引:0,他引:1  
针对共调控基因的特殊性质和现有共调控基因聚类算法存在的不足,提出了基于广义相似性的聚类模型g-Cluster.正负共调控基因因具有相同的编码而被聚集到同一个共调控基因簇中.进一步提出了一种基于树结构的聚类算法FBTD,采用先宽度优先后深度优先的搜索策略,挖掘所有符合条件的最大g-Cluster,同时应用了高效的削减规则和优化策略.将该算法用于真实数据集.理论分析和实验结果都表明,该算法是实用和有效的.  相似文献   

2.
基于隐马尔科夫模型的基因预测算法   总被引:1,自引:0,他引:1  
为更好地从DNA序列中识别蛋白质编码区,提高计算效率,将隐马尔科夫模型与前向算法相结合,提出一种生物基因的预测算法.理论证明,该隐马尔科夫模型与经过EM算法优化后的模型具有相同的参数,能够降低计算量,提高计算效率.利用该方法对DNA序列F56F11.4a的外显子进行识别的仿真结果表明,该算法是有效的.  相似文献   

3.
针对单一数据集构建基因调控网络算法数据量不足及构建网络结果不精确的问题, 提出一种基于能力与信任(AP)的数据源融合算法. 该算法将基因表达数据、 蛋白质相互作用数据和基序数据集, 分别通过控制与被控制双向数据流传输来分析和构建基因调控网络, 并与ReMoDiscovery,CLR和C3Net三种已开发模型在酵母全基因组网络构建结果的AUC值进行对比. 对比结果表明, 该算法在构建基因调控网络算法方面执行效率更高、 收敛性更强.  相似文献   

4.
针对单一数据集构建基因调控网络算法数据量不足及构建网络结果不精确的问题, 提出一种基于能力与信任(AP)的数据源融合算法. 该算法将基因表达数据、 蛋白质相互作用数据和基序数据集, 分别通过控制与被控制双向数据流传输来分析和构建基因调控网络, 并与ReMoDiscovery,CLR和C3Net三种已开发模型在酵母全基因组网络构建结果的AUC值进行对比. 对比结果表明, 该算法在构建基因调控网络算法方面执行效率更高、 收敛性更强.  相似文献   

5.
指出了正确识别定位DNA序列中外显子区间是当前生物信息学最基础的问题之一.通过介绍DNA序列的3-周期性、信噪比等概念,引入了固定长度滑动窗口和移动信噪比曲线识别两种基因识别算法,在综合两种算法的复杂度和准确性优势的基础上,提出了基于信噪比特征的基因识别改进算法,并通过实验验证了该算法的有效性与准确性.  相似文献   

6.
一种有效的基因投影聚类算法   总被引:1,自引:0,他引:1  
针对现有基因投影聚类算法的不足,提出一种有效的基因投影聚类算法.该算法基于样本构建穷举树,根据基因间的相互作用关系,采用深度优先遍历的思想进行投影聚类,为观察疾病的成因提供了一个很好的视角.通过真实微阵列数据实验,证明了提出的算法具有较高的正确率.  相似文献   

7.
在基因识别的两类算法中,判别算法通常需要正负两类样本来训练参数.在原核生物的基因组中,由于可充当负样本的基因间序列太少,如何产生负样本便成为原核基因识别中的一个问题.本文提供了一种基于"自相似映射"的负样本生成算法,与通常使用的随机生成算法不同,该算法不需要生成随机数.本文给出了两种负样本生成算法的比较,并初步讨论了自相似性对于DNA序列分析的意义.  相似文献   

8.
在研究了三种基因局部特征的基础上,针对现有的基因预测方法在预测5'端外显子方面的不足,构建了一种基于统计组合与特征分类的基因预测算法,即将基因区域数据根据局部特征分成两个相对独立的集合,采用统计组合的方法将多种基因预测方法综合在一起进行基因预测研究.实验结果表明,该算法提高了基因预测的精度,为基因预测提供了一种可能的研究方案.  相似文献   

9.
建立了与工艺规划集成的调度问题的数学模型.以最大完工时间为目标,设计一种混合文化基因算法求解该问题.在提出算法中,设计了新型编码和主动解码方案,使用变邻域搜索(VNS)算法进行局部搜索,引入了高效的邻域结构以强化算法的局部搜索能力,并提出了一种个体扰动方法,以避免群体多样性趋于单一,使得提出算法在分散搜索和集中搜索之间达到更合理的平衡.为测试算法的性能,对现有的基准问题进行了测试,有21个实例达到了下界或得到改进,成为当前新的最优解.对比已有的最优结果可见:提出的算法可高效地求解工艺规划与车间调度集成问题且优于其他算法.  相似文献   

10.
提出了一种基于特征向量中心性推断基因调控网络结构的算法,通过特征向量中心性挖掘基因在网络中的拓扑信息,结合基因对之间的相关性和拓扑信息构建完整的基因调控网络.算法在n个变量和n个样本的DREAM数据集以及包含9个变量和9个样本的大肠杆菌数据集上进行仿真测试,并与现有的基于距离相关性和网络拓扑中性的3种最先进的网络推理算法进行了比较,算法结果显示该方法能够提高基因调控网络结构的预测精度.  相似文献   

11.
针对普通BP算法收敛速度慢,容易陷入局部极小值以及网络初始状态对网络性能的影响等问题,建立了单自由度磁悬浮控制系统的数学模型,设计了一种基因算法优化神经网络的智能控制方法,该方法提出用基因算法离线优化网络。并设计了一种双链异或交叉基因算子,改善了基因算法的效率,在较大程度上改善了单自由度磁悬浮系统的性能。  相似文献   

12.
基于并行免疫遗传算法基因表达数据的动态模糊聚类   总被引:5,自引:1,他引:4  
提出一种改进的并行免疫遗传算法, 通过在群体规模上引入“岛”的概念, 实现了可变的群体规模; 通过在适应度函数内引入免疫算子, 避免了算法过早收敛. 因此, 解决了寻优算法中局部收敛的困扰, 提高了获得全局最优解的几率. 把此算法应用于斯坦福大学酵母细胞周期表达数据库的数据进行共表达聚类, 并将实验结果与Spellman按照功能基因组学进行聚类所得结果进行了对比, 证明了所给算法在功能基因组 学聚类上的有效性.  相似文献   

13.
【目的】对现有的下一代测序(Next Generation Sequencing,NGS)纠错算法和工具进行分析,提出基于Hadoop平台的纠错算法,以解决大数据处理中计算机内存不足和运行时间长的问题,提升纠错性能。【方法】使用特定的数据对现有的基于K-spectrum的纠错算法进行测试,对各纠错工具的运行时间、内存峰值和纠错结果进行比较来衡量纠错工具的性能。在此基础上提出Hadoop分布式并行纠错算法(Parallel algorithm),并与串行程序、Lighter和Racer进行比较,分析分布式并行实现的可行性。【结果】现有的基于Kspectrum的纠错工具普遍存在较大的内存消耗现象,其中Racer和Sga的纠错效果较好。而Hadoop分布式并行纠错算法对计算机单机内存的消耗较低,当数据量超过一定值时,并行分布式程序的运算时间比串行单机程序明显减少。【结论】本研究提出的Hadoop分布式并行纠错算法不仅降低了内存消耗,而且提高了运算性能,更有利于大规模基因数据的分析处理。  相似文献   

14.
为解决微阵列数据中因样本量少且每个样本的维度高而带有大量干扰信息和冗余信息的问题, 通过分阶段的步骤对特征基因集进行全方位的选取和优化。考虑到单个基因在不同环境中的差异性, 从中选择出只在特定条件下差异较大的基因构成候选特征集; 剔除候选特征集中相关性较小的基因; 采用遗传算法对所得特征集的任意子集的整体分类性能进行考查, 选出较优的子集。实验结果表明, 该算法对逐步选取特征基因具有可行性和有效性, 而特征基因集在分类适应度(分类能力度量)和分类准确率均比原始数据更好。  相似文献   

15.
基于动态时间规划的基因芯片数据识别   总被引:1,自引:0,他引:1  
研究了动态时间规划(DP)在基因芯片数据识别中的应用,提出了基因芯片数据的全局最大自相似度的定义以及基于最大自相似度和高维局部片段校对的基因芯片数据自动识别方法。讨论了基于最大相似度建立模板的方法与基于最大相似度的基因沿校对路径平均的建立模板方法对基因识别和分类的影响。对肿瘤基因的识别实验结果表明:基于最大相似度的DP算法(DP-MS)能够达到100%的识别率,本方法可以应用于基因芯片数据的识别、分类和基因疾病推断。  相似文献   

16.
Gen-Cluster:一个基因表达数据的高维聚类算法   总被引:1,自引:0,他引:1  
基因表达数据聚类是分析基因之间共调控关系的重要手段.挖掘子空间中表达值存在差异但变化趋势保守的序列已成为基因表达数据聚类的主要研究内容之一.在N-同维趋势相似定义的基础上,提出了一个基因表达数据的高维聚类算法Gen-Cluster,将基因表达值转化为序列形式,采用无重复投影且无候选生成的序列模式挖掘策略自底向上挖掘N-同维趋势模式,并解决了OP-Cluster算法不能挖掘含有项集的序列模式问题,最终得到表达值变化趋势保守的基因序列形成的N-同维趋势簇.实验采用Breast Tumor和MicroRNA表达数据集,验证挖掘结果是有效的,且较OP-Cluster算法表现更高效率,并涵盖其结果.  相似文献   

17.
FCM算法在基因表达数据分析中存在噪声点,影响聚类结果,为此提出了一种改进的模糊核聚类算法,通过使用Mercer核把原始数据映射到高雏特征空间,并为特征空间的每个向量分配一个动态权值,分析权值的大小来识别噪声点,得到一个较为理想的聚类结果:实验结果表明,该方法比FCM聚类算法具有更好的聚类效果.  相似文献   

18.
运用小波的降噪性建立一种基于肿瘤基因表达谱的聚类分析模型,采用小波变换、信息抽取、双向聚类的方法对基因表达谱进行有效的分析.通过这种模型,可以降低基因表达谱的噪音以及样本错聚率.最后,将该方法应用于结肠癌基因表达谱的分析.  相似文献   

19.
双聚类是微阵列基因表达数据分析中很实用的一种数据挖掘技术,它是一种同时对微阵列基因和条件进行聚类的方法,用来挖掘基因子集在条件子集下所体现出来的生物模式。传统的双聚类算法对于庞大的基因表达数据处理效率很弱,考虑在j Metal平台上实现基因表达数据的双聚类的一种新的研究方法及思路。同时考虑加入并行策略,提高算法的效率。在酵母啤酒细胞基因表达集和人类B-细胞两个标准数据集上对两个算法进行实验验证,表明所提出算法比其他多目标双聚类算法呈现出更好的优越性。  相似文献   

20.
聚类是识别基因表达数据蕴含的关键基因调控模块的一种有效方法,基因表达谱的相似性度量是聚类的关键问题.然而,一般的相似性度量方法不能刻画时间序列基因表达谱数据所蕴含的时间延迟、反向相关和局部相关等复杂的基因调控关系.针对时间序列基因表达谱数据,提出一种基于近邻传播和动态规划的相似性度量方法和聚类算法.在大鼠再生肝细胞基因表达谱数据集上的聚类结果与基因功能富集分析结果高度一致,证明算法在时间序列基因表达谱数据聚类上的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号