首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 562 毫秒
1.
生物序列相对于传统序列来说具有自己的特征。不同的序列模式挖掘算法应用到生物序列中有不同的特点和效率。本文分析目前比较流行的五种模式挖掘算法的运行过程,当应用到生物序列中时,分析了各个算法的性能,从而可以得出哪种算法更适应于不同类型的生物序列频繁模式挖掘。  相似文献   

2.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法,自从1995年序列模式挖掘的概念被提出以来,人们不断地对序列模式挖掘算法进行研究和改进,本文介绍了一种新的序列模式挖掘方法-CSE算法及其具体实现方法,并对该算法性能做了初步的评价。  相似文献   

3.
移动环境中的最大移动序列模式挖掘   总被引:1,自引:0,他引:1  
在移动通信环境中,移动序列模式挖掘对于有效的提高位置管理的服务质量具有重大的意义.移动序列模式挖掘和传统的序列模式挖掘是不同的,首先,前者需要考虑更多的时间因素;其次,移动序列模式中的项之间是连续的,因为关心移动用户的下一次移动情况.本文提出了一种挖掘移动序列模式的新技术:聚类的思想引入到移动序列模式挖掘来处理移动历史的时间离散化,并且提出了一个高效的PrefixTree算法来挖掘移动序列.性能研究表明,Pref ixTree算法优于PrefixSpan-2算法.  相似文献   

4.
分析了并行序列自身特色,提出了一种并行序列的挖掘算法PSMA,PSMA在hash树的基础上对并行序列事件反复挖掘,产生频繁有效序列模式,它是对传统序列模式挖掘算法的改进.PSMA算法针对并行序列,能更有效地发现所有频繁并行序列模式.  相似文献   

5.
生物序列数据是生物信息数据中重要的一部分,研究生物序列解读其隐含的生物学意义是生物信息学研究的热点和难点。数据挖掘是当前分析大规模数据的有效工具之一,已广泛应用于分析生物序列数据,并取得了许多研究成果。文章综述了生物序列数据挖掘的关键技术,包括序列比对算法、DNA序列模式挖掘、关联、分类、聚类分析、RNA二级结构预测、蛋白质序列分类和聚类分析,最后展望未来研究方向。  相似文献   

6.
序列模式挖掘是数据挖掘中的研究热点之一。在挖掘过程中需要用户的参与日益显得重要。为了提高挖掘过程中的交互性,本文提出了一个基于规则表达式约束的序列模式增量式挖掘算法RE_IncUp。该算法首先利用约束对已经挖掘出的频繁序列模式进行预处理,缩小了搜索范围;然后采用模式扩展方法把规则表达式约束和增量挖掘过程融为一体,并且采用先修剪后计算支持度的方法进一步缩小了搜索范围,降低了支持度的计算量。该算法允许用户不断改变约束条件,实现交互式挖掘而且可将挖掘的目标仅仅聚焦到用户感兴趣的模式上。实验表明该算法对序列模式的维护和满足用户的需求都是十分有效的。  相似文献   

7.
在分析了频繁序列模式更新算法关键技术的基础上,提出了一种快速的增量式更新频繁序列模式挖掘算法FUFSPA,该算法将充分利用先前挖掘过程中所产生的信息来减少本次挖掘过程中的时闻开销.另外,针对频繁序列模式挖掘中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法,该方法只需进行一些“或”逻辑运算操作,将该方法用于序列模式挖掘中支持度(数)的计算,可以进一步提高算法的执行效率.实验结果表明算法FUFSPA是可行和有效的.  相似文献   

8.
对序列模式挖掘中的5种算法的执行过程和特点进行了研究,并对这几种算法的时间和空间执行效率进行了分析,指出这5种算法各自的使用范围,得出的结果对序列模式挖掘的应用具有一定的参考价值.  相似文献   

9.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法 ,自从1995年序列模式挖掘的概念被提出以来 ,人们不断地对序列模式挖掘算法进行研究和改进 .本文介绍了一种新的序列模式挖掘方法—CSE算法及其具体实现方法 ,并对该算法性能做了初步的评价 .  相似文献   

10.
序列模式挖掘算法综述   总被引:1,自引:0,他引:1  
目前的主要序列模式挖掘算法可以分为3类:①基于Apriori的候选码生成-测试的方法;②基于垂直格式的候选码生成-测试的方法;③基于模式增长的方法.在介绍序列模式挖掘基本概念的基础上,描述了典型的挖掘算法,着重分析第②类序列模式挖掘算法的关键技术,并对各种算法进行详细的分析与比较,总结出它们的优缺点:前两类方法因产生巨大的候选序列而致挖掘代价剧增,而第③类模式增长方法避免了候选序列的产生,但挖掘长模式效率低.  相似文献   

11.
模式匹配作为一种关键技术已被广泛应用于生物序列分析和文本过滤等领域.通配符间隔可以匹配特定长度子序列,为模式匹配问题带来了更多的灵活性.为增加灵活性和一般性给出一种新的模式匹配问题定义,其中通配符间隔可以独立设置,并基于模式分解设计出一种有效的计算匹配数量的算法.实验结果显示,与同类算法相比本算法在性能上具有更优的时间复杂度和空间复杂度.  相似文献   

12.
 蛋白质多序列比对是一种重要的生物信息学工具,在生物的进化分析以及蛋白质的结构预测方面有着重要的应用。各种比对算法在这个领域都取得了很大的成功,但是每种算法都有其固有的缺陷。提出置换距离法,对当前流行的几种蛋白质多序列比对算法进行对比评价。由于置换距离法仅关注于不同蛋白质间进化距离的相对次序,而不考虑这些进化距离之间的细微差异,因而得到的评价结论更具有鲁棒性。另外,采用最长公共子序法度量置换距离可以比较准确的反映不同置换之间的差异性。基于该算法,对Dialign, Tcoffee, ClustalW和Muscle多序列比对算法进行了性能评估。  相似文献   

13.
一种序列模式的概念及挖掘算法   总被引:1,自引:1,他引:0  
介绍了一种时间序列模式的形式和概念,讨论了其相关的挖掘算法.将时间序列模式既用于具有时间关系的购买行为的分析,以揭示购买行为后面一种序列关系信息,又用于其他有时间关联的事件分析.挖掘算法由以下几部分构成建立频繁物品集,进行数据处理和转换,并生成候选子序列,通过验证后,得到长度为2,3,…的序列集合,从中选出独立最大序列即为所求.通过实例指出了该算法和传统的Aprioriall算法的不同之处.结果表明,这种序列模式在网络通信、气象分析等领域具有广阔的应用前景.  相似文献   

14.
【目的】研究模式挖掘领域中的频繁序列挖掘技术,由于序列模式挖掘存在指数级的搜索空间,且传统的SAT求解算法无法高效求解大规模数据集的缺点,因此研究符号表示和操作技术,用来避免冗余计算。【方法】提出基于SAT的频繁序列挖掘的符号OBDD算法,基于深度优先算法的思想,首先将频繁序列挖掘问题构建为SAT模型,其次对变量进行排序并将约束子句分类后分别描述为OBDD,利用OBDD的"与"操作得到满足SAT的所有频繁序列模式。【结果】实例结果表明,该方法准确可行。【结论】该方法能有效缩减搜索空间,提高求解效率。  相似文献   

15.
针对无卫星导航信号的盲环境中移动目标定位需要,提出一种适合于盲环境移动定位的序列编码图形路标技术方案,包含更多可用信息的序列编码图形路标方案.在测试环境中布设序列编码图形标志牌,建立了实现盲环境中移动目标快速定位定姿的路标模型实时采集包含编码图形路标的图像,利用SIFT(scale invariance feature transform)算法定位编码图形路标,使用Otsu算法进行图像分割和路标边界跟踪,利用快速Hough变换确定编码中心,全自动解译出路标信息,并根据编码库查询得到编码标志牌中心点的三维坐标.实验结果表明,方法可行、算法有效,为盲环境中移动目标的精确定位定姿技术开发奠定了路标基...  相似文献   

16.
基于传统任务调度算法, 通过在调度过程中增设服务器最佳期望序列及负载均衡指数, 采用任务连接数约束服务器选择, 解决了传统任务调度算法对于集群负载均衡性能的忽略问题. 实验结果表明, 该改进算法能达到较高负载均衡度, 同时缩短任务完成时间, 并提高了集群对于批量级任务的处理能力, 从而达到了优化的目的.  相似文献   

17.
本文提出了计算最佳生物序列并置排列的程序和算法。程序使用计算进化距离的改进算法,在IBM-PC/AT上用Turbo-Pascal 4.0版开发。程序有友好的用户界面、操作简便、通用性强,可以移植到多种计算和操作环境。本文以蛋白质分子序列为例,给出了复杂赋权情形下计算进化距离和最佳并置排列的算法,证明了不同赋权方式本质上不改变改进算法的时间和空间复杂性。  相似文献   

18.
基于并行填充模式的直线生成算法   总被引:6,自引:0,他引:6  
提出一种新的直线生成算法,该算法不需像传统的Bresenham算法那样对每个象素点进行偏差计算,而是根据已知的直线起点和终点坐标信息,确定在每个象素行上一次填充象素点的点数,然后以此为基本单位逐行填充。利用此算法可并行写入并点亮多个象素点,加快了直线生成速度,同时算法简练,执行效率高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号