首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
为了解决分布式环境下挖掘全局序列模式常产生过多候选序列,加大网络通信代价问题,提出了一种基于分布式环境下的快速挖掘全局序列模式算法--DMGSP.该算法将分布式环境下的各站点得到的局部序列模式压缩到一种语法序列树上, 避免了重复的序列前缀传输. 采用合并树中结点序列规则和项序扩展策略,对非频繁序列进行剪枝,有效地约简了候选序列,减少了网络传输量,从而快速生成全局序列模式.算法分析和实验结果表明,在大数据集环境下的DMGSP算法性能优越,能够有效地挖掘全局序列模式.  相似文献   

2.
分析了并行序列自身特色,提出了一种并行序列的挖掘算法PSMA,PSMA在hash树的基础上对并行序列事件反复挖掘,产生频繁有效序列模式,它是对传统序列模式挖掘算法的改进.PSMA算法针对并行序列,能更有效地发现所有频繁并行序列模式.  相似文献   

3.
提出一种快速挖掘邻近序列模式的RCSP算法。该算法只需扫描一次数据库,且通过建立前序链接编码树,借助结点的区间编码,可以在常数时间内确定序列在树中的不同映射片段之间的祖孙关系,实现序列支持数的快速计算,不必额外创建中间树,直接在树上进行挖掘,就能得到所有邻近序列模式。实验表明RCSP算法具有较好的性能。  相似文献   

4.
在分析了频繁序列模式更新算法关键技术的基础上,提出了一种快速的增量式更新频繁序列模式挖掘算法FUFSPA,该算法将充分利用先前挖掘过程中所产生的信息来减少本次挖掘过程中的时闻开销.另外,针对频繁序列模式挖掘中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法,该方法只需进行一些“或”逻辑运算操作,将该方法用于序列模式挖掘中支持度(数)的计算,可以进一步提高算法的执行效率.实验结果表明算法FUFSPA是可行和有效的.  相似文献   

5.
对基因数据库的一种常见操作是找到与待查询序列相似的序列.目前常使用的是BLAST算法,但是这种启发式算法有时会漏解.如果使用精确匹配算法,例如Smith-Waterman(S-W)算法,计算代价又会太大.OASIS算法是一种高效并且精确的生物序列局部相似性比对算法,而且互关联后继树模型的空间效率很高,因此使用互关联后继树实现了OASIS,并命名为OASISirst算法,其比对结果和OASIS一样按照得分降序排列,并且当目标序列和查询序列均较长时,时间优势明显.  相似文献   

6.
对于符号化时间分析方法,给出了已知的国外应用状况和文献出处.对如何将时间序列转化为符号序列,即信号符号化问题,通过最简单的二进制划分及其配套图形作了简要说明.给出了二进制划分下符号树结构及其Shannon熵计算方法,讨论了时延τ、符号集大小Ns和树层数(符号序列长度)对Shannon熵等统计量的影响.叙述了符号序列编码方法和符号序列直方图的作用;提交了进行符号时间序列分析的计算机流程图.图5,参23.  相似文献   

7.
NPSP:一种高效的序列模式增量挖掘算法   总被引:1,自引:3,他引:1  
提出了一种称为“异构树”的数据结构,采用一套编号规则对异构树的分支进行编号,使具有相同编号的分支代表相同的候选序列,编号不同的分支代表不同的候选序列,极大地简化了候选集计数过程,在此基础上提出了具有增量挖掘功能的序列模式高效挖掘算法NPSP,并从理论分析和实验两方面证明了其挖掘结果集的完备性和算法的高效性.  相似文献   

8.
针对基因选择性剪接的多序列比对算法研究   总被引:3,自引:0,他引:3  
为对真核基因的选择性剪接形式进行准确、快速、有效的研究 ,提出了一种启发式多序列比对算法。该算法借助引导树启发序列之间的两两段对段比对 ,通过建立序列相似性估计模型 ,给出了一种由序列间相同词数估计序列相似程度的方法。利用这种方法构造引导树 ,大大缩短了其构造时间。通过采用序列间的段对段比对 ,克服了间隙罚分问题 ,更准确地反映了真核基因的选择性剪接形式。引导树构造方法的改进和快速局部比对算法的采用 ,使得算法运行速度大大高于一般算法。该算法为真核基因的选择性剪接研究提供了一种新的有效途径  相似文献   

9.
为了有效地挖掘物流管理系统中的物流频繁路径序列模式,提出了一种针对物流数据分析的路径序列挖掘算法ImGSP算法.ImGSP算法通过对原始路径数据库筛选,选出路径序列长度大于或等于候选序列长度的路径序列,有针对性地产生过度候选序列,来约减候选序列.实验结果表明:ImGSP算法能够有效地减少候选序列数量,生成频繁路径序列模式,进而产生物流中有用的规则.该方法不仅缩小了扫描数据库的规模,而且减少了生成频繁序列的候选序列集合.  相似文献   

10.
在时间序列符号化基础上,本文引入概率后缀树PST模型,构建基于时间序列符号化和概率后缀树相结合的股票预测模型.本文选择在沪深300的10支股票数据上将预测模型与传统的马尔科夫模型MM和自回归移动平均模型ARMA进行对比,结果显示本文提出的股票预测模型优于MM模型和ARMA模型,验证了本文所提出的预测模型在投资收益上的有效性.  相似文献   

11.
约束关联规则是数据挖掘的一个主要方向,可以根据用户给定的约束条件针对性的挖掘.目前大多数的研究都集中在约束频繁项集挖掘方面,很少进行序列模式的约束关联挖掘.本文把序列模式和约束进行结合,提出一种基于约束的序列模式关联规则挖掘算法.它同时处理两类约束:反单调性约束和单调性约束.可以根据约束条件挖掘数据间的因果关联关系.通过实验验证,该算法在运行效率上达到了较好效果.  相似文献   

12.
频繁序列模式挖掘算法Apriori的分析及改进   总被引:1,自引:0,他引:1  
本文对频繁序列模式挖掘算法Apriori的算法思想、步骤及缺点进行了详细的分析,并提出了改进的算法.  相似文献   

13.
Web序列模式挖掘是将数据挖掘技术应用于Web访问序列,通过对Web访问序列的模式挖掘可以发现用户与网站交互的频繁模式,利用这些模式可以建模并分析用户与网站交互的模型,进而预测未来的访问模式,这对于构建智能化Web站点和开展电子商务活动有非常重要的意义.介绍了传统的PLWAP(position coded preorder linked WAPtree)算法,并在此基础上提出了一种对PLWAP算法中Header table的新的构建方法的改进算法(NPLWAP).在NPL-WAP算法中Header table的构建过程中每一步都只基于当前处理的节点的后缀树集,且Header table并不存储所有的后缀树集节点,而是只存储后缀树集根节点,从而减少挖掘过程的相关判断.通过对真实数据的实验对比可以看出NPLWAP算法在运行时间上比传统的PLWAP算法有了很大的改进.  相似文献   

14.
度序列与树中的叶子数   总被引:2,自引:0,他引:2  
给出了树的度序列与叶子总数之间的关系式,从而得到一种精确地计算树的叶子数的方法,并证明了结论:度序列满足该关系式的简单连通图必是树.对树形图中的度序列和叶子数也有类似的结果.    相似文献   

15.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法 ,自从1995年序列模式挖掘的概念被提出以来 ,人们不断地对序列模式挖掘算法进行研究和改进 .本文介绍了一种新的序列模式挖掘方法—CSE算法及其具体实现方法 ,并对该算法性能做了初步的评价 .  相似文献   

16.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法,自从1995年序列模式挖掘的概念被提出以来,人们不断地对序列模式挖掘算法进行研究和改进,本文介绍了一种新的序列模式挖掘方法-CSE算法及其具体实现方法,并对该算法性能做了初步的评价。  相似文献   

17.
如何从动态数据中挖掘关联规则是目前知识发现中的一个研究热点。Can树是基于CATS树改进后提出的解决关联规则增量挖掘的一种有效算法,它要求事务中的每个项按照某种特定顺序进行排序后再构建Can树,其顺序一般采用字典序、字母序等。然而,Can树所使用的排序方法有可能使得Can树的规模过大,从而使得算法效率较低。针对该问题,在现有Can树挖掘算法的基础上,使用数据量排序替代现有排序方法,提出了一种基于数据量排序的Can树,并基于新的Can树对原有Can树的建树和挖掘方法进行优化。该方法可以有效减小Can树的规模,实现频繁项集挖掘在空间效率和时间效率上的优化。实验结果表明,该方法在空间效率和时间效率上好于现有的Can树算法,同时具有较好的稳定性。  相似文献   

18.
移动环境中的最大移动序列模式挖掘   总被引:1,自引:0,他引:1  
在移动通信环境中,移动序列模式挖掘对于有效的提高位置管理的服务质量具有重大的意义.移动序列模式挖掘和传统的序列模式挖掘是不同的,首先,前者需要考虑更多的时间因素;其次,移动序列模式中的项之间是连续的,因为关心移动用户的下一次移动情况.本文提出了一种挖掘移动序列模式的新技术:聚类的思想引入到移动序列模式挖掘来处理移动历史的时间离散化,并且提出了一个高效的PrefixTree算法来挖掘移动序列.性能研究表明,Pref ixTree算法优于PrefixSpan-2算法.  相似文献   

19.
图G的标号是指G的节点集到一个整数集的映射g,且由g(u)、g(v)诱导出边euv的标号.本文定义了序列树的根积运算,并研究了满足一定条件的序列树的根积的序列性,得到了一类新的节点数较多且非毛毛虫的树为序列图.  相似文献   

20.
生物序列相对于传统序列来说具有自己的特征。不同的序列模式挖掘算法应用到生物序列中有不同的特点和效率。本文分析目前比较流行的五种模式挖掘算法的运行过程,当应用到生物序列中时,分析了各个算法的性能,从而可以得出哪种算法更适应于不同类型的生物序列频繁模式挖掘。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号