首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
移动环境中的最大移动序列模式挖掘   总被引:1,自引:0,他引:1  
在移动通信环境中,移动序列模式挖掘对于有效的提高位置管理的服务质量具有重大的意义.移动序列模式挖掘和传统的序列模式挖掘是不同的,首先,前者需要考虑更多的时间因素;其次,移动序列模式中的项之间是连续的,因为关心移动用户的下一次移动情况.本文提出了一种挖掘移动序列模式的新技术:聚类的思想引入到移动序列模式挖掘来处理移动历史的时间离散化,并且提出了一个高效的PrefixTree算法来挖掘移动序列.性能研究表明,Pref ixTree算法优于PrefixSpan-2算法.  相似文献   

2.
基于PrefixSpan的快速交互序列模式挖掘算法   总被引:3,自引:0,他引:3  
为了克服序列模式挖掘过程中重复运行挖掘算法而产生的时空消耗,提出了一个快速、简单而有效序列模式的交互式算法FISPM,利用前次挖掘得到的序列构造序列模式数据库用来存储挖掘出来的所有序列, 通过缩减本次挖掘所要构造投影数据库的频繁项的数量来减少构造投影数据库所需的时间以及投影数据库的大小,从而减少时间和空间消耗,提高挖掘效率.通过设置全局最小支持度来减少算法迭代次数. 实验结果证明在交互挖掘过程中FISPM效率优于PrefixSpan.  相似文献   

3.
为了从多时间序列之间发现的定性的时态相关模式可而更全面的理解和把握系统的演化特性,提出了一种基于时态逻辑的多时间序列挖掘模型.它首先将多时间序列转化为多事件序列,然后将预处理后的多事件序列利用区间时态逻辑(ITL)关系子集来定义多事件序列中事件间的时态相关模式.其次进行多状态序列融合和局部时态观测序列的生成,之后采用频繁模式挖掘算法发现多时间序列的频繁时序模式.该模型有助于解决时间序列挖掘所面临的若干挑战和难题,有助于扩展现有时间序列挖掘系统的功能,从而指导时间序列等复杂类型数据的知识发现过程.实验结果表明了该模型及算法的有效性和优越性.  相似文献   

4.
为解决多数据源挖掘隐私保护问题,文章采取按相似度分类多源数据库及其增量数据库,利用原始数据库挖掘结果和增量数据库分析结果进行敏感序列模式匹配,以有效减少数据库扫描次数的方法,设计实现隐私保护的增量式的高投票率序列模式挖掘算法。实验结果表明,给出的算法既能够准确挖掘出多数据源中全局高投票率模式,又能有效地隐藏保护敏感模式,且显著缩短了挖掘时间。  相似文献   

5.
一种序列模式的概念及挖掘算法   总被引:1,自引:1,他引:0  
介绍了一种时间序列模式的形式和概念,讨论了其相关的挖掘算法.将时间序列模式既用于具有时间关系的购买行为的分析,以揭示购买行为后面一种序列关系信息,又用于其他有时间关联的事件分析.挖掘算法由以下几部分构成建立频繁物品集,进行数据处理和转换,并生成候选子序列,通过验证后,得到长度为2,3,…的序列集合,从中选出独立最大序列即为所求.通过实例指出了该算法和传统的Aprioriall算法的不同之处.结果表明,这种序列模式在网络通信、气象分析等领域具有广阔的应用前景.  相似文献   

6.
时间序列记录的是某一统计量按照时间推移而发生变化的数据,寻找合理的挖掘算法解决时间序列问题具有很强的现实意义.提出一种保序序列挖掘方法,通过子模式匹配结果挖掘(read the sub-pattern matching for mining,RSMM)算法,挖掘时间序列中频繁出现的趋势变化,在计算支持度时根据子模式的匹...  相似文献   

7.
研究了某些时间序列所具有的分形特征,分析了利用分形理论中的R/S分析发现具有分形特征的时间序列模式的方法.用R/S方法可以从具有分形特征的时间序列中寻找变化规律,从而预测时间序列未来的发展趋势.通过实例说明分形中的R/S分析是一种有效的时间序列模式挖掘方法.  相似文献   

8.
Gen-Cluster:一个基因表达数据的高维聚类算法   总被引:1,自引:0,他引:1  
基因表达数据聚类是分析基因之间共调控关系的重要手段.挖掘子空间中表达值存在差异但变化趋势保守的序列已成为基因表达数据聚类的主要研究内容之一.在N-同维趋势相似定义的基础上,提出了一个基因表达数据的高维聚类算法Gen-Cluster,将基因表达值转化为序列形式,采用无重复投影且无候选生成的序列模式挖掘策略自底向上挖掘N-同维趋势模式,并解决了OP-Cluster算法不能挖掘含有项集的序列模式问题,最终得到表达值变化趋势保守的基因序列形成的N-同维趋势簇.实验采用Breast Tumor和MicroRNA表达数据集,验证挖掘结果是有效的,且较OP-Cluster算法表现更高效率,并涵盖其结果.  相似文献   

9.
针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性.  相似文献   

10.
卢海涛 《科技资讯》2014,12(17):204-204
论文阐述了基于时间序列的模式挖掘的基本概念,对基于时间序列的模式挖掘经典算法和增量挖掘、时间序列分段线性表示及相似性算法进行了相对全面的介绍,对算法的特征做了详细的论述。  相似文献   

11.
针对基于路径的半结构化数据结构相似度度量方法不能很好地处理路径部分相似以及忽略了元素之间兄弟关系的问题,提出一种基于频繁关联标签序列的结构相似度度量方法,该方法将半结构化数据的结构信息视为标签序列的集合,采用数据挖掘技术中频繁模式和关联项集的概念及算法,从半结构化数据中挖掘频繁关联标签序列并以此作为特征计算其结构相似度.实验结果证明:提出的基于频繁关联标签序列的半结构化数据结构相似度度量方法可以解决基于路径方法的不足,计算的结构相似度更准确、更合理.  相似文献   

12.
张雪  陈未如 《科技资讯》2006,(36):245-246
结构关系模式挖掘是数据挖掘领域一个全新的分支,它包括并发关系模式挖掘、互斥关系模式挖掘、重复关系模式挖掘及有序关系模式挖掘。随着大量基因序列数据的获取人们正在研究各种方法从海量的基因数据中挖掘有用的信息。本文基干结构关系模式挖掘理论,对DNA序列从时间、空间、距离等不同角度分析了DNA序列中存在结构关系模式的可能性,并对生物信息的结构关系模式挖掘的约束条件进行分析。  相似文献   

13.
文章研究了利用序列模式的挖掘结果对序列数据库进行再发现的问题,提出一种利用已发现序列模式对数据库中的数据序列进行聚类的方法SPSC.该方法利用发现的序列模式定义了数据序列之间相似度函数和数据序列分组的平均值,使得经典聚类方法k-means可以应用于序列型数据,实现了对包含相似模式的数据序列进行聚类;理论分析和实验表明,与已有的序列聚类方法相比,该文所提出的方法不仅可以得到更加优化的聚类,而且效率更高.  相似文献   

14.
结构关系模式挖掘是数据挖掘领域一个全新的分支,它包括关系模式挖掘、互斥关系模式挖掘、重复关系模式挖掘及有序关系模式挖掘。随着大量基因序列数据的获取人们正在研究各种方法从海量的基因数据中挖掘有用的信息。本文基于结构关系模式挖掘理论,对DNA序列从时间、空间、距离等不同角度分析了DNA序列中存在结构关系模式的可能性,并对生物信息的结构关系模式挖掘的约束条件进行分析。  相似文献   

15.
为了减少无用候选序列的生成,并使挖掘得到的序列模式符合用户要求,约束条件下的频繁序列模式挖掘已成为数据挖掘领域的一个新的重要研究方向.作为强约束形式的一种,均值约束目前仍然是基于约束的频繁序列模式挖掘的一个困难问题,其主要原因在于很难利用均值约束来进行序列模式挖掘中的剪枝.为此,提出了一种基于均值约束满足度剪枝策略,并且以前缀增长方法为基础设计了一个有效的频繁序列模式挖掘算法.通过分析并实验验证了该算法的时间效率和剪枝性能,结果表明,该方法是有效的.  相似文献   

16.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法 ,自从1995年序列模式挖掘的概念被提出以来 ,人们不断地对序列模式挖掘算法进行研究和改进 .本文介绍了一种新的序列模式挖掘方法—CSE算法及其具体实现方法 ,并对该算法性能做了初步的评价 .  相似文献   

17.
由于人类活动的复杂性和多维性,活动模式的挖掘具有很大的挑战性.本文提出了一个基于时序活动序列计算用户之间的相似度,通过聚类分析来挖掘活动模式和社会人口学模式的方法,对模式进行趋势分析.实验结果表明,提出O(p(m–p))的相似度算法,可以有效地进行聚类.在此基础上,通过时序活动图和概率密度函数(PDF)图的可视化以及统...  相似文献   

18.
将无候选序列的最大序列模式挖掘思想应用到多步攻击场景的构建中,改变了以往利用序列模式挖掘思想产生较多攻击序列模式、耗费大量内存和时间、不利于实时在线攻击意图识别、挖掘结果难以理解的现状,并根据算法的特点提出3种可以提高算法性能的策略。为验证算法的有效性,使用DARPA 2000数据集进行测试,结果表明该方法可以有效构建攻击者的多步攻击场景,在时间、内存消耗以及挖掘结果上比BIDE算法更优。  相似文献   

19.
时间序列挖掘是在经典的数据关联分析过程中加入时间戳印记,从而发现一定时间间隔内事物对象不同行为模式之间的关联关系。网络盗窃是一针对不特定多数人实施的短期多发性犯罪活动,其原始数据记录形式为多属性关联信息表,数据分布因具有时间顺序特征而符合时间序列挖掘分析的基本条件,为对该类数据进行频繁序列模式提取。首先论述了建立量化概念格数学模型的知识表示优势,证明了该格结构对原始数据表的完备性,其次提出了量化概念格上的频繁序列生成算法AMSP,最后在网络盗窃行为的拟合分析中对AMSP算法加以验证,说明该算法对于时间序列分析具有直观高效性,同样可应用于与网络盗窃案件具有相似数据特征的其他网络犯罪行为的预测分析。  相似文献   

20.
从事务数据、时间序列数据等数据库中挖掘频繁模式已在数据挖掘领域中得到了广泛地研究.针对目前已有的Apriori算法和频繁模式增长算法在时间和空间等方面的复杂性和低效性,提出了一种新的数据结构——事务模式树,用来存放待挖掘的事务信息,同时给出一种基于该数据结构的挖掘算法——事务模式树分层挖掘算法.最后,把该算法应用于保险业务.结果表明,该算法简单高效,值得推广.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号