首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
移动环境中的最大移动序列模式挖掘   总被引:1,自引:0,他引:1  
在移动通信环境中,移动序列模式挖掘对于有效的提高位置管理的服务质量具有重大的意义.移动序列模式挖掘和传统的序列模式挖掘是不同的,首先,前者需要考虑更多的时间因素;其次,移动序列模式中的项之间是连续的,因为关心移动用户的下一次移动情况.本文提出了一种挖掘移动序列模式的新技术:聚类的思想引入到移动序列模式挖掘来处理移动历史的时间离散化,并且提出了一个高效的PrefixTree算法来挖掘移动序列.性能研究表明,Pref ixTree算法优于PrefixSpan-2算法.  相似文献   

2.
对序列模式挖掘中的5种算法的执行过程和特点进行了研究,并对这几种算法的时间和空间执行效率进行了分析,指出这5种算法各自的使用范围,得出的结果对序列模式挖掘的应用具有一定的参考价值.  相似文献   

3.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法,自从1995年序列模式挖掘的概念被提出以来,人们不断地对序列模式挖掘算法进行研究和改进,本文介绍了一种新的序列模式挖掘方法-CSE算法及其具体实现方法,并对该算法性能做了初步的评价。  相似文献   

4.
为了实现对数据流的序列模式挖掘,提出了基于数据流的序列模式挖掘算法MFSDS-1和MFSDS-2,它们均通过调整入选度的大小来调整保存信息的粒度.算法MFSDS-2利用分层存储结构,不仅能更好地保存序列信息,而且可以通过与全局序列模式的对比得到当前活动的一些异常序列模式.实验结果表明,基于分层存储的算法MFSDS-2的效率比算法MSFDS-1高.  相似文献   

5.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法 ,自从1995年序列模式挖掘的概念被提出以来 ,人们不断地对序列模式挖掘算法进行研究和改进 .本文介绍了一种新的序列模式挖掘方法—CSE算法及其具体实现方法 ,并对该算法性能做了初步的评价 .  相似文献   

6.
卢海涛 《科技资讯》2014,12(17):204-204
论文阐述了基于时间序列的模式挖掘的基本概念,对基于时间序列的模式挖掘经典算法和增量挖掘、时间序列分段线性表示及相似性算法进行了相对全面的介绍,对算法的特征做了详细的论述。  相似文献   

7.
为了实现对数据流的序列模式挖掘,提出了基于数据流的序列模式挖掘算法MFSDS-1和MFSDS-2,它们均通过调整入选度的大小来调整保存信息的粒度.算法MFSDS-2利用分层存储结构,不仅能更好地保存序列信息,而且可以通过与全局序列模式的对比得到当前活动的一些异常序列模式.实验结果表明,基于分层存储的算法MFSDS-2的效率比算法MSFDS-1高.  相似文献   

8.
生物序列相对于传统序列来说具有自己的特征。不同的序列模式挖掘算法应用到生物序列中有不同的特点和效率。本文分析目前比较流行的五种模式挖掘算法的运行过程,当应用到生物序列中时,分析了各个算法的性能,从而可以得出哪种算法更适应于不同类型的生物序列频繁模式挖掘。  相似文献   

9.
生物序列相对于传统序列来说具有自己的特征。不同的序列模式挖掘算法应用到生物序列中有不同的特点和效率。本文分析目前比较流行的五种模式挖掘算法的运行过程,当应用到生物序列中时,分析了各个算法的性能,从而可以得出哪种算法更适应于不同类型的生物序列频繁模式挖掘。  相似文献   

10.
蔡静 《科技信息》2007,(36):24-25
从大量的序列数据中发现有用的模式是数据挖掘的一项重要任务,本文简单介绍了序列模式挖掘主要算法的基本框架,对算法涉及的概念给出形式化的定义。  相似文献   

11.
本文介绍了两种主要的序列模式挖掘方法,在已有二进制算法的基础上提出了一种基于二维数组与二进制形式的频繁序列的计算方法。该方法通过二维数组实现事务数据库的存储,利用"或"、"与"、"异或"等逻辑运算计算序列的支持度计数和确定频繁序列模式,减少了数据库的扫描次数,降低了算法实现的难度,提高了挖掘效率,具有较好的创新性和理论价值。  相似文献   

12.
序列模式的性质研究   总被引:1,自引:0,他引:1  
序列模式挖掘是数据挖掘中一个重要研究方向,具有广泛的应用背景.序列模式挖掘会产生大量的模式,使得人们很难利用它们.提出上、下闭序列模式的概念,并得到上、下闭序列模式及其它们之间的若干性质,为解决序列模式的数量问题提供理论基础.  相似文献   

13.
Parallel frequent pattern discovery algorithms exploit parallel and distributed computing resources to relieve the sequential bottlenecks of current frequent pattern mining (FPM) algorithms. Thus, parallel FPM algorithms achieve better scalability and performance, so they are attracting much attention in the data mining research community. This paper presents a comprehensive survey of the state-of-the-art parallel and distributed frequent pattern mining algorithms with more emphasis on pattern discovery from complex data (e.g., sequences and graphs) on various platforms. A review of typical parallel FPM algorithms uncovers the major challenges, methodologies, and research problems in the field of parallel frequent pattern discovery, such as work-load balancing, finding good data layouts, and data decomposition. This survey also indicates a dramatic shift of the research interest in the field from the simple parallel frequent itemset mining on traditional parallel and distributed platforms to parallel pattern mining of more complex data on emerging architectures, such as multi-core systems and the increasingly mature grid infrastructure.  相似文献   

14.
本文利用web数据挖掘方法对网站进行优化,在提出了网站优化系统的基本框架基础上,给出相应的web数据挖掘算法:频繁模式发现及序列模式挖掘两个主要算法以找到网站访问者感兴趣的页面集合以及频繁使用的链接序列,该结果以改进网站的设计,提高网站的访问率。  相似文献   

15.
数据挖掘综述   总被引:59,自引:1,他引:59  
从人工智能、统计分析和数据库技术3个方面对数据挖掘技术进行了总结;从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类、聚类、回归、关联、序列和偏差6种模式的识别.详细介绍了数据挖掘技术的常用方法,包括模糊理论、粗糙集理论、云理论、证据理论、人工神经网络、遗传算法以及归纳学习.列举了当前数据挖掘技术的实际应用场合,并指出其今后的发展趋势以及急需关注的问题.  相似文献   

16.
通过前缀序列的引入,将搜索空间划分为若干个子空间,利用模式增量技术对序贯模式进行有效搜索,并提出了项目位置索引的概念,即将原始序列数据库信息转换到项目位置索引(IPI)中,从而在搜索序贯模式时避免了复杂的多维候选序列的测试,仅需对各前缀序列对应的扩展的项目位置索引库(IPIDBs)做简单的序列数目累加操作,将复杂的高维序贯模式搜索问题巧妙地转换为一维频繁项目的搜索,降低了算法复杂度,提高了效率。  相似文献   

17.
一个简单的Web日志挖掘系统   总被引:22,自引:0,他引:22  
在分析Web日志挖掘的困难及对策的基础上,给出了一个简单的Web日志挖掘系统(SWLMS)的体系结构,具体介绍了SWLMS中日志的预处理过程,包括数据净倾、用户识别、会话识别、路径补充的主要任务及其实现,并着重介绍了预处理之后的序列模式识别过程和算法,包括最大向前路径的识别和频繁遍历路径的发现,并给出了实验结果。  相似文献   

18.
序列模式挖掘算法综述   总被引:1,自引:0,他引:1  
目前的主要序列模式挖掘算法可以分为3类:①基于Apriori的候选码生成-测试的方法;②基于垂直格式的候选码生成-测试的方法;③基于模式增长的方法.在介绍序列模式挖掘基本概念的基础上,描述了典型的挖掘算法,着重分析第②类序列模式挖掘算法的关键技术,并对各种算法进行详细的分析与比较,总结出它们的优缺点:前两类方法因产生巨大的候选序列而致挖掘代价剧增,而第③类模式增长方法避免了候选序列的产生,但挖掘长模式效率低.  相似文献   

19.
序列模式的一种挖掘算法   总被引:6,自引:1,他引:5       下载免费PDF全文
序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录数据库频繁集中各元素CtiD表的基础上,提出了序列模式挖掘的一种算法ISP。该算法考虑了项目集与序列之间的关系,利用时序连接法,采用不同的构造法,构造出相对应的候选集,从而计算出频繁集。由于算法ISP能够利用中间的挖掘结果,故提高了挖掘过程的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号