首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
为了从多时间序列之间发现的定性的时态相关模式可而更全面的理解和把握系统的演化特性,提出了一种基于时态逻辑的多时间序列挖掘模型.它首先将多时间序列转化为多事件序列,然后将预处理后的多事件序列利用区间时态逻辑(ITL)关系子集来定义多事件序列中事件间的时态相关模式.其次进行多状态序列融合和局部时态观测序列的生成,之后采用频繁模式挖掘算法发现多时间序列的频繁时序模式.该模型有助于解决时间序列挖掘所面临的若干挑战和难题,有助于扩展现有时间序列挖掘系统的功能,从而指导时间序列等复杂类型数据的知识发现过程.实验结果表明了该模型及算法的有效性和优越性.  相似文献   

2.
张雪  陈未如 《科技资讯》2006,(36):245-246
结构关系模式挖掘是数据挖掘领域一个全新的分支,它包括并发关系模式挖掘、互斥关系模式挖掘、重复关系模式挖掘及有序关系模式挖掘。随着大量基因序列数据的获取人们正在研究各种方法从海量的基因数据中挖掘有用的信息。本文基干结构关系模式挖掘理论,对DNA序列从时间、空间、距离等不同角度分析了DNA序列中存在结构关系模式的可能性,并对生物信息的结构关系模式挖掘的约束条件进行分析。  相似文献   

3.
时间序列数据挖掘中有一类挖掘是把时间序列数据中相似规律发掘出来,这类挖掘就是相似模式的挖掘.这类挖掘有很广泛的应用空间、很大的研究价值.本文从相似度量、存储结构和查找的完备性三个方面介绍了时间序列相似模式挖掘问题的技术方法.  相似文献   

4.
复杂高效用模式挖掘是当前研究的一个新兴主题。本文首次从高效用融合模式和衍生模式2个角度进行讨论。首先,对于融合模式,根据数据结构的不同对高效用序列模式进行分类论述;按照时间顺序对高效用片段模式、周期高效用模式进行概述。针对衍生模式,从数据结构角度对高平均效用模式、带有负项的高效用模式、on-shelf高效用模式进行总结;从精简类型角度概述精简高效用模式,并对现有融合模式和衍生模式挖掘算法的优缺点、上边界等进行对比分析。最后,针对现阶段研究缺陷与不足,给出了下一步研究方向,包括不确定数据中的高效用模式挖掘方法、数据流上的高效用on-shelf模式挖掘方法和大数据环境下的并行高效用模式挖掘方法。  相似文献   

5.
结构关系模式挖掘是数据挖掘领域一个全新的分支,它包括关系模式挖掘、互斥关系模式挖掘、重复关系模式挖掘及有序关系模式挖掘。随着大量基因序列数据的获取人们正在研究各种方法从海量的基因数据中挖掘有用的信息。本文基于结构关系模式挖掘理论,对DNA序列从时间、空间、距离等不同角度分析了DNA序列中存在结构关系模式的可能性,并对生物信息的结构关系模式挖掘的约束条件进行分析。  相似文献   

6.
从事务数据、时间序列数据等数据库中挖掘频繁模式已在数据挖掘领域中得到了广泛地研究.针对目前已有的Apriori算法和频繁模式增长算法在时间和空间等方面的复杂性和低效性,提出了一种新的数据结构——事务模式树,用来存放待挖掘的事务信息,同时给出一种基于该数据结构的挖掘算法——事务模式树分层挖掘算法.最后,把该算法应用于保险业务.结果表明,该算法简单高效,值得推广.  相似文献   

7.
Rough集挖掘时间序列的研究   总被引:10,自引:1,他引:9  
Rouhg集方法是一种用于处理不确定性和模糊性知识的数学工具。探讨了基于Rough集方法的时间序列挖掘问题,提出一种将时态信息系统转化信息系统的方法和一个将实时时态信息系统转换为时态信息系统的方法;并从理论上证明了该方法在挖掘效率上的优越性。  相似文献   

8.
随着市场竞争的日趋激烈和业务环境的不断变化,企业数据中的时间信息的管理问题受到人们普遍关注。时态数据挖掘成为数据挖掘研究的一个热点。考虑到用户的时态需求常常是非确定和非精确的,在采用模糊时态代数来表达时态需求的基础上,提出了一种带有效时间的模糊关联规则,并给出了一种基于FP-树的挖掘方法。最后用一个例子对该方法的执行过程进行解释。  相似文献   

9.
研究了一种从GSM系统报警数据中挖掘序列报警模式的方法。根据报警数据的特点,提出了数据清洗的方法。通过使用时间约束来限制两个报警事件在时间上的差异,利用MSAP挖掘算法获取两个报警事件之间平均的时间偏差,并发现有用的序列报警模式。  相似文献   

10.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

11.
一种基于序列挖掘的分类系统框架   总被引:1,自引:0,他引:1  
为了有效地对序列数据进行分类,提出了一种集成分类挖掘和序列模式挖掘技术的分类系统框架(SPACS).先采用一套约束和裁减策略,为每个分类挖掘频繁序列模式,并将其转换为分类序列规则(CSR);再利用平均CSR匹配置信度和一个规则匹配算法构建有效的序列数据分类器.SPACS不需要在提取序列的特征后采用传统方法进行分类,可以直接利用从序列数据中提取出的频繁序列进行分类.实验结果表明,对于序列类型的数据的分类,SPACS比传统的决策树和关联分类方法具有更高的分类精度.  相似文献   

12.
时间序列记录的是某一统计量按照时间推移而发生变化的数据,寻找合理的挖掘算法解决时间序列问题具有很强的现实意义.提出一种保序序列挖掘方法,通过子模式匹配结果挖掘(read the sub-pattern matching for mining,RSMM)算法,挖掘时间序列中频繁出现的趋势变化,在计算支持度时根据子模式的匹...  相似文献   

13.
时间是数据本身固有的属性,将时间约束加在关联规则中能更好地说明事实.本文介绍的方法能够提取时态数据库中带时态信息的关联规则,而且能够计算时态数据库中某个非数值型属性(项)的周期,并通过执行改造了的Apriori算法提取该属性的周期规律.本文通过选取两个时间粒度,对时态数据库中的时间区间进行了两次划分和标记.第一次划分和标记的目的是计算选择出的某非数值型属性的周期;第二次划分和标记的目的是离散化时间区间,用标记集合代表原时间区间,进而根据标记集合求交的结果得到带时态信息的频繁项集.采用标记集合求交的方法能够使得Apriori算法的迭代迅速收敛,提高算法执行效率.  相似文献   

14.
针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性.  相似文献   

15.
将无候选序列的最大序列模式挖掘思想应用到多步攻击场景的构建中,改变了以往利用序列模式挖掘思想产生较多攻击序列模式、耗费大量内存和时间、不利于实时在线攻击意图识别、挖掘结果难以理解的现状,并根据算法的特点提出3种可以提高算法性能的策略。为验证算法的有效性,使用DARPA 2000数据集进行测试,结果表明该方法可以有效构建攻击者的多步攻击场景,在时间、内存消耗以及挖掘结果上比BIDE算法更优。  相似文献   

16.
时态知识/数据模型研究及应用   总被引:3,自引:0,他引:3  
时间是信息的重要属性,不仅数据有时态性,而且知识也有时态性.时态信息在信息系统中扮演着日益重要的角色,在某些系统中还起着关键性作用.将时态应用分为完全时态应用、嵌入式时态应用和混合型时态应用3种模式,提出一种时态信息模型,重点讨论时态数据模型和时态知识表达模式,介绍典型时态信息系统"工资智能决策支持系统"中的知识/数据处理模型.  相似文献   

17.
卢海涛 《科技资讯》2014,12(17):204-204
论文阐述了基于时间序列的模式挖掘的基本概念,对基于时间序列的模式挖掘经典算法和增量挖掘、时间序列分段线性表示及相似性算法进行了相对全面的介绍,对算法的特征做了详细的论述。  相似文献   

18.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法,自从1995年序列模式挖掘的概念被提出以来,人们不断地对序列模式挖掘算法进行研究和改进,本文介绍了一种新的序列模式挖掘方法-CSE算法及其具体实现方法,并对该算法性能做了初步的评价。  相似文献   

19.
详细分析和阐述了时态网络中的链路预测问题,将时态网络按时间顺序划分为具有相同时间间隔的多层网络快照序列.针对基于共同邻居的相似性指标对网络链路刻画粒度较粗糙的问题,提出了基于邻居节点聚类系数的相似性度量指标NCC和NCCP,并基于此提出时态网络链路预测算法.通过在真实数据集上的对比实验验证了利用邻居节点的聚类信息可以提高预测精度.利用真实邮件数据集验证了所提出的链路预测算法预测效果的优越性,并且实验结果证明越接近预测时间的网络结构对预测结果影响越大.  相似文献   

20.
风险评估一直是银行客户管理方面最为关注的一个方面,关于它的研究也一直是金融领域的一个热点。云计算采用了一种资源共享的IT技术和管理方式,提供了一种更高效的数据存储能力和挖掘能力,面对这一新兴技术的发展,金融行业在客户管理领域面临革命性的改变,传统的商业银行客户分析模式将向大数据接轨。其中,云计算模式能够快速的识别细分客户,方便获取和采集客户的信息,从而更好地评估客户价值。该文针对这一现状,从银行客户风险的角度出发,探究海量数据挖掘的情况下云计算评估模式的优势以及应用框架。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号