首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种序列模式的概念及挖掘算法   总被引:1,自引:1,他引:0  
介绍了一种时间序列模式的形式和概念,讨论了其相关的挖掘算法.将时间序列模式既用于具有时间关系的购买行为的分析,以揭示购买行为后面一种序列关系信息,又用于其他有时间关联的事件分析.挖掘算法由以下几部分构成建立频繁物品集,进行数据处理和转换,并生成候选子序列,通过验证后,得到长度为2,3,…的序列集合,从中选出独立最大序列即为所求.通过实例指出了该算法和传统的Aprioriall算法的不同之处.结果表明,这种序列模式在网络通信、气象分析等领域具有广阔的应用前景.  相似文献   

2.
基于广义后缀树的事件序列频繁情节挖掘算法   总被引:1,自引:0,他引:1  
为了有效地挖掘事件序列频繁情节,提出了一种广义后缀树结构发现和存储频繁情节. 此结构利用广义后缀概念并且树中只包含频繁情节结点,用频繁情节发生列表逐层构建的方法提高了建树效率. 该方法充分利用了事件序列的有序特点,可用于发现各类频繁情节. 实验结果表明该算法性能优于Apriori-like频繁情节发现算法.  相似文献   

3.
在研究已有算法的基础上提出了一种频繁序列挖掘算法IDSG.该算法通过在频繁项(而不是频繁项集,即无需先求出所有频繁项集)间建立关联图,并在垂直数据库表达的基础上,借助简单的时态连接得到频繁序列完全集.整个过程只需扫描原始数据库两遍,有效减少磁盘I/O.另外,优化策略的正确运用,有助于减少候选序列的个数.分析及实验表明,较之同类算法,算法IDSG在效率上有了明显提高.  相似文献   

4.
分析了并行序列自身特色,提出了一种并行序列的挖掘算法PSMA,PSMA在hash树的基础上对并行序列事件反复挖掘,产生频繁有效序列模式,它是对传统序列模式挖掘算法的改进.PSMA算法针对并行序列,能更有效地发现所有频繁并行序列模式.  相似文献   

5.
DMBIT:一种有效的序列模式挖掘算法   总被引:1,自引:0,他引:1  
大量候选序列模式支持度的计算所带来的时间消耗是序列模式挖掘主要问题之一,为此提出了一种有效的序列模式挖掘算法:DMBIT(Data Mining Bitmap),该算法根据位索引表和Seq-list表的结构,采用渐进的事件扩展,事务扩展方法,通过有效的剪枝策略和"与"逻辑运算操作进一步缩小了频繁序列的搜索范围,同时通过序列列表ListX的生成加快了相应候选项支持度的计算,算法分析和实验结果表明,在大数据集环境下的DMBIT算法性能优越,能够明显加速数据库中最大频繁序列的生成.  相似文献   

6.
针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性.  相似文献   

7.
重用最大频繁模式的可持续进化算法   总被引:1,自引:0,他引:1  
为了重用进化过程中沉淀在优秀个体集中的信息,设计了最大频繁序列模式挖掘算法,并在其基础上提出了重用最大频繁模式的可持续进化算法(MFPEA).该算法设置了多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁序列模式挖掘算法挖掘种群中的优良基因,并将具有优良基因模块的新个体注入到不同适应度水平的种群中.文中...  相似文献   

8.
为了从反映网络状况和网络行为的海量历史数据中提取有用的网络管理知识,提出了一种用于获取网络管理知识的序列模式挖掘新算法--基于定位索引投影的序列模式挖掘算法.该算法采用模式增长、分而治之的思想,通过引入定位索引的概念,避免了对投影数据库的扫描,进一步减少了系统的开销.实验证明,利用该算法能够有效地发现网络告警事件序列模式.  相似文献   

9.
为了减少无用候选序列的生成,并使挖掘得到的序列模式符合用户要求,约束条件下的频繁序列模式挖掘已成为数据挖掘领域的一个新的重要研究方向.作为强约束形式的一种,均值约束目前仍然是基于约束的频繁序列模式挖掘的一个困难问题,其主要原因在于很难利用均值约束来进行序列模式挖掘中的剪枝.为此,提出了一种基于均值约束满足度剪枝策略,并且以前缀增长方法为基础设计了一个有效的频繁序列模式挖掘算法.通过分析并实验验证了该算法的时间效率和剪枝性能,结果表明,该方法是有效的.  相似文献   

10.
针对复杂系统产生的时间序列,研究其局部关联特征比研究系统全局特征模型具有明显的优势.为研究时间序列内部或局部形态的关联特征,首先借助FCM来软化时间序列属性论域的划分边界,然后,采用改进的布尔型属性关联规则并行挖掘算法来发现频繁模糊属性集,最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.提出了基于FCM聚类的时间序列模糊关联规则的并行挖掘算法,并通过实验验证了算法的有效性.  相似文献   

11.
针对信息物理融合系统时间不确定事件流调度顺序的决策依据单一问题,首先利用D-S证据理论在多证据源概率融合上的优势,充分考虑事件优先级、截止期、紧迫度、事件依赖等多个属性的影响,构建具备多属性特征的模糊结束时刻基本概率分配求解模型。然后,建立D-S证据理论与直觉模糊集的关联模型,求解模糊结束时刻隶属度与非隶属度;最后,利用直觉模糊集负向时间推理理论和相关计分函数推导模糊开始时刻概率得分,得到时序推理结果,并以此确定基于多属性判据的时间不确定事件流调度顺序。实验结果表明,当事件数量增长时,调度准确率可保持在85%以上;当模糊区间限制规模扩大时,调度准确率下降幅度不超过15%。  相似文献   

12.
时间序列的相似性度量是时间序列聚类、分类以及其他相关时间序列分析的基础.传统基于距离的相似性度量方法,忽视了时间序列可能存在的时间上的联系,而将时间序列看作一系列孤立点的集合.对于序列间可能存在的前后联系,基于分数阶微分的遗传特性和记忆特性,提出一种新的时间序列聚类的相似性度量.根据时间序列的分数阶微分计算新序列间的点距离,将其作为聚类算法的输入对时间序列进行聚类.仿真实验结果表明,与基于原始序列矢量距离的聚类结果相比,新的分数阶相似性度量方法表现更好.  相似文献   

13.
基于情境的文本中的时间信息分析   总被引:5,自引:2,他引:3  
情境用来描述文本中具体的动态和静态事件,时间是其重要因素·为了分析文本中的时间信息,本文首先给出了一个基于情境的文本理解的模型,并在时态逻辑的基础上,提出了文本的时间信息分析方法,它是将事物发展变化的时间顺序作为理解文本的一条重要线索·其主要工作包括:讨论了时间的概念、时间的类型和时间单位的转换机制;分析了命题间的时间关系、对象行为间的时间关系以及事件状态与时间过程的关系;并给出了所使用的时态逻辑  相似文献   

14.
由于文本中事件之间的时序关系可以帮助人们更好地理解文本内容,故针对新闻报道类文本,将事件作为其基本语义单元,并根据时序关系建立事件有向网络文本表示模型;利用PageRank算法结合主题相关度对时序网络进行节点重要度计算及调整;最后,按照重要度以及事件发生的顺序进行排序,并按照一定的压缩比提取摘要句,删除冗余的句子,将事件对应的原语句作为摘要。实验结果表明,基于事件时序关系的自动摘要方法效果较好。  相似文献   

15.
Dragoi G  Tonegawa S 《Nature》2011,469(7330):397-401
During spatial exploration, hippocampal neurons show a sequential firing pattern in which individual neurons fire specifically at particular locations along the animal's trajectory (place cells). According to the dominant model of hippocampal cell assembly activity, place cell firing order is established for the first time during exploration, to encode the spatial experience, and is subsequently replayed during rest or slow-wave sleep for consolidation of the encoded experience. Here we report that temporal sequences of firing of place cells expressed during a novel spatial experience occurred on a significant number of occasions during the resting or sleeping period preceding the experience. This phenomenon, which is called preplay, occurred in disjunction with sequences of replay of a familiar experience. These results suggest that internal neuronal dynamics during resting or sleep organize hippocampal cellular assemblies into temporal sequences that contribute to the encoding of a related novel experience occurring in the future.  相似文献   

16.
邓勇  Liu  Qi  Li  Yixue 《高技术通讯(英文版)》2006,12(1):109-112
0 IntroductionData mining is widely used in many research fieldssuch as decision supporting systems[1], bio-informationanalysis[2]and knowledge engineering[3-5]. Most data col-lected from scientific experiments or telecommunicationnetworks have inherent sequential nature inthemand canthus be abstractly viewed as a sequence of events . Onebasic problemin miningsuchevent sequencesis discoveryof recurrent combinations of events , which are calledepisodes. Once frequent episodes are discovered,rul…  相似文献   

17.
发现频繁情节的改进算法   总被引:1,自引:0,他引:1  
在事件序列的数据挖掘中,一个重要的步骤就是发现频繁情节,一旦发现频繁情节就能导出描述该序列行为的情节规则.基于逐级(level-wise)搜索算法WINEPI,提出了一种发现频繁情节的改进算法.该算法通过一个新的引理,帮助进一步确定下一级中感兴趣的情节组合,从而获得了较高质量的候选集,缩短了执行时间,对实际数据和仿真数据的实验结果表明,本算法是有效的。  相似文献   

18.
时间识别是自然语言处理中极其重要的课题。事件中与主题相关的时间信息体现了事件在时间维度的主题特征。当前面向事件的时间识别大多是基于句子或短语的,并采用静态时间值机制。本文提出了一个面向主题事件的时间识别模型。该模型采用参考时间动态选择机制对时间表达式规范化。结合事件抽取和浅层语义分析,将浅层语义分析结果和时间表达式进行映射,将基于句子或短语的时间识别转化为基于篇章的时间识别,从而识别主题事件片段的时间。实验表明所提出的方法使主题事件片段的时间识别的性能提高了9.6%。  相似文献   

19.
Patel AD  Balaban E 《Nature》2000,404(6773):80-84
Despite growing interest in temporal aspects of auditory neural processing, little is known about large-scale timing patterns of brain activity during the perception of auditory sequences. This is partly because it has not been possible to distinguish stimulus-related activity from other, endogenous brain signals recorded by electrical or magnetic sensors. Here we use amplitude modulation of unfamiliar, approximately 1-minute-long tone sequences to label stimulus-related magnetoencephalographic neural activity in human subjects. We show that temporal patterns of activity recorded over particular brain regions track the pitch contour of tone sequences, with the accuracy of tracking increasing as tone sequences become more predictable in structure. In contrast, temporal synchronization between recording locations, particularly between sites over the left posterior hemisphere and the rest of the brain, is greatest when sequences have melody-like statistical properties, which may reflect the perceptual integration of local and global pitch patterns in melody-like sequences. This method is particularly well suited to studying temporal neural correlates of complex auditory sequences (such as speech or music) which engage multiple brain areas as perception unfolds in time.  相似文献   

20.
目前智能环境中传感器网络所采集的海量数据面临着进行有效事件的模式分类及异常检测的难题.为了有效对智能环境中传感器网络采集的时间序列数据所表征的事件进行分类,提出了基于协方差特征空间映射数据的聚类分析方法.通过对采集得到的时间序列数据按时隙进行划分,映射到协方差特征空间,然后对映射后的数据进行了动态密度聚类,从而实现对事件的分类;并根据聚类结果建立分类模板,作为对日常事件进行分类划分的检测方法,同时利用所得的分类模板,实现对异常事件的检测.实验结果表明,基于协方差特征空间映射数据的聚类分析方法能有效对传感器网络采集的时间序列数据所表征的事件进行分类,并能有效提升异常事件的检测及筛选效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号