首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
时间序列相似性搜索算法研究   总被引:10,自引:0,他引:10  
时间序列分析正成为数据挖掘研究的热点,时间序列的相似性搜索是时间序列研究的重要方面,介绍了时间序列相似性搜索研究的现状,详细分析了两类具有代表性的时间序列相似性搜索算法及各自特点,指出了时间序列相似性搜索研究的挑战性及目前的局限性。  相似文献   

2.
水文时间序列的相似性搜索研究   总被引:1,自引:0,他引:1  
将时间序列相似性搜索的数据挖掘方法应用于水文时间序列数据中,挖掘相似的水文过程.在分析欧氏距离和动态时间扭曲距离两种相似性距离度量方法特点的基础上,采用对时间轴的伸缩和弯曲具有较好适应性的动态时间扭曲距离法对塔里木河流域源流区出山口水文站沙里桂兰克站1961—2000年共220场洪水流量过程进行相似性搜索,基于相似性距离度量矩阵,挖掘出相似的洪水流量过程.结果表明,沙里桂兰克站洪水过程虽形态多样,但也表现出一定的相似性,基于动态时间扭曲法的相似性搜索能有效挖掘出相似的水文过程.  相似文献   

3.
目前,时间序列相似性判定大多采用欧式距离和动态时间弯曲DTW(DynamicTimeWar.ping)方法,这两种方法均存在一定缺陷。欧式距离要求序列长度一样,垂直移动序列将影响相似性判定和阈值设置的经验性;动态弯曲距离对欧式距离进行了优化,避免了欧式长度的一致性,但其他两个缺点仍然存在且计算复杂度增加。提出了一种新的基于两点时间序列相似性算法,可计算任意两序列的相似度。首先分析了两点组成的序列形态,提出了相似性判定方法TPSS(TwoPointsSegmentationSimilarity);其次为提高相似性判定的鲁棒性,减少人为阈值设置的影响,对TPSS进行了拓展;最后给出了算法及实验分析。实验结果表明,该算法能很好地判定任意序列的相似性,提高了鲁棒性及减少人为干预,对数据挖掘中的聚类与预测有很好的帮助作用。  相似文献   

4.
在时间序列的研究中,经常需要计算二个序列的相似程度。由于序列变化的多样性和,复杂性,结果通常不能很好地满足要求。采用变换法则对时间序列进行从时域到频域的转换,再将转换后的数据按照一定的规则变换成字符序列;利用求最长公共子序列的方法计算三个序列的匹配度,实现时间序列的相似性搜索。  相似文献   

5.
为了提高效率,基于时间序列的数据挖掘,采用了近似的方法取代原有时间序列,这导致了数据挖掘准确性的降低,文章的主要目标在于有效率地搜寻时间序列中的相似子序列向量,且希望能够兼顾准确性及效率,进而提供不同领域对于时间序列的不同需要.  相似文献   

6.
本文在分析信息系统与多元时间序列关系的基础上,利用主成分的方差贡献率得到主成分的加权综合属性,从而达到将多元时间序列降为一元时间序列的目的;利用动态时间弯曲距离来刻划两个已经降为一元的时间序列相似性.  相似文献   

7.
提出了一种基于资源相似性的Web访问序列模式的相似度量方法,并且考虑了用户访问资源的时间因素,经过检验,证明其能够有效真实地反映实际情况。  相似文献   

8.
为了解决时间序列相似性比较问题,采用从时间序列的直观特征分析入手进行定义的方法,定义了具体的基于变换的时间序列的相似性,并分析了良好的时间序列变换函数所应具备的性质,讨论了一些有代表性的基于变换的时间序列相似性的定义和分析方法,对这些方法的基本思想加以提炼和总结,并讨论了这些方法的优、缺点,为基于变换的现代时间序列分析方法研究提供了较为完整的成果概览。同时,提出了借助变换函数来对时间序列的相似性进行定义的方法,为进一步做好时间序列相似性的比较工作提供了具体方向和理论依据。  相似文献   

9.
在时间序列的研究中,经常需要计算二个序列的相似程度.由于序列变化的多样性和复杂性,结果通常不能很好地满足要求.采用变换法则对时间序列进行从时域到频域的转换,再将转换后的数据按照一定的规则变换成字符序列;利用求最长公共子序列的方法计算二个序列的匹配度,实现时间序列的相似性搜索.  相似文献   

10.
关于时间序列相似性概念体系的探讨与研究   总被引:5,自引:0,他引:5  
通过分析高维空间的欧氏几何距离关系并对相似性定义进行拓展,提出了一种新的时间序列相似性概念体系,即以相似性函数和变换约束函数共同描述两个序列的相似关系.在这种概念体系中,相似性只能是某种相似性函数和变换函数约束下的相似,客观的相似性结果依赖于相似性函数和变换函数的主观选取.新的相似性概念体系可以涵盖以往各种相似性定义,不同定义可以看作相似性比较中所关注的不同方面的特征或性质.  相似文献   

11.
在对我国证券市场交易数据的研究基础上,提出了一种新的面向金融时间序列的相似度量模型。此模型的数学定义清晰,易于计算机实现,能够有效完成形态搜索的自动化。给出了模型的形式化定义和模型的性质,并在实际股票交易数据上进行了相似性搜索实验,实验结果验证了模型的识别能力。  相似文献   

12.
介绍了金融时间序列分析及其方法,阐述了金融时间序列数据挖掘的特点,总结了金融时间序列数据挖掘的主要方法,介绍了金融时间序列数据挖掘的典型应用及技术进展。  相似文献   

13.
多粒度时间序列中模糊规则的提取   总被引:2,自引:0,他引:2  
介绍了一种从多粒度时间序列中提取模糊规则的数据挖掘方法,该方法在时间序列中引入多重时间粒度,以模糊规则的形式给出数据挖掘的结果,建立多粒度时间序列的数学模型,并对提取模糊规则中所涉及的一些基本概念作出定义,在此基础上,给出数据挖掘的具体算法,通过实验证明了该挖掘算法的有效性。  相似文献   

14.
针对多数据流组成的时间序列中发现有用的结构模式的MSDD算法不能很好地对节点剪枝,以及直观地表示模式的时间关系的问题,经过研究,提出了发现多数据流时间序列结构模式的算法:时间窗口移动筛选算法(TWMA).采用事件序列化的策略来发现多流时间序列中的依赖模式,与MSDD相比,在表示上更直观,发现模式的过程更灵活.  相似文献   

15.
提出一种从时间序列数据中辨识例外模式的系统化方法,包括4个步骤1)将时间序列数据分割为一系列子序列;2)将这些子序列映射到某个特征空间;3)在此特征空间中,用聚类算法将分割得到的子序列聚类为不同的模式;4)定义例外支持的概念,并计算每个模式的例外支持,如果某个模式的例外支持小于1,则该模式是一个例外模式。实验表明该方法能够有效地监测出时间序列中的例外模式。  相似文献   

16.
把匹配抽象时间序列相似性的方法引入到地震预报的应用中,结合大量地震历史源数据,地震领域的专家经验知识和相关成果基础上,提出了一种简化的抽象时间序列匹配模型。该模型在对海量数据进行预处理筛选的基础上再进行时间相似性匹配,增加了横向和纵向多方位地区和多方位时间段的匹配,不同时间差和阈值的匹配,并通过大量实验对该模型进行了反复验证,同时对我国地震频繁地区近几十年的地震历史数据进行了相似性匹配实验分析,取得了可信度较高的实验结果,实验结果验证了所给时间序列相似性匹配控制策略的有效性、实用性以及算法的优越性。  相似文献   

17.
A fundamental problem in whole sequence matching and subsequence matching is the problem of representation of time series. In the last decade many high level representations of time series have been proposed for data mining which involve a trade-off between accuracy and compactness. In this paper the author proposes a novel time series representation called Grid Minimum Bounding Rectangle (GMBR) and based on Minimum Bounding Rectangle. In this paper, the binary idea is applied into the Minimum Bounding Rectangle. The experiments have been performed on synthetic, as well as real data sequences to evaluate the proposed method. The experiment demonstrates that 69%- 92% of irrelevant sequences are pruned using the proposed method.  相似文献   

18.
基因表达式编程(GEP)是遗传算法研究的新分支.针对股票对象的特点,提出了适应股票规律的GEP—STOCK模型,包括n时段—STOCK—GENE,STOCK—fitness以及STOCK-GEP算法,并以上海证券交易指数时间序列数据为对象做了实验.进行了误差和指数涨跌分析.实验结果表明GEP—STOCK模型预测精度较高,20d的平均绝对误差为11.08,平均相对误差为0.64%.从涨跌情况预测来看,模型对6d后指数的涨跌判断,正确率高于80%以上.  相似文献   

19.
时间序列数据的稳健最优分割方法   总被引:6,自引:0,他引:6  
针对分段多项式回归方法存在计算效率低和对噪声较敏感等缺点,提出了具有稳健性的最优分割方法,以解决时间序列数据相似搜索及知识发现处理中的长时间序列分割问题。该方法采用自顶向下策略,然后根据自适应定阶算法直接选定一个合适的多项式阶,对每个候选变化点,经过一次判断即可确定多项式的合适阶次。由于该方法基于对线性模型的数据矩阵作奇异值分解,从而可自适应确定子序列合适的模型,简化了计算过程,文中对此给出了理论证明。通过与Garalnik-Srivastava方法进行实验比较,证明所提方法不仅计算效率高,而且具有良好的稳健性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号