首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
时间序列相似搜索是时间序列数据挖掘的一个重要功能,它所面临的最大问题是搜索空间过大、计算过于复杂。本文提出了基于OLAM体系架构的一种时间序列相似模式分层匹配方法。该方法首先利用对时间序列广义移动均值的聚类进行相似搜索的粗匹配,接着通过构造时间序列趋势的相似度,利用此用户对相似度的要求可以进行第二次筛选;最后通过对剩余的时间序列的距离计算,就可以获得最终相似的时间序列。实验分析表明该方法具有良好的性能和OLAM特征。  相似文献   

2.
将序列数据的相似度度量方法S3M引入蚁群聚类算法中,提出一种基于序列相似性的蚁群聚类算法。该算法既继承了蚁群聚类算法原有的优点,又能有效地对序列数据聚类,更适合处理序列数据。  相似文献   

3.
OPSM作为一种基于模式的双聚类方法,被广泛应用于基因数据矩阵的分析上.在一个OPSM聚类中,形成聚类的若干基因在特定的条件子集下具有一致的表达模式,其中隐含着基因的关联调控信息,对基因数据矩阵进行双聚类分析具有生物学意义.其中,Deep OPSM是OPSM聚类中行数少列数多的特殊聚类.根据OPSM模型,该文提出了一种快速有效的精确性算法,用于挖掘分散在基因数据矩阵中的OPSM聚类.首先寻找基因数据矩阵中任意两行的公共子序列,然后利用STL map对找到的公共子序列进行支持度统计,并将符合支持度阈值的OPSM聚类输出,且通过阈值的设置即可输出Deep OPSMs.结果证明该算法能够快速地找到符合条件的Deep OPSMs.通过P-value值分析,验证了找到的Deep OPSM具有明显的生物学意义.  相似文献   

4.
随着网络环境的愈加复杂,用户数量和种类显著增加,网络信息更新频繁.针对文本数据自身较稀疏、不规范等特点,提出了基于改进的局部序列比对算法的用户会话聚类新方法.首先通过计算用户会话集成距离方法衡量会话的相似度;然后,采用改进的基于用户会话距离的序列比对算法对话题进行聚类,该算法改善了传统用户聚类算法的不足.实验表明,该算...  相似文献   

5.
为了通过预测分析检索量数据来指导商家调整产品开发及经营策略,将检索量数据组织为时间序列,对其用自回归滑动平均(ARMA)模型进行建模预测.先将时间序列进行聚类,仅对聚类中心序列进行ARMA模型识别,同类序列用该模型进行近似建模预测:经过数据预处理、相似性分析、基于相似度的聚类、时间序列预测等过程,得到检索量数据的预测值...  相似文献   

6.
根据多维数据间相似度的定义,阐述了数据相似度与向量范数之间的关系,提出了一种基于范数的多维数据模糊聚类方法·该方法把每一个多维数据看做一个多维向量,利用与向量有关的范数对其中的数据进行排序,得到一个近似聚类族解·同理,对每一个近似聚类使用另一个范数做进一步分解,求解多维数据模糊聚类的近似解·最后,对得到的每一个近似聚类使用传统方法求出准确聚类·使用该方法不需建立模糊相似关系即可进行多维数据的近似聚类,总共所需访问数据库的次数也较小,因此具有较好的性能,特别适合于针对大型数据库的聚类·  相似文献   

7.
灰色关联聚类是灰色系统分析的重要研究领域.现有的灰关联聚类方法在处理不同长度序列数据时,通常采用补齐或删除数据方式进行处理,增加了系统的不确定性.在动态时间弯曲距离基础上,提出了一种新的灰关联聚类方法,通过计算序列间距离矩阵的最短路径来度量相似程度,最终完成序列的灰关联聚类.该方法无需对序列数据进行人工干预,具有更强的鲁棒性.实验结果表明,在处理不同长度数据序列时,聚类结果更为准确.  相似文献   

8.
城市轨道交通牵引能耗占系统整体能耗的40%~60%.车载能耗计量装置记录了大量时间序列形式的牵引能耗数据,其能耗模式和异常分析对城市轨道交通节能运营具有重要意义.本文提出一种针对时间序列数据的牵引能耗异常分析方法.首先基于符号化近似聚合方法降低原时间序列维度得到牵引能耗子模式,然后利用K-means聚类实现牵引能耗模式判别,最后基于获得的典型牵引能耗模式及时间序列相似性度量方法,分析牵引能耗时间序列是否存在异常.将该方法应用于北京地铁某线路列车运营过程中记录的数据,得到3种典型能耗模式并结合车底运用计划进行分析,所提方法可用于时间序列牵引能耗数据的异常判断,为及时发现并确定牵引能耗异常程度提供数据支撑.  相似文献   

9.
目前智能环境中传感器网络所采集的海量数据面临着进行有效事件的模式分类及异常检测的难题.为了有效对智能环境中传感器网络采集的时间序列数据所表征的事件进行分类,提出了基于协方差特征空间映射数据的聚类分析方法.通过对采集得到的时间序列数据按时隙进行划分,映射到协方差特征空间,然后对映射后的数据进行了动态密度聚类,从而实现对事件的分类;并根据聚类结果建立分类模板,作为对日常事件进行分类划分的检测方法,同时利用所得的分类模板,实现对异常事件的检测.实验结果表明,基于协方差特征空间映射数据的聚类分析方法能有效对传感器网络采集的时间序列数据所表征的事件进行分类,并能有效提升异常事件的检测及筛选效果.  相似文献   

10.
针对对海量数据库中的大数据进行优化挖掘,可以提高数据特征的提取和检测能力.传统方法采用模糊C均值聚类的数据挖掘算法,当数据在层次聚类过程中空间特征的相似度差异性较小时,数据挖掘的准确度不高.提出一种基于粒子群混沌差分训练对模糊C均值聚类算法进行改进,建立数据挖掘优化模型.首先提出了数据聚类据挖掘模型的总体构架,采用非线性时间序列分析方法进行数据信息流拟合,对数据信息流进行高阶累积量特征提取,采用粒子群混沌差分训练实现模糊C均值聚类算法改进.以改进的模糊聚类算法对提取的高阶累积量特征进行聚类分析,以分析结果为依据对数据挖掘模型进行优化.仿真结果表明,该数据挖掘模型能有效实现海量数据的优化聚类和特征提取,数据挖掘的精度较高,性能较好,避免挖掘过程陷入局部收敛.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号