首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
金融时间序列指描述不同金融产品诸如股票、汇率与基金等的时间序列.它与金融市场中人类的各种经济活动密切相关,呈现出复杂多变的状态.为了从海量的金融数据中发现有价值的,可用于投资的信息,大量学者采用数据挖掘来对金融时间序列作数据提取和处理.由于金融时间序列具有高噪声、非平稳性、潜在的周期性等特性,如果直接在金融时间序列的原始数据的基础上进行数据挖掘,会导致结果失败或是取得不理想的挖掘效果.而在数据挖掘前能对原始数据进行数据清洗、数据集成等预处理,数据挖掘质量将达到更好地效果.作为金融时间序列的一个重要分支,股票时间序列预测方法通常采用分段线性表示PLR(Piecewise Linear Representation)进行时间序列的预处理.但是PLR算法存在采用单一的拟合误差作为阈值,分段效果不太理想,算法本身的通用性,时间复杂度等性能都有待提高等缺点.本文提出了金融时间序列区域分割方法,该方法在定性和定量上都优于传统的分段线性方法.  相似文献   

2.
基于最小二乘支持向量机的复杂金融时间序列预测   总被引:15,自引:0,他引:15  
为了解决神经网络算法预测海量金融时间序列数据会出现训练速度慢,内存开销大等问题,提出一种基于最小二乘支持向量机的复杂金融数据时间序列预测方法.该方法将传统的支持向量机中的不等式约束改为等式约束,且将误差平方和的损失函数作为训练集的经验函数,这样把二次规划问题转化为求解线性方程组问题,提高求解问题的速度和收敛精度.实验中以证券指数为实验数据,对大批量金融数据进行了时间序列预测,相比于神经网络预测方法,该方法在大批量金融数据时间序列预测的训练时间、训练次数和预测误差上都有了明显提高,对复杂金融时间序列具有较好的预测效果.  相似文献   

3.
在自然科学和社会科学中,大量的决策问题需要利用时间序列模型进行预测,针对时间序列参数估计的不精确,往往会对预测结果造成影响的问题,提出一种基于免疫算法优化时间序列模型参数的方案,该方案利用免疫算法精确计算的优势,先利用最大似然参数估计方法将时间序列模型的待定参数表示成其样本观测值联合概率的似然函数,然后使用免疫算法求得该函数的极值,从而可以得到时间序列模型的待定参数,最后为了验证该模型预测的精确性,使用上证指数和深证指数的金融时间序列的数据作为测试样本数据集,我们将预测结果与标准的AR-MA时间序列模型和其他预测模型进行比较,以分析它的性能.  相似文献   

4.
时间序列挖掘是在经典的数据关联分析过程中加入时间戳印记,从而发现一定时间间隔内事物对象不同行为模式之间的关联关系。网络盗窃是一针对不特定多数人实施的短期多发性犯罪活动,其原始数据记录形式为多属性关联信息表,数据分布因具有时间顺序特征而符合时间序列挖掘分析的基本条件,为对该类数据进行频繁序列模式提取。首先论述了建立量化概念格数学模型的知识表示优势,证明了该格结构对原始数据表的完备性,其次提出了量化概念格上的频繁序列生成算法AMSP,最后在网络盗窃行为的拟合分析中对AMSP算法加以验证,说明该算法对于时间序列分析具有直观高效性,同样可应用于与网络盗窃案件具有相似数据特征的其他网络犯罪行为的预测分析。  相似文献   

5.
为了有效地预测聚集查询的未来聚集值,提出了一种基于混沌理论的数据流连续聚集查询预测未来聚集值算法——CSPA算法.数据流看作是以数据到达时间为序的一个时间序列,借鉴传统时间序列分析技术探讨了连续聚集查询的未来聚集值预测问题,但由于数据流序列与传统时间序列在时间间隔和数据集的处理上存在很大差别,于是采用流滑动窗口技术加以处理.其次,针对目前数据流聚集查询预测领域已有的一些研究结果都未考虑流数据内在的复杂非线性动力学特征对预测的影响问题,该算法又利用了混沌理论中的局域预测思想解决了这一不足.实验结果表明,利用该算法进行预测具有很好的准确性.  相似文献   

6.
现有结合特征提取与预测模型的方法不能准确把握金融时间序列的混沌性与交互性,导致预测精度不高。针对此问题,提出一种基于二次分解与长短期记忆(long short term memory, LSTM)网络的金融时间序列预测算法。使用变分模态分解方法与集成经验模态分解方法依次解析金融时间序列数据,得到能表达数据混沌性特征的模态;将模态信息输入到融合有因子分解机(factorization machine, FM)的长短期记忆网络模型中,融合获取到的长记忆性特征与交互性特征,进而预测最终的结果;选取沪深300指数的历史数据作为实验数据集,通过多组对比实验验证算法的有效性。实验结果表明,提出的算法可以有效提升模型的预测能力,同时表达金融时间序列的混沌性、长记忆性、交互性。  相似文献   

7.
为了从多时间序列之间发现的定性的时态相关模式可而更全面的理解和把握系统的演化特性,提出了一种基于时态逻辑的多时间序列挖掘模型.它首先将多时间序列转化为多事件序列,然后将预处理后的多事件序列利用区间时态逻辑(ITL)关系子集来定义多事件序列中事件间的时态相关模式.其次进行多状态序列融合和局部时态观测序列的生成,之后采用频繁模式挖掘算法发现多时间序列的频繁时序模式.该模型有助于解决时间序列挖掘所面临的若干挑战和难题,有助于扩展现有时间序列挖掘系统的功能,从而指导时间序列等复杂类型数据的知识发现过程.实验结果表明了该模型及算法的有效性和优越性.  相似文献   

8.
针对循环神经网络(recurrent neural networks,RNN)网络结构存在的长期依赖问题,门控循环单元(gated recurrent unit,GRU)神经网络作为RNN的一种变体被提出。在继承RNN对时间序列优秀记忆能力的前提下,GRU克服了时间序列的长期依赖问题。本文针对金融时间序列数据存在的依赖问题,将GRU扩展应用到金融时间序列预测,提出了基于差分运算与GRU神经网络相结合的金融时间序列预测模型。该模型能够处理金融时间序列数据的复杂特征,如非线性、非平稳性和序列相关性。通过对标准普尔(SP)500股票指数的调整后收盘价进行预测,实验结果表明,所提出的方案能够提高GRU神经网络的泛化能力和预测精度,并且与传统预测模型相比该模型对金融时间序列的预测拥有更好的预测效果和相对较低的计算开销。  相似文献   

9.
构建一种基于粒子群算法-支持向量机(PSO-SVM)的磁共振功能成像(fMRI)时间序列分类诊断模型,通过针对脑区多维时间序列数据的深层次分析实现病症患者和健康者的准确判断与区分,为面向fMRI时间序列数据的病症诊断和预测提供有效科学依据.该方法在以下4个方面不同于其他已有相关研究工作:(1)构建基于自回归模型的脑区多维时间序列数据特征表示;(2)构建基于支持向量机模型的脑区多维时间序列数据分类机制;(3)构建基于粒子群算法的分类学习参数寻优策略;(4)建立融合上述特征表示、优化分类与参数优选模式的fMRI时间序列数据分类诊断模型.通过以精神抑郁症作为实证分析的具体案例,所提出分类诊断模型已取得良好实验效果,展示出其有效性与合理性.  相似文献   

10.
金融时间序列预测中的神经网络方法   总被引:6,自引:0,他引:6  
概述了神经网络方法在金融时间序列预测应用中所面临的有关问题,给出了解决方法;针对有关模型和算法作了计算模拟与分析,得到了一些可供今后研究参考的经验结果;讨论了金融时间序列预测中主要的神经网络模型,如多层前馈网络、径向基函数网络以及支持向量机网络等.总结了关于模型改进的一些近期研究进展与结果,指出了神经网络用于金融时间序列预测的一些可能的方向.  相似文献   

11.
为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了一种半结构化文档数据流的快速频繁模式挖掘算法--FStreamT.该算法针对利用集合存储候选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有效地提高对候选频繁模式集合进行查找和更新的效率,同时利用频繁模式的单调性和枚举树的特点减小了维护负边界的搜索空间,从而提高了整个算法的效率.理论分析和实验结果表明,算法FStreamT与算法StreamT相比具有较高的效率,是有效可行的.  相似文献   

12.
频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据。本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在存储前按数据项的顺序进行调整,频繁模式有向无环图的构建遵循这个顺序并用序号来记录事务与数据项的包含关系,模式增长过程只需要增加有向边上的序号。通过逆向遍历带有相同序号的有向边,产生条件模式基,根据动态定义的阈值抽取条件模式基信息,一次扫描数据库得到频繁模式。实验结果表明,本文算法的执行效率优于FP-growth算法,且存储节点的数目明显减少。  相似文献   

13.
针对时间序列,研究和分析时序关联规则挖掘,提出时序关联规则数据挖掘的基于滑动窗口和时序树特殊结构的新的挖掘算法,并利用该算法挖掘超过给定支持数阈值频繁时序,为用户的决策支持及趋势预测提供支持,并通过实验验证算法的有效性和实用性。  相似文献   

14.
流数据频繁项挖掘是一项重要的研究课题,是其他流数据挖掘任务的基础。Lossy counting 算法是第一个近似的流数据频繁项挖掘的算法,并且具有空间和时间的高效性。详细分析该算法,尤其是它不能回答关于时间的查询的不足后,对其进行改进,提出了一个在多时间粒度上挖掘流数据频繁项的设想,加入时间维度。改进后的算法在时间倾斜窗口保存与合并频繁项,可以应用于各种对时间敏感的流数据查询和挖掘应用中。  相似文献   

15.
交通流量预测是智能交通系统的重要组成部分。本文以重庆市解放碑街区为研究区域进行交通流量预测分析,基于研究区域内出租车GPS轨迹数据处理获取时间间隔为5min、10min、15min的交通流量序列。同时为充分挖掘交通流量序列特征规律,减小序列非线性、非平稳性带来的影响,本文提出一种基于信号分解的预测模型GE-RL。通过一般线性模型(GLM)将原始序列分解成周期序列、趋势序列和残差,同时引入经验模态分解方法(EMD)对残差进一步分解以充分挖掘序列特征;模型预测方面,构建随机森林模型(RF)对周期序列和趋势序列进行预测,接着引入长短期记忆网络模型(LSTM)构建RF-LSTM残差模型对EMD分解的各分量进行预测,通过叠加各模型预测成果得到最终预测结果;同时为验证模型精度,设置对照模型进行比对。结果表明,所构建的GE-RL模型在预测精度上均高于对照模型,可以满足基于不同样本时间间隔的交通流量预测的需要。  相似文献   

16.
金融市场技术分析的统计学基础   总被引:1,自引:0,他引:1  
建立了金融市场技术分析的数学模型,奠定了金融市场技术分析的统计学基础。传统的技术分析来源于直觉和经验,其正确性也是各种文献争论的焦点。根据经济学原理,我们认为金融时间序列的趋势项应是一随机过程。于是,我们假定其样本路径是分段线性的,并利用传统技术分析关于价格模式的思想,把价格模式归结为若干不同趋势路径的组合,从而使金融预测问题转化成了特定的回归问题。我们还利用上海证券交易所的关于头肩顶的40组样本数据,对头肩顶价格模式进行了回归分析且给出了相应的分析结果,  相似文献   

17.
针对传统三次指数平滑法预测模型中平滑系数固定不变、难以跟踪时间序列随时间变化的因素、无法反应不同时间段历史数据对预测结果的影响等缺点,提出了一种改进的动态三次指数平滑法.该方法通过误差平方、最小原则和地毯式搜索算法来获得动态调整的平滑因子,对波动范围较大且呈非线性变化规律的数据有很强的适应性.将自适应动态三次指数平滑法与SARIMA模型、三次指数平滑法进行对比,由铁路旅客发送量的仿真实例分析结果可知,自适应动态三次指数平滑法能更好地适应时间序列的变化趋势,具有良好的预测精度.  相似文献   

18.
金融股票市场是一个极其复杂的演化系统,因此对股价波动进行准确预测是投资者理性规避投资风险的重要渠道。本文首先通过构建科学性较强的自回归移动平均与支持向量机(ARIMASVM)模型分析一维金融时序数据的线性成分,对我国股价波动进行样本内预测并与真实数据作比较,再利用改进的支持向量机(TGDSVM)模型基于金融面板时序数据处理线性预测后剩余的非线性成分信息。采用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对比例误差(MAPE)、回归指数(WIA)、百分标准误差(SEP)与Nash系数六个预测精度指标检验五只股票日收盘价的预测精度。仿真结果表明:改进的时间相关序列(ARIMA-TGD-SVM)股票价格混合预测模型可以很好的弥补传统支持向量机(SVM)模型对解决多分类问题存在困难和对大规模训练样本难以实施的不足,并有效解决其利用欧式距离表征时序数据内部真实相互关系不足的缺陷,能够为股市预测提供理论依据和实际应用奠定基础。  相似文献   

19.
针对齿轮箱计划外停机和意外故障导致的风电机组安全运行问题,提出了一种基于ARIMA模型的故障趋势预测方法;方法可以处理具有非线性和非平稳性特征的齿轮箱运行状态监测数据,用以时间序列的自相关分析为基础的模型预测状态监测时间序列数据的趋势变化;选择生产现场采集到的齿轮箱油泵出口压力SCADA数据和运行实例验证了方法的有效性,实验结果的拟合效果令人满意;研究结果表明方法能够适应齿轮箱运行状态监测数据随时间的变化特征,反映出一定的运行状态变化趋势,具有较好的预测精度和较大的应用范围,对风电机组其他部件的故障趋势预测具有一定的应用参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号