摘 要: | 将符号时间序列分析方法与K-NN(K-Nearest Neighbors)算法相结合,提出了一种基于符号时间序列直方图的高频金融波动整体分布的预测方法。首先将时间序列符号化得到符号时间序列,并以符号序列直方图表示符号序列的分布,引入符号直方图时间序列的概念,采用K-NN算法得到下一个周期符号序列直方图的预测。在K-NN算法中,针对符号序列直方图的特点,提出以欧几里得范数,χ2统计量和相对熵作为选择邻居时的符号直方图序列相似度的度量方法,利用系统自身的几何特性确定符号直方图序列的嵌入维数。以上证综指5分时的高频数据检验了本文方法的预测能力。结果表明,本文方法预测所得结果整体误差均在可以接受的范围内,预测所得的分布与真实分布均值相同,但是方差较小。
|