一.概述
时间序列数据是按照时间先后顺序记载的一组有序数据集,是以时间作为坐标轴的一组数据。其中最重要的特性就是数据之间的相互依赖的关系。
时间序列预测就是根据被预测事物过去和现在的观测值构建出依据时间变化的相应的时间序列模型,再借助某种规则来推测未来。
时间序列预测被广泛应用于各学科,社会学、统计学、经济学、数学、工程技术、医学、气象学、自然科学等都有其影子,此方法不在乎数据产生背景,任何可用时间序列表示的信息都可以使用时间序列分析理论进行预测,所以才会拥有如此广泛的应用场景。
而时间序列预测需要三个基本前提,即:
①数据是由某个对应系统产生,该系统存在一定规律性;
②数据过去或当前的相关关系及其变化规律在未来仍然起主导作用;
③系统的这种规律可以通过数据特性分析找到。
任何形式的事物发展必然有其内在规律,在系统中就表现为动态性和记忆性,时间序列具有共性,即历史数据中包含了产生该数据的系统留下了历史行为的完备信息,同时也具有某种共性,如短记忆性、周期性、混沌性等。
显然对于特性不同的序列数据,也要使用不同的方法进行预测,这样的预测才能称为行之有效。而依据系统统计特性和数据变化的规律,提取所需要的精确信息并且建立可以精确描述数据间动态相关关系的数学模型的过程,就是时间序列分析。
就时间序列分析而言,模型的设计一般分为六大步骤:数据分析,数据预处理,选定模型,模型阶次辨识,模型参数辨识,模型检验。
1.数据分析
要想进行预测,人们对数据本身就需要足够了解,而了解的手段就是数据分析,包括:白噪声检验,正态性检验,趋势性检验,周期性检验,平稳性检验,非线性检验,长记忆检验,混沌性检验等。
2.数据预处理
预处理方法包括:零均值化,数据标准化,去周期化,非平稳数据的平稳化等措施。
3.选定模型
经过先前的检验分析,根据数据特性主要分为线性时间序列,非线性时间序列,混沌时间序列等,其中,线性时间序列主要适用于自回归模型(AR)、滑动平均模型(MR)和自回归滑动平均混合模型(ARMA)等;非线性时间序列主要适用于自回归条件异方差模型(ARCH)、广义自回归条件异方差模型(GARCH)、双线性模型、门限自回归模型等;浑沌时间序列适用于Volterra模型、神经网络模型等。
4.模型阶次辨识
应用最广泛的方法是利用差分后序列的自相关函数和偏自相关函数,选择一个暂定模型,模型阶次辨识一般用FPE准则、AIC准则、BIC准则等,判断预测目标的发展过程与哪一个随机过程最为接近,给出模型阶数和参数的最佳估计。
5.模型参数辨识
估计模型中未知参数的值,可以使用的方法有:矩估计、最小二乘估计(LS估计)、最小方差估计(LMS估计)、最大似然估计(ML估计)、最大熵估计、递推最小二乘(RLS)法等。
6.模型检验
通过参数估计得到的模型,虽然按某种准则在选定的模型类中是最好的,但并不是一定能达到建模的目的的,还必须进行适应性检验。这是辨识过程中的重要一环,通过适用性检验的模型才是最终的模型。能够造成模型不适用的原因主要有三:模型类选择不当;实验数据误差过大或由于实验条件限制,数据的代表性太差;辨识算法存在问题(例如没有考虑必要的约束等)。模型是否适用与建模的目的紧密相关,所以很难得到统一的检验方法,所以需要根据问题的性质采用不同的方法。
Comments NOTHING