分类:
2010-06-05 15:08:35
一、自回归模型定义
以上介绍的回归模型是根据与其它变量之间的关系来预测一个变量的未来的变化,但是在时间序列的情况下,严格意义上的回归则是根据该变量自身过去的规律来建立预测模型,这就是自回归模型。自回归模型在动态数据处理中有着广泛的应用。
自回归模型的一个最简单的例子是物理中的单摆现象。设单摆在第个摆动周期中最大
摆幅为,在阻尼作用下,在第()个摆动周期中的最大摆幅将满足关系式
, (
其中 为阻尼系数。如果此单摆还受到外界环境的干扰,则在单摆的最大幅值上叠加一个新的随机变量,于是(
, (
上式称为一阶自回归模型。当式中满足时,为平稳的一阶自回归模型。将这些概念推广到高阶,有自回归模型
(
式中为模型变量,为模型的回归系数,为模型的随机误差,为模型阶数。
二、自回归模型参数的最小二乘估计
设有按时间顺序排列的样本观测值,阶自回归模型的误差方程为
……
,
记
,,,,
得
, (
的最小二乘解为
(
三、自回归模型阶数的确定
建立自回归模型,需要合理地确定其阶数,一般可先设定模型阶数在某个范围内,对此范围内各种阶数的模型进行参数估计,同时对参数的显著性进行检验,再利用定阶准则确定阶数,下面采用的§2-4的线性假设法来进行模型定阶。其原理是:
设有观测数据,先设阶数为,建立自回归模型,
(
再考虑模型,将
(
作为(
先对(
,再联合(
(
在§2-4线性假设法中已证明,在假设成立时,可作分布统计量为
选显著水平,以分子自由度1,分母自由度,查表得,如果,则表示不成立,。阶与阶两模型有显著差别,应采用阶,反之,则接受,表示阶与阶两模型并无显著差别,应采用阶。
例3-7 对某建筑物某个时间段定期进行了36次沉降观测,观测值列于下表:
表3-4 沉降观测数据
序数 高程 序数 高程 序数 高程 序数 高程 序数 高程 序数 高程 |
1 26.33 7 25.93 13 26.67 19 28.09 25 26.81 31 26.81 2 26.27 8 26.43 14 27.95 20 26.78 26 28.50 32 28.50 3 26.43 9 26.52 15 26.74 21 28.66 27 27.68 33 27.68 4 25.56 10 25.46 16 27.53 22 26.75 28 26.57 34 26.57 5 26.82 11 26.12 17 25.31 23 27.24 29 28.36 35 28.36 6 26.56 12 27.28 18 26.90 24 28.02 30 27.94 36 27.94 |
(1) 确定模型阶数
当 =1时, ,
求得:。
当 =2时, ,
求得:。
统计检验:原假设:。
统计量
取显著水平,以自由度1、34查分布表得
因为 , 故拒绝原假设,即认为一阶与二阶自回归模型有显著的差别。
当 =3时, ,
求得 。
统计检验:原假设:。
统计量
以自由度1、33查分布表得
因为 , 故拒绝原假设,认为二阶与三阶自回归模型有显著的差别。
当 =4时, ,
求得 。
统计检验:原假设:。
统计量
以自由度1、32查分布表得
因为 , 故接受原假设,应取模型阶数 。
(2)模型参数估计
误差方程
,
参数估计为
,
得自回归模型
,
四、自回归模型的预报
设阶自回归模型方程为
当回归系数已确定时,可根据方程进行预报。
第一步预报值为
第二步预报值为
一般,步预报值为
越大,预报准确性越差,故应尽可能小。
例3-8, 同例3-7。试预报第37次及38次的高程值。
解: ,