回归分析预测法-foreverdengwei-ChinaUnix博客

维博dengwei.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

foreverdengwei

博客访问： 97912
博文数量： 38
博客积分： 950
博客等级：准尉
技术积分： 235
用户组：普通用户
注册时间： 2011-03-01 10:17

文章分类

全部博文（38）

未分配的博文（38）

文章存档

2011年（38）

我的朋友

相关博文

回归分析预测法

分类： LINUX

2011-05-22 20:42:45

回归分析预测法

回归分析预测法(Regression Analysis Prediction Method)

目录[]

[]

什么是回归分析预测法？

　　回归分析预测法，是在分析市场现象自变量和因变量之间相关关系的基础上，建立变量之间的回归方程，并将回归方程作为预测模型，根据自变量在预测期的数量变化来预测因变量关系大多表现为相关关系，因此，回归分析预测法是一种重要的方法，当我们在对市场现象未来发展状况和水平进行预测时，如果能将影响市场预测对象的主要因素找到，并且能够取得其数量资料，就可以采用回归分析预测法进行预测。它是一种具体的、行之有效的、实用价值很高的常用市场预测方法。

[]

回归分析预测法的分类

　　回归分析预测法有多种类型。依据相关关系中自变量的个数不同分类，可分为和。在中，自变量只有一个，而在中，自变量有两个以上。依据自变量和因变量之间的相关关系不同，可分为和。

[]

回归分析预测法的步骤

　　1．根据预测目标，确定自变量和因变量

　　明确预测的具体目标，也就确定了因变量。如预测具体目标是下一年度的，那么销售量Y就是因变量。通过和查阅资料，寻找与预测目标的相关影响因素，即自变量，并从中选出主要的影响因素。

　　2．建立回归预测模型

　　依据自变量和因变量的历史统计资料进行计算，在此基础上建立回归分析方程，即回归分析预测模型。

　　3．进行

　　回归分析是对具有因果关系的影响因素（自变量）和预测对象（因变量）所进行的分析处理。只有当变量与因变量确实存在某种关系时，建立的回归方程才有意义。因此，作为自变量的因素与作为因变量的预测对象是否有关，相关程度如何，以及判断这种相关程度的把握性多大，就成为进行回归分析必须要解决的问题。进行相关分析，一般要求出相关关系，以的大小来判断自变量和因变量的相关的程度。

　　4．检验回归预测模型，计算预测误差

　　回归预测模型是否可用于实际预测，取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验，且预测误差较小，才能将回归方程作为预测模型进行预测。

　　5．计算并确定预测值

　　利用回归预测模型计算预测值，并对预测值进行综合分析，确定最后的预测值。

[]

应用回归预测法时应注意的问题

　　应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系，对这些变量应用回归预测法就会得出错误的结果。

　　正确应用回归分析预测时应注意：

　　①用定性分析判断现象之间的依存关系；

　　②避免回归预测的任意外推；

　　③应用合适的数据资料；

[]

回归分析预测法案例分析

[]

案例一:回归分析预测法预测新田公司销售

　　一、新田公司的发展现状

　　新田公司全称为新田摩托车制造有限公司，成立于1992年3月，当时的锡山市(那时还叫无锡县)有两个生产摩托车的乡镇企业：查桥镇的捷达摩托车厂和洛社镇的雅西摩托车厂。在9l、92年这两家厂可以说是如日中天，但这两家厂又各具特点：雅西摩托车厂完全是自主生产，除发动机外其余配件都由本厂生产；捷达摩托车厂则是装配型厂，配件由其他厂家生产，本厂只是组装(后来也发展成了连发动机都生产的综合型企业)。顾建新当时还只是一家村办企业的供销员，他就瞄准了摩托车行业的发展前景，于是想方设法和捷达厂取得了联系，从1992年3月起为捷达厂生产两种型号的减震器，厂名是无锡减震器厂，由此开始了企业发展的道路。

　　减震器厂自成立以后，随着捷达摩托车厂摩托车年产量的不断增长而得到了迅速发展。到了1994年6月，顾建新终于有了一个极好的机会：捷达摩托车厂的销售部门和捷达摩托车的销售商产生了予盾，因此捷达摩托车的销售商答应顾建新，若顾建新也能生产出和捷达差不多质量的摩托车，则他们会在相同条件下优先销售顾建新生产的摩托车。有了这个承诺，顾建新于94年lO月就成立了新田摩托车制造有限公司，开始生产新田牌摩托车。

　　新田公司成立以后，在顾总和匡建中总工程师的领导下，开始了艰苦的创业过程，经过六年多的奋斗，薪田公司终于从一个20多人的小厂发展成了如今的工人总数超过400人，日产摩托车超过200辆，年利润超过2000万的集团型企业，新田摩托车的配件包括发动机在内都由本企业自主生产。

　　新田公司如今已是一个，除公司本部(总装厂)外，还有减震器厂、发动机厂、塑件厂、车架车间、油箱车间、喷涂车间等独立部门，这些部门除满足新田公司所需配件外，还可以对外供应。1999年底，由于摩托车市场竞争的日趋激烈，新田公司的销售模式由代理制转向了派员销售制(由公司往各城市直接派出，负责各城市的销售工作)，以减少中间环节，确保公司产品在整个摩托车市场的。同时，由于销售模式的转变，也带来了生产模式的变化：以前是根据各地代理商的订货量来组织生产，现在则必需根据销售情况和对将来销售情况的预期来组织生产，这给企业的生产组织带来了极大的困难。

　　2.新田公司销售的历史数据及要解决的问题新田公司自94年成立以来取得了飞跃性的发展，这可以从新田公司历年的销售数据中看出来。下面所附的表就是新田公司主导产品的销售数据。（参见下面表1.2.3.4）

　　从表中的数据可以看出，新田公司的生产销售形势还是比较好的，从总体上来说是处于上升趋势，但某些车型的销售也有下降趋势。同时，还有一些问题从销售数据上是看不出来的。自从公司实行派员销售制以来，由于销售的预期值估计不准，常常出现工人加班加点仍赶不上交货对间的情况和工人上了班却无事可做的情况。顾建新总经理和其他公司领导也都发现了这个问题，也找到了原因所在，但由于技术上的原因而无法解决。因此，新田公司目前急需解决的问题就是如何来进行准确可行的销售预测，以保证公司的正常运行。

　　新田公司2001年第一季度销售数据

XT150-T	XT150-H	XT125-C	XT125-W	XT100-W	XT100-G	XT50-K	总数
665	897	1660	1500	1529	1608	933	10372

　　新田公司2001年第二季度销售数据

XT150-T	XT150-H	XT125-C	XT125-W	XT100-W	XT100-G	XT50-K	总数
668	350	1808	1581	1542	1503	1603	9862

　　新田公司XT50-M在无锡的销售数据

	第一季度	第二季度	第三季度	第四季度
1996年	150	170	172	180
1997年	201	230	233	245
1998年	258	292	284	298
1999年	283	255	209	199
2000年	175	160	122	90

　　二、回归分析预测法分析

　　回归分析预测法是通过研究分析一个应变量对一个或多个自变量的依赖关系，从而通过自变量的已知或设定值来估计和预测应变量均值的一种预测方法。

　　回归分析预测法又可分成线性回归分析法、非线性回归分析法、虚拟变量回归预测法三种。这三种预测方法在新田公司销售预测中都可以运用。

　　(一)线性回归分析法的运用

　　线性回归预测法是指一个或一个以上自变量和应变量之间具有线性关系(一个自变量时为一元线性回归，一个以上自变量时为多元线性回归)，配合线性回归模型，根据自变量的变动来预测应变量平均发展趋势的方法。

　　线性回归预测法在销售预测中用得比较多，根据新田公司销售数据的散点圈分析，作者发现新田公司的XTl50～T、XTl25～C XTl25一W三种车型的销售可以用一元线性回归预测法进行预测，由于销售数据是时间性序列，多元线性回归在此不适用。

　　1.预测模型

　　由于新田公司销售预测中只用到一元线性回归预测法，而一元线性回归又是一种广泛应用并且比较简单的预测方法，因此，只需对一元线性回归模型作简单介绍。

　　设X为自变量，Y为应变量，Y与X之间存在某种线性关系，一元线性回归模型为：

　　 $y i = a + b x i + ε i$ 　　 $i=1,2,.ldots,n$ (1)

　　式中 $ε$ 为各种随机因素y的影响总和， $ε ? (0,σ 2)$ ；y-N(a+bx, $σ 2$ )。则可设 $.widehat{y}i=a+b x_i$ 　　(2)

　　对此，可以通过来估计模型的回归系数。根据最小平方原理，必须符合以下条件：

　　 $.sum(yi-.widehat{y}i)^2$ =最小值　　(3)

　　 $.sum(yi-.widehat{y}i)=0$ 　　(4)

　　根据最小二乘法要求，记 $Q=.sum(yi-.widehat{y}i)^2=.sum(yi-a-b x_i)^2$

　　根据极值原理，为使Q具有最小值，可分别对a、b求偏导数，并令其等于零，即

　　 $.frac{.partial Q}{.partial a}=-2.sum(yi-a-b x_i)=0$

　　 $.frac{.partial Q}{.partial b}=-2.sum(yi-a-b x_i)x_i=0$

　　整理的：

　　 $n a+b.sum x_i=.sum y_i$ 　　　　 $a .sum x_i+b .sum {x_i}^2=.sum x_i y_i$

　　对上两式联立求解，即可得到回归系数的估计值：

　　 $.widehat{b}=.frac{n.sum x_i y_i-.sum x_i.sum yi}{n.sum x_i^2-(.sum x_i)^2}$ 　　(5)

　　 $.widehat{a}=.frac{.sum y_i}{n}-.widehat{b}.frac{.sum x_i}{n}$ 　　(6)

　　相关系数R可根据最小二乘原理及平均数的数学性质得到：

　　 $R=.frac{n.sum x_i y_i-.sum x_i.sum y_i}{.sqrt{n.sum x^2_i-(.sum x_i)^2}.sqrt{n.sum y^2_i-(.sum y_i)^2}}$ 　　(7)

　　相关系数R的绝对值的大小表示相关程度的高低。

　　①当R=0时，说明是，所求回归系数无效。

　　②当 $.left|R.right|=1$ 时，说明是，自变量X与应变量Y之间的关系为函数系。

　　⑧当 $o<.left|R.right|<1$ 时，说明是部分相关，渊值越大相关程度越高。

　　另外，估计标准差 $S y$ ，和预测区间公式参见《预测与决策技术》。

　　估计标准差： $S_y=.sqrt{.frac{.sum y^2-.widehat{a}.sum y-.widehat{b}.sum xy}{n-2}}$ 　　(8)

　　预测区间： $.widehat{y}_0.mp i_{a/2}(n-2)S_y.sqrt{1+.frac{1}{n}+.frac{n(x_o-.overline{x})^2}{n.sum x^2-(.sum x)^2}}$ 　　(9)

　　在上式中，a为显著水平，n-2为自由度， $.widehat{y}_o$ 为y在 $x o$ 的估计值。

　　2.预测计算

　　根据上面介绍的预测模型，下面就先计算XTl50-T在2001年第一季度的预测销售量。

　　根据XTl50-T的销售数据有：(X为时间，Y为销售量)。

　　n=16； $.sum x_i=136$ ； $.sum y_i=5313$ ； $.sum x_i y_i=57438$ ； $.sum x^2_i=1496$ ； $.sum y^2_i=2208979$

　　根据公式(5)、(6)、(7)、(8)、(9)有：

　　 $.widehat{b}=.frac{n.sum x_i y_i-.sum x_i .sum y_i}{n.sum x^2_i-(.sum x_i)^2}=36.11$

　　 $.widehat{a}=.frac{.sum y_i}{n}-.widehat{b}.frac{.sum x_i}{n}=25.13$

　　 $.widehat{y_i}=a+bx_i=639$ 　　 $(x i = 17)$

　　 $R=.frac{n.sum x_i y_i-.sum x_i .sum y_i}{.sqrt {n.sum x^2_i-(.sum x_i)^2}.sqrt{n.sum y^2_i-(.sum y_i)^2}}=0.998$

　　 $S_y=.sqrt{.frac{{.sum y^2-.widehat{a}.sum y-.widehat{b}.sum xy}}{{n-2}}}=9.92$

　　 $.widehat{y}_0.mp i_{a/2}(n-2)S_y.sqrt{1+.frac{1}{n}+.frac{n(x_o-.overline{x})^2}{n.sum x^2-(.sum x)^2}}=639.mp27$

　　 $i 0.025(14) = 2.145$

　　以上是XT150-T的销售预测计算，同理可计算XT125-C、XT150-W的预测结果，这里不再给出计算过程而直接写出结果：

　　①XTl25-C的预测结果：

　　 $.widehat{b}=73.9$ 　； $.widehat{a}=-17.2$ 　； $.widehat{y}_i=1682$ 　；R=0.99　； $S y = 16.56$

　　预测区间为：(1641，1723) $(i 0.025(20) = 2.086)$

　　②XTl25-W的预测结果：

　　 $.widehat{b}=31.9$ 　； $.widehat{a}=789$ 　； $.widehat{y}_i=1523$ 　；R=0.99　；

　　 $S y = 29.35$

　　预测区间为：(1450，1596) $(i 0.025(20) = 2.086)$

　　3.预测结果分析

　　从上面的预测结果来看，有一点非常奇怪，那就是三种车型的预测中，相关系数R都非常接近于“1”，也就是说，这三种车型的销售量和时间基本上是线性关系，相关程度非常之高。对于这个结果，作者感到很惊讶，为此，特意找到了新田公司，询问这三种车型的销售状况，这才找到了原因。原来，这三种车型是新田公司的形象产品，基本上没有利润，和其他品牌的同类车型相比具有较大的的竞争力，因而这三种车型的销售情况一直很好。公司为了其形象，对这三种车型采取计划供应的方式，按逐年递增的方式供应市场，以使这三种车型一直保持供不应求。由于以上原因，相关系数接近于“1”也就不奇怪了。

　　另外，作者把通过公式 $.widehat{y}_i=a+bx_i$ 计算得到的各期销售数和实际销售量比较发现，这三种车型有一个共同特点，那就是：第一季度的预测值一般要比实际值大，而第二季度则相反。第三、四季度则预测值和实际值相近。仔细分析原因，可能是因为这三种车型价格都比较高，受年终分配影响，第一季度销量自然较大，随后的第二季度销量就自然偏小。

　　对比2001年第一季度的预测值和实际值，以及上面说到的两个特点可以发现，XT150-T的预测结果比较正常，而XTl25-C、XTl25-W的预测值却出现了反而比实际值大的反常情况。通过各期预测值和实际值比较发现，原来XTl25-W从99年第二季度开始就出现预测值大于实际值的情况，根据作者对摩托车市场的了解，认为可能是因为这种车型的销路已经出现问题，不能保持供不应求了。

　　XTl25-C可能也是这种情况，只不过该车型的滞销出现得稍稍晚而已。通过和新田公司销售部门的联系发现，作者的判断是正确的。

　　(二)非线性回归预测法的运用

　　非线性回归预测法是指自变量与因变量之间的关系不是线性的，而是某种非线性关系时的回归预测法。非线性回归预测法的回归模型常见的有以下几种：双曲线模型、二次曲线模型、、三角函数模型、、幂函数模型、罗吉斯曲线模型、修正指数增长模型。

　　通过对新田公司销售数据的散点图分析发现，XT100-W和XT50-K这两种车型的图形接近于抛物线形状，因此可用非线性回归的二次曲线模型来预测。

　　1.预测模型

　　非线性回归二次曲线模型为： $y_i=.beta_1+.beta_2x_i+.beta_3x^2_i+.epsilon_i$ 　　(10)

　　令 $x^2_i=x^.prime_i$ ,则模型变化为： $y_i=.beta_1+.beta_2x_i+.beta_3x^.prime_i+.epsilon_i$ 　　(11)

　　上式的矩阵形式为： $Y = X B + ε$ 　　(12)

　　用最小二乘法作参数估计，可设观察值与模型估计值的残差为E，则

　　 $E=Y-.widehat{Y}$ ， $.widehat{Y}=XB$

　　根据小二乘法要求有：

　　 $E^.prime E=(Y-.widehat{Y})^.prime(Y-.widehat{Y})$ =最小值，　　(13)

　　即： $E^.prime E=(Y-XB)^.prime(Y-XB)$ =最小值

　　由极值原理，根据矩阵求导法，对B求导，并令其等于零，得：

　　 $.frac{.partial E^.prime E}{.partial B}=.frac{.partial(Y-XB)^.prime(Y-XB)}{.partial B}=.frac{.partial(Y^.prime Y-2Y^.prime X B+B^.prime X^.prime XB)}{.partial B}$

　　 $=-2(Y^.prime X)^.prime+2(X^.prime X)B=0$

　　整理得回归系数向量B的估计值为： $.widehat{B}=(X^.prime X)^{-1}(X^.prime Y)$ 　　(14)

　　二次曲线回归中最常用的检验是R检验和F检验，公式如下：

　　 $R=.sqrt{1-.frac{.sum(y_i-.widehat{y})^2}{.sum(y_i-.overline{y})^2}}$ 　　(15)

　　 $F=.frac{R^2}{1-R^2}(n-3)/2$ 　　(16)

　　在实际工作中，R的计算可用以下简捷公式：

　　 $R=.sqrt{1-.frac{.sum y^2_i-.widehat{.beta}_1.sum y_i-.widehat{.beta}_2.sum x_i y_i-.widehat{.beta}_3.sum x^.prime_i y_i}{.sum y^2_i-n.overline{y}^2}}$ 　　(17)

　　估计标准误差为：

　　 $S=.sqrt {.frac{.sum(y_i-.widehat{y}_i)^2}{n-3}}$ 　　(18)

　　预测区间为：

　　 $.widehat{y}_o.mp i_{a/2}(n-3)$ ·S (n<30)　　(19)

　　 $.widehat{y}_o.mp Z_{a/2}$ ·S (n>30)　　(20)

　　2.预测计算

　　根据上面介绍的预测模型，下面就先进行XT100-W的预测计算。

　　根据XTl00-W的销售数据及(11)、(14)、(17)、(18)、(19)有( $x i$ 为时间变量)：

　　 $X^.prime X=.begin{bmatrix}1&1&.ldots&1..1&2&.ldots&24..1&4&.ldots&576.end{bmatrix} .begin{bmatrix}1&1&1..1&2&4..1&24&576.end{bmatrix}=.begin{bmatrix}24&300&4900..300&4900&90000..4900&90000&1763020.end{bmatrix}$

　　 $X^.prime Y=.begin{bmatrix}36321..526630..8913322.end{bmatrix}$ 。

　　 $.widehat{B}=(X^.prime X)^{-1}(X^.prime Y)=.begin{bmatrix}-60.66..244.23..-7.25.end{bmatrix}$

　　 $.widehat{y}_i=.widehat{.beta}_1+.widehat{.beta}_2x_i+.widehat{.beta}_3x^2_i=1514$ 　(x_i=25)

　　 $.sum y^2_i=61953607$ ； $.sum y_i=36321$ ； $.sum x_i y_i=526630$ ； $.sum x_i^.prime y_i=8913322$

　　 $R=.sqrt{1-.frac{.sum y^2_i-.widehat{.beta}_1.sum y_i-.widehat{.beta}_2.sum x_i y_i-.widehat{.beta}_3.sum x^.prime_i y_i}{.sum y^2_i-n.overline{y}{2}}}=0.977$

　　 $S=.sqrt{.frac{.sum(y_i-.widehat{y}_i)^2}{n-3}}=67.8$

　　 $.widehat{y}_o.mp i_{a/2}$ (n-3)· $S=1514.mp141$ 　　 $(i 0.025(21) = 2.080)$

　　下面再计算XT50-K的预测结果。

　　根据XT50-K的销售数据及公式(11) 、(14)、(17)、(18)、(19)有：

　　 $(X^.prime X)^{-1}=.begin{bmatrix}0.445158103&-0.072628458&0.002470356..-0.072628458&0.015121618&-0.000570082..0.002470356&-0.000570082&0.000022803.end{bmatrix}$

　　 $(X^.prime Y).begin{bmatrix}32089..451328..7439514.end{bmatrix}$

　　 $.widehat(X^.prime X)^{-1}(X^.prime Y)=.begin{bmatrix}-116.33..253.10..-8.38.end{bmatrix}$

　　 $.widehat{y}_i=.widehat{.beta}_1+.widehat{.beta}_2x_i+.widehat{.beta}_3x^2_i=974(x_i=25)$

　　 $.sum y^2_i=48243681$ ； $.sum y_i=32089$ ； $.sum x_iy_i=451328$ ； $.sum x^.prime y_i=7439514$

　　 $R=.sqrt{1-.frac{.sum y^2_i-.widehat{.beta}_1.sum y^2_i-.widehat{.beta}_2.sum x_i y_i-.widehat{.beta}_3.sum x^.prime_i y_i}{.sum y^2_i-n.widehat{y}^{2}}}=0.992$

　　 $.widehat{y}_0 .mp t_{.frac{a}{2}}(n-3).cdot S=1514.mp 141$ 　　( $t 0.025(21) = 2.080$ )

　　下面再计算XT50—K的预测结果。

　　根据XT50---K的销售数据及公式(11)、(14)、(17)、(18)、(19)有：

　　 $X^.prime X=.begin{pmatrix} 1 & 1 & .cdots & 1 .. 1 & 2 & .cdots & 24 .. 1 & 4 & .cdots & 576 .end{pmatrix}.begin{pmatrix} 1 & 1 & 1 .. 1 & 2 & 4 .. .vdots & .vdots & .vdots .. 1 & 24 & 576 .end{pmatrix}=.begin{pmatrix} 24 & 3300 & 4900 .. 300 & 4900 & 90000 .. 4900 & 90000 & 1763020 .end{pmatrix}$

　　 $(X^.prime X)^{-1}=.begin{pmatrix} 0.445158103 & -0.072628458 & 0.002470356 .. -0.072628458 & 0.015121618 & -0.000570082 .. 0.002470356 & -0.000570082 & 0.000022803 .end{pmatrix}$

　　 $X^.prime Y=.begin{pmatrix} 32089 .. 451328 .. 7439514 .end{pmatrix}$ 　　 $.widehat{B}=(X^.prime X)^{-1}(X^.prime Y)=.begin{pmatrix} -116.33 .. 253.10 ..-8.38 .end{pmatrix}$

　　 $.widehat{y}_i=.widehat{.beta}_1+.widehat{.beta}_2 x_i+.widehat{.beta}_3 x_i^2=974$ 　　( $x i = 25$ )

　　 $.sum y_i^2=48243681$ ; $.sum y_i=32089$ ; $.sum x_i y_i=451328$ ; $.sum x_i^.prime y_i=7439514$

　　 $R=.sqrt{1-.frac{.sum y_i^2-.widehat{.beta}_1.sum y_i-.widehat{.beta}_2.sum x_i y_i-.widehat{.beta}_3.sum x_i^.prime y_i}{.sum y_i^2-n.overline{y}^2}}=0.992$

　　 $S=.sqrt{.frac{.sum(y_i-.widehat{y}_i)^2}{n-3}}=56.75$

　　 $.widehat{y}_0.mp t_{.frac{a}{2}}(n-3).cdot S=974 .mp 118$ 　　 $t 0.025(21) = 2.080$

　　3.预测结果分析

　　从2001年第一季度的预测结果和实际值的比较来看，预测还算是可行的，XTl00—W和XT50—K的实际销售量均在预测范围之内，回归系数也都接近于1，说明这两种车型选取非线性回归的二次曲线模型还是比较合适的。但是，还应该看到，两种车型的预测结果中估计标准差S都比较大，说明回归曲线和实际销售数据的拟合情况并不太好，而S数值的偏大同时也带来了预测范围较大的后果。因此，预测精度较差。

　　当然了，实际工作中不可能会有真正符合某条曲线的数据存在，只能是从散点图来看大致符合某种曲线，就用该种曲线来进行拟合，以求大致的预测结果。因此，对于XTl00—W和XT50—K的预测还是可行的。

　　再进一步考虑，XTl00—W的预测值比实际值大了66，说明实际下降趋势比预测的要小，而XT50—K的情况则刚好相反。如果排除偶然因素的话，有可能XTlOO—w销售量的下降趋势在减缓，而XT50—K则相反，下降趋势在加剧。联系实际情况，作者认为是50车型的销量因竞争的日益加剧和政策的影响而加速下滑，而100车型则可能是由于公司的努力而减低了销量下降的速度。作者的这个想法在后来和新田公司总工程师匡建中的交流中得到了验证。

　　(三)虚拟变量回归预测法的运用

　　在回归模型分析中，有时还要考虑诸如性别、文化程度、宗教、战争、灾难、季节以及政府经济政策变化等品质变量的影响。这时，可在建立回归模型时将品质变量引入线性回归模型中，这种回归预测法就是虚拟变量回归预测法。

　　常见的带虚拟变量的回归模型有以下三种形式：

　　(1)反映政府政策变化或某种因素发生重大变异的跳跃、间断式模型。

　　(2)具有转折点的系统趋势变化模型。

　　(3)含有多个虚拟变量的线性回归模型。

　　虚拟变量回归预测法的适用性一般在散点图上明确看出。在表(1.1)中的数据都不适用。不过，作者发现新田公司的XT50—M在无锡的销售倒是适合用具有转折点的系统趋势变化模型来进行预测。

　　1.预测模型

　　由于只有XT50—M在无锡的销售适合用具有转折点的系统趋势变化模型来进行预测(见是表4)下面仅介绍具有转折点的系统趋势变化模型。

　　具有转折点的系统趋势变化模型为：

　　 $y i = β1 + β2 x i + β3(x i ? x 0) D i + ε i$ 　　(21)

　　式中 $D i$ 为虚拟变量， $D i$ 的取值为 $D_i=.begin{cases} 0 & i<i_o .. 1 & i.ge i_o .end{cases}$

　　 $i o$ 为发生转折点的时间， $x o$ 为 $i o$ 时间 $x i$ 的观察值。(21)可变形为：

　　 $y_i=.begin{cases} .beta_1+.beta_2 x_i+.epsilon_i & i<i_o ..(.beta_1-.beta_3 x_o)+(.beta_2+.beta_3)x_i+.epsilon_i & i.ge i_o .end{cases}$

　　根据(21)，可令 $(x_i-x_o)D_i=x^.prime_i$ ,，则该虚拟变量回归转化为，可用的计算方法计算。

　　2)预测计算

　　经过对散点图观察发现，1998年第四季度为转折点，即 $i 0 = 12$ ，由表(4)的数据及(14)、(17)、(18)、(19)、(21)可得：

　　 $X^.prime=.begin{pmatrix} 1 & 1 & .cdots & 1 & 1 & 1 & 1 & 1 .. 1 & 2 &.cdots & 12 & 13 & 14 & .cdots & 20 .. 0 & 0 & .cdots & 0 & 1 & 2 & .cdots &8 .end{pmatrix}$

　　 $X^.prime X=.begin{pmatrix} 20 & 210 & 36 .. 210 & 2870 & 636 .. 36 & 636 & 204 .end{pmatrix}$ 　　 $X^{.prime} Y=.begin{pmatrix} 4169 .. 42815 ..5625 .end{pmatrix}$

　　 $(X^.prime X)^{-1}=.begin{pmatrix} 0.34799 & -0.03835 & 0.05814 .. -0.03835 & 0.00535 & -0.00992 .. 0.05814 & -0.00992 & 0.02557 .end{pmatrix}$

　　 $.widehat{B}=(X^.prime X)^{-1}(X^.prime Y)=.begin{pmatrix} 135.85 .. 13.38 .. -38.51 .end{pmatrix}$

　　 $.widehat{y}_i = .widehat{.beta}_1+.widehat{.beta}_2 x_i+.widehat{.beta}_3(x_i-x_0)D_1=70$ 　　 $x i = 21$

　　 $.sum y_i^2=929653$ ； $.sum y_i=4169$ ； $.sum x_i y_i=42815$ ； $.sum x_i^.prime y_i=5625$

　　 $R=.sqrt{1-.frac{.sum y_i^2-.widehat{.beta}_1 .sum y_i-.widehat{.beta}_2.sum x_i y_i-.widehat{.beta}_3 .sum x_i^.prime y_i}{.sum y_i^2-n.overline{y}^2}}=0.94$

　　 $S=.sqrt{.frac{.sum(y_i-.widehat{y}_i)^2}{n-2}}=7.58$

　　 $.widehat{y}_0.mp t_{.frac{a}{2}}(n-2).cdot S=70.mp 16$ 　　( $t 0.025(18) = 2.101$ )

　　3.预测结果分析

　　新田公司的XT50—M2001年第一季度在无锡的实际销售量为55辆，和预测结果相比，可以说还在预测范围内，说明该车型在无锡的销售用虚拟变量回归预测法预测还是比较成功的。而之所以会在98年第四季度出现转折点，作者还是了解的，原因就在于98年第四季度无锡市公布了50车型不允许上助力车牌照的规定，从而引起了50车型在无锡的销售量逐步减少。当然了，这种情况销售预测中出现得不多，因此使用也不是很广。

　　三、回归分析法总结

　　回归分析预测法是一类比较经典，也比较实用的预测方法。正是由于它经典，因此也就成熟，再加上比较容易理解，运用也就比较广泛。相比之下，其中的线性回归预测法和非线性回归预测法的运用更广些。在实际使用过程中，如果在选择具体的方法和模型时能对数据作较为详细的分析，对散点图的观察分析也能仔细一点的话，预测结果也就会比较令人满意的。当然了回归分析最大的特点就是在偶然中发现必然，而实际情况却常常是千变万化的，有时偶然因素的影响也会超过必然，这时预测结果也就不能很如意，这就要求在预测工作中不能机械，要会灵活运用，要注意了解会影响预测结果的偶然情况，以便对预测结果进行适当修正，这样才能使预测结果更接近实际，也才能使预测能更好地为经济建设服务。从新田公司的回归分析预测结果来看，用线性回归预测法来预测XTl50-T、XTl25—C和XTl25一W都得到了比较满意的结果，而且各项指标也比较好，用虚拟变量回归预测法预测XT50—M也得到了满意的结果。因此可以基本上确定，用上述的预测方法来预测新田公司的这几种车型是可行的。(参见下面二图)。

[]

参考文献

钱晓星.新田公司摩托车销售预测研究[D].2002

阅读(1150) | 评论(0) | 转发(0) |

上一篇：Android 的消息队列模型

下一篇：一元线性回归预测法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6