计量经济经典案例分析1

案例1:用回归模型预测木材剩余物(一元线性回归)

伊春林区位于黑龙江省东北部。全区有森林面积2189732公顷,木材蓄积量为23246.02万m 3。森林覆盖率为62.5%,是我国主要的木材工业基地之一。1999年伊春林区木材采伐量为532万m 3。按此速度44年之后,1999年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规划与方式,保护森林生态环境。为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。下面,利用简单线性回归模型预测林区每年的木材剩余物。显然引起木材剩余物变化的关键因素是年木材采伐量。

给出伊春林区16个林业局1999年木材剩余物和年木材采伐量数据如表2.1。散点图见图2.14。观测点近似服从线性关系。建立一元线性回归模型如下:

y t = β0 + β1 x t + u t

表2.1 年剩余物y t 和年木材采伐量x t 数据

林业局名 乌伊岭 东风 新青 红星 五营 上甘岭 友好 翠峦 乌马河 美溪 大丰 南岔 带岭 朗乡 桃山 双丰 合计

30

y

年木材剩余物y (万m 3) 年木材采伐量x (万m 3) t t

26.13

23.49 21.97 11.53 7.18 6.80 18.43 11.69 6.80 9.69 7.99 12.15 6.80 17.20 9.50 5.52 202.87

61.4 48.3 51.8 35.9 17.8 17.0 55.0 32.7 17.0 27.3 21.5 35.5 17.0 50.0 30.0 13.8 532.00

25

20

15

10

x

20

30

40

50

60

70

510

图2.14 年剩余物y t 和年木材采伐量x t 散点图

图2.15 Eviews 输出结果

Eviews 估计结果见图2.15。建立Eviews 数据文件的方法见附录1。在已建立Eviews 数据文件的基础上,进行OLS 估计的操作步骤如下:打开工作文件,从主菜单上点击Quick 键,选Estimate Equation 功能。在出现的对话框中输入y c x。点击Ok 键。立即会得到如图2.15所示的结果。

下面分析Eviews 输出结果。先看图2.15的最上部分。LS 表示本次回归是最小二乘回归。被解释变量是y t 。本次估计用了16对样本观测值。输出格式的中间部分给出5列。第

ˆ和βˆ)1列给出截距项(C )和解释变量x t 。第2列给出相应项的回归参数估计值(β。第

1

ˆ), s(βˆ) )3列给出相应回归参数的样本标准差(s(β01。第4列给出相应t 值。第5列给出t

统计量取值大于用样本计算的t 值(绝对值)的概率值。以t = 12.11266为例,相应概率0.0000表示统计量t 取值(绝对值)大于12.1的概率是一个比万分之一还小的数。换句话说,若给定检验水平为0.05,则临界值为t 0.05 (14) = 2.15。t = 12.1落在了H 0的拒绝域,所以结论是β1不为零。输出格式的最下部分给出了评价估计的回归函数的若干个统计量的值。依纵向顺序,这些统计量依次是可决系数R 2、调整的可决系数2(第3章介绍)、回归函数的标准差(s.e. ,即均方误差的算术根σˆ)、残差平方和、对数极大似然函数值(第10章介绍)、DW 统计量的值(第6章介绍)、被解释变量的平均数()、被解释变量的标准差(s (y t ) )、赤池(Akaike )信息准则(是一个选择变量最优滞后期的统计量)、施瓦茨(Schwatz )准则(是一个选择变量最优滞后期的统计量)、F 统计量(第3章介绍)的值以及F 统计量取值大于该值的概率。

根据Eviews 输出结果(图2.15),写出OLS 估计式如下:

ˆt = -0.7629 + 0.4043 x t (2.64) y

(-0.6) (12.1) R = 0.91, s. e. = 2.04

2

ˆt 216-2) 。其中括号内数字是相应t 统计量的值。s.e . 是回归函数的标准误差,即σˆ=∑u

R 2是可决系数。R 2 = 0.91说明上式的拟合情况较好。y t 变差的91%由变量x t 解释。检验回

归系数显著性的原假设和备择假设是(给定α = 0.05)

H 0:β1 = 0; H 1:β1 ≠ 0

图2.16 残差图

因为t = 12.1 > t 0.05 (14) = 2.15,所以检验结果是拒绝β1 = 0,即认为年木材剩余物和年木材采伐量之间存在回归关系。上述模型的经济解释是,对于伊春林区每采伐1 m 3木材,将平均产生0.4 m3的剩余物。

ˆt ,图2.16给出相应的残差图。Actual 表示y t 的实际观测值,Fitted 表示y t 的拟合值y

ˆt 。Residual 表示残差u 残差图中的两条虚线与中心线的距离表示残差的一个标准差,即s.e . 。通过残差图可以看到,大部分残差值都落在了正、负一个标准差之内。

估计β1的置信区间。由

t = P {

ˆ-β≤ t0.05 (14) s (βˆ) β111

ˆ-ββ11s (βˆ

1

≤ t0.05 (14) } = 0.95

)

β1的置信区间是

ˆ- t 0.05 (14) s (βˆ) , βˆ+ t 0.05 (14) s (βˆ) ] [β1111

[0.4043 - 2.15 ⨯ 0.0334, 0.4043 + 2.15 ⨯ 0.0334]

[0.3325, 0.4761] (2.65)

以95%的置信度认为,β1的真值范围应在[0.3325, 0.4761 ]范围中。 下面求y t 的点预测和置信区间预测。假设乌伊岭林业局2000年计划采伐木材20万m 3,求木材剩余物的点预测值。

ˆ2000 = - 0.7629 + 0.4043 x 2000 y

= -0.7629 + 0.4043 ⨯ 20 = 7.3231万m 3 (2.66)

ˆs (y

2

ˆ2(2000) = σ

(x F -) 21

+ ) 2T (x -) ∑

1(20-33. 25) 2

= 4.1453 (+) = 0.4546

3722. 260616

因为

ˆ2000) =0. 4546= 0.6742 s (y

ˆ+βˆx 2000 ) = β0 + β1 x 2000 = E(y 2000) ˆ2000) = E(βE (y 01

t =

ˆ2000-E (y 2000) y

~ t (T -2)

ˆ2000) s (y

则置信度为0.95的2000年平均木材剩余物E(y 2000) 的置信区间是

ˆy

2000 ± t0.05 (14) s (

ˆy 2000) = 7.3231 ± 2.15 ⨯ 0.6742

= 5.8736, 8.7726 (2.67)

从而得出预测结果,2000年若采伐木材20万m 3,产生木材剩余物的点估计值是7.3231万m 3。平均木材剩余物产出量的置信区间估计是在 [5.8736, 8.7726] 万m 3之间。从而为恰当安排2000年木材剩余物的加工生产提供依据。

案例2:《全国味精需求量的计量经济模型》(多元线性模型及变量的筛选)

(见《预测》1987年第2期)

1.依据经济理论选择影响味精需求量变化的因素

依据经济理论一种商品的需求量主要取决于四个因素,即①商品价格,②代用品价格,③消费者收入水平,④消费者偏好。模型为:

商品需求量 = f (商品价格,代用品价格,收入水平,消费者偏好)

对于特定商品味精,当建立模型时要对上述四个因素能否作为重要解释变量逐一鉴别。

商品价格:味精是一种生活常用品,当时又是一种价格较高的调味品。初步判断价格会对需求量产生影响。所以确定价格作为一个重要解释变量。

代用品价格:味精是一种独特的调味品,目前尚没有替代商品。所以不考虑代用品价格这一因素。

消费者收入:显然消费者收入应该是一个较重要的解释变量。 偏好:由于因偏好不食味精或大量食用味精的情形很少见,所以每人用量只会在小范围内波动,所以不把偏好作为重要解释变量,而归并入随机误差项。

分析结果,针对味精需求量只考虑两个重要解释变量,商品价格和消费者收入水平。 味精需求量 = f (商品价格,收入水平)

2.选择恰当的变量(既要考虑代表性,也要考虑可能性)

用销售量代替需求量。因需求量不易度量,味精是自由销售商品,不存在囤积现象,所以销售量可较好地代表需求量。味精商品价格即销售价格。

用人均消费水平代替收入水平。因为①消费水平与味精销售量关系更密切。②消费水平数据在统计年鉴上便于查找(收入水平的资料不全)。 味精销售量 = f (销售价格,人均消费水平)

用平均价格作为销售价格的代表变量。不同地区和不同品牌的味精价格是不一样的,应取平均价格(加权平均最好)。

取不变价格的人均消费水平:消费水平都是用当年价格计算的,应用物价指数进行修正。

味精销售量 = f (平均销售价格,不变价格的消费水平)

3. 收集样本数据(抽样调查,引用数据)

从中国统计年鉴和有关部门收集样本数据 (1972-1982, T = 11)。定义销售量为sale (吨),平均销售价格为price (元 / 公斤),不变价格的消费水平为 level (元)。相关系数表如下:

味精销售量(sale)

平均销售价格(price)

不变价格的消费水平(level)

-0.3671 0.9771

4. 确定模型形式并估计参数

sale = -144680.9 + 6313.4 price + 690.4 level (1)

(-3.92) (2.17) (15.32) R 2 = 0.97, DW = 1.8, t 0.05 (8) = 2.3

回归系数6313.4无显著性(sale 与price 应该是负相关,回归系数估计值却为正,可见该估计值不可信)。剔除不显著变量price ,再次回归, sale = -65373.6 + 642.4 level (2)

(-10.32) (13.8) R 2 = 0.95, DW = 1.5, t 0.05 (9) = 2.26

ˆ= 6313.4, 问题:β为什么检验结果是 β1 = 0? 量纲的变化对回归结果会造成影响吗? 1

案例3:《用回归方法估计纯耕地面积》(多元线性模型)

(见《数理统计与管理》1986年第6期)

目前对土地的调查大多采用航空摄影,从照片上把各类资源图斑转绘到1:10000的地形图上,然后再从地形图上测绘图斑面积。

在处理如何获得实际耕地面积时,关键技术难题是如何将耕地图斑中包含的田埂、土坎、空隙地、宽度小于2米的路、沟、渠等面积从图斑中分离出来。因为它们在航空图片上的分辨率很低,无法直接勾绘,测算。

设一个毛耕地图斑面积用S 表示,其中不能耕种的面积(扣除面积)用 ∆S 表示,则扣除系数,

y i = ∆S / S =(扣除面积)/(毛耕地图斑面积)。 对于每一个图斑,知道精确的扣除系数,就很容易根据毛耕地图斑面积计算出纯耕地面积。现在用回归分析方法,寻找影响扣除系数变化的主要因素,从而建立关于“扣除系数”的回归模型。

该论文研究的是湖南地区的耕地面积调查。湖南省属丘陵山区,地形复杂,各种地类犬牙交错,影响扣除系数的因素很多。如田埂宽度、地块大小、地块坡度、空隙地、地貌类型等。通过实际调查和分析,初步确定三个主要因素,即

“坡度”、“地块面积”和“田埂宽度”

论文作者在五个县共调查了867个样本点,其中水田样本522个,旱田样本345个。具体做法是首先把867个样本数据按“坡度”分成25个等级,然后再把属于同一个等级的样本数据用加权平均的方法求出另两个因素的观测值,“平均地块面积”和“平均田埂宽度”。整理样本数据如下:

i (序号)

1 2

y i (扣除系数)

4.2356 4.8838

x 1i (坡度) x 2i (平均地块面积)

0 1

1.9300 1.4918

x 3i (平均田埂宽度)

0.6318 0.7312

3 … 25

7.8300 … 39.4151

2 … 24

1.1253 … 1.0600

0.9731 … 4.0721

拟建摸型为,

y i = β0 + β1 x 1i + β2 x 2i +β3 x 3i + u i 利用样本得估计的回归方程

y i = 1.672 + 1.145 x 1i + 0.608 x 2i + 2.081 x 3i

(7.3) (0.4) (1.85) F = 221.62

(F .05(3,21) = 3.07, F.01(3,21) = 4.87, t .05(21) = 2.08, t .01(21) = 2.84)

统计检验结果表明x 2i , x 3i 为非重要解释变量。剔除之,用y i 对x 1i 再次回归得, y i = 3.34 + 1.35 x 1i

实际的验证结果表明,用只考虑“地块坡度”计算出来的扣除系数估计“纯耕地面积”完全能满足精度要求,从而为减少野外作业强度(不必再测量“地块面积”和“田埂宽度”),迅速完成测算,提供了科学依据。

案例4:中国宏观消费分析(多元线性模型)

非农民消费 居民消费

消费 农民消费 国民收入 社会消费 (支出法)

积累投资

城镇居民消费 居民消费

最终消费 农村居民消费 政府消费 资本形成总额投资 (支出法)

货物与服务的净出口

注 居民消费: 居民衣、食、住、行、文化生活等消费 政府消费(社会消费):国家机关、治安、文教、卫生等单位用于燃料、电力、办公用 品和图书设备的消费

下面通过建立宏观消费经济计量模型进一步分析我国消费与社会总产品的定量关系。(以下所用数据(1952-1993)均以不变价格(1990=1)计算。)

1952-1993年国民收入与消费额散点图见图7。说明消费与国民收入之间存在高度的线性关系。

用CP t 表示消费额,IP t 表示国民收入,用1952-1993年数据得如下消费函数:

CP t = 262.5098 + 0.6359 IP t (1.124)

(4.9) (97.7) R 2 = 0.9958, DW = 0.9, s.e. = 216.97

由这个模型可知,四十二年来我国的宏观消费与国民收入有着密切的线性关系。国民收入的边际消费倾向为0.6359,即国民收入每增加一亿元平均导致0.6359亿元用于消费。同时也说明国民收入的边际储蓄倾向为0.3641。 用取自然对数的数据计算,得如下结果,

LnCP t = 0.2732 + 0.9259 LnIP t (1.125) (2.1) (61.1) R 2 = 0.9890, DW = 0.8, s.e. = 0.0743

这说明我国消费对国民收入的平均弹性为0.9259,即国民收入每增加1%,平均导致消费约增加0.93%。消费的增加速度略低于国民收入的增加速度。从而也印证了我国消费率呈逐年下降的总趋势。

事实上国民收入对消费的影响存在一定滞后。换句话说,本年度的消费不但受本年度国民收入影响,而且也受前期国民收入影响。为此以IP t 和IP t -1同作解释变量,得线性模型如下: CP t = 238.9469 + 0.5116 IP t + 0.1381 IP t -1 (1.126) (4.4) (8.8) (2.2) R 2 = 0.9962, DW = .9, s.e. = 210.06 与模型(1.124)相比,估计结果得到一定程度的改善。上式说明国民收入对消费影响的滞后作用很强。本年度国民收入对本年度消费以及来年度消费都存在影响。本年度国民收入的边际消费倾向为0.5116,一期滞后年度国民收入的边际消费倾向为0.1381。当然消费主要还是受本年度国民收入的影响较大(79%)。

用自然对数数据重新估计得 LnCP t = 0.6966 LnIP t + 0.2648 LnIP t-2 (1.127) (11.1) (4.1) R 2 = 0.9913, DW = 0.6, s.e . = 0.0657

与模型(1.125)比较,弹性系数被分解为当年弹性0.6966和前二年期弹性0.2648,也就是说本年度国民收入增加1%,将使本年度消费增加0.70%;而前二年期的国民收入增加1%,也将使本年度消费增加0.26%。

从上述四个模型看DW 值都不很大,说明还有重要解释变量没有包括在模型中。很明显, 前期消费也是影响本期消费的重要解释变量。把前一期消费CP t -1也作为解释变量加入模型(1.124),估计结果是 CP t = 123.2914 + 0.3717 IP t + 0.4516 CP t -1 (1.128) (2.4) (7.2) (5.2) R 2 = 0.9975, DW = 1.2, s.e. = 170.58 显然模型(1.128)优于模型(1.124)和(1.126)。说明IP t 和CP t-1都是重要解释变量,具有很强的解释能力。

用取自然对数的数据计算,得如下结果:

LnCP t = 0.2496 LnIP t + 0.7448 LnCP t -1 (1.129) (3.6) (10.2) R 2 = 0.9967, DW = 1.1, s.e . = 0.0417 模型(1.129)优于模型(1.125)和(1.127)。消费对本期国民收入的弹性为0.2496,对前一期消费的弹性为0.7448。以上二式都说明前一期消费对本期消费的影响要大于本期国民收入对本期消费的影响。这一结果与前面的论断“宏观消费行为具有惯性”相一致。当年消费主要取决于前一年消费的规模。当年消费是在前一年消费的基础上实现的。有变化,但不会出现剧烈波动。

严格地说上述模型中的误差项都存在自相关。以模型(1.124)为例,为消除自相关(

= 0.56), 对变量进行广义差分。定义

GDCP t = CP t - 0.56 CP t -1 (1.130) GDIP t = IP t - 0.56 IP t -1 (1.131) 得估计的回归模型为,

GDCP t = 97.0256 + 0.4173 GDIP t + 0.3539 GDCP t-1 (1.132) (2.1) (7.8) (3.8) R 2 = 0.9906, DW = 1.5, s.e. = 160.82

虽然这个模型已基本克服了自相关,但变量已不是原来的变量。把关系式 (1.130) 和 (1.131) 代入上式并进一步整理得

CP t = 97.0256 + 0.4173 IP t + 0.2296 IP t -1 + 0.9139 CP t -1 + 0.1960 CP t -2 (1.133) R 2 = 0.9906, DW = 1.5, s.e. = 160.82

这是一个自回归分布滞后模型。

消费由居民消费和政府消费两部分构成。四十二年间(1952-1993),居民消费平均占总消费的86.8%。所以应进一步分析居民消费与国民收入的函数关系。用CPH t表示居民消费,利用1952-1993年数据得如下两个模型

CPH t = 356.1789 + 0.4127 IP t + 0.1351 IP t-1 (1.134) (7.1) (7.8) (2.3)

R 2 = 0.9955, DW = 0.8, s.e. = 192.48

LnCPH t = 0.4097+ 0.6819 LnIP t + 0.2161 LnIP t -1 (1.135) (3.0) (5.8) (1.8)

R 2 = 0.9886, DW = 0.7, s.e . = 0.0743

国民收入的长期边际居民消费倾向是0.4127 + 0.1351 = 0.5487。居民消费对国民收入的长期弹性为0.6819 + 0.2161 = 0.8980。这说明居民消费的增长率低于国民收入的增长率,也低于总消费的增长率。

考虑到前一期居民消费也是影响本期居民消费的重要解释变量。特作如下估计: CPH t = 187.1132 + 0.3046 IP t + 0.4663 CPH t-1 (1.136) (3.6.1) (7.5) (5.7) R 2 = 0.9972, DW = 1.2, s.e . = 151.39 LnCPH t = 0.1991 LnIP t + 0.7947 LnCPH t -1 (1.137) (3.0) (11.2) R 2 = 0.9962, DW = 1.2, s.e . = 0.0421 用模型(1.136)和(1.137)分别与模型(1.128)和(1.129)比较,居民消费的惯性更大,居民消费以更大的比例依赖于前期居民消费的取值。

注意:对于多元回归模型,当解释变量的量纲不相同时,不能在估计的回归系数之间比较大小。

案例5 中国铅笔需求预测模型(非线性模型)

中国从上个世纪30年代开始生产铅笔。1985年全国有22个厂家生产铅笔。产量居世界首位(33.9亿支),占世界总产量的1/3。改革开放以后,铅笔生产增长极为迅速。1979-1983年平均年增长率为8.5%。铅笔销售量时间序列见图4.21。1961-1964年的销售量平稳状态是

受到了经济收缩的影响。文革期间销售量出现两次下降,是受到了当时政治因素的影响。1969-1972年的增长是由于一度中断了的中小学教育逐步恢复的结果。1977-1978年的增长是由于高考正式恢复的结果。1981年中国开始生产自动铅笔,对传统铅笔市场冲击很大。1979-1985年的缓慢增长是受到了自动铅笔上市的影响。

初始确定的影响铅笔销量的因素有全国人口、各类在校人数、设计人员数、居民消费水平、社会总产值、自动铅笔产量、价格因素、原材料供给量、政策因素等。经过多次筛选、组合和逐步回归分析,最后确定的被解释变量是y t (铅笔年销售量,千万支);解释变量分别是x t 1(自动铅笔年产量,百万支);x t 2(全国人口数,百万人);x t 3(居民年均消费水平,元);x t 4(政策变量)。因政策因素影响铅笔销量出现大幅下降时,政策变量取负值。例如1967、1968年的x t 4值取-2,1966、1969-1971、1974-1977年的x t 4值取-1)。

由图4.22知中国自生产自动铅笔起,自动铅笔产量与铅笔销量存在线性关系。由图4.23知全国人口与铅笔销量存在线性关系。说明人口越多,对铅笔的需求就越大。由图4.24知居民年均消费水平与铅笔销量存在近似对数的关系。散点图说明居民年均消费水平越高,则铅笔销量就越大。但这种增加随着居民消费水平的增加变得越来越缓慢。图4.25显示政策变量与铅笔销量也呈线性关系。

基于上述分析建立的模型形式是

y t = β0 + β1 x t 1 + β2 x t 2 + β3 Ln (x t 3) + β4 x t 4 + u t (4.40)

y t 与x t 3呈非线性关系。估计结果如下。

[***********]50

62

64

66

68

70

72

74

76

78

80

82

84

Y

铅笔销售量时间序列(1961-1985)(文件名nonli6)

400

Y

300

300400

Y

200200

100

X 1

10

20

30

40

100

X 2

600

700

800

900

1000

1100

Y , X1散点图 Y , X2散点图

400

Y

300

400

Y

300

200200

100

X 3

200

300

400

500

100

X 4

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1000

-2.5

Y , X3散点图 Y , X4散点图

ˆt = -907.94 - 2.95 x t 1 + 0.31 x t 2 + 170.19 Ln x t 3 + 45.51 x t 4 (4.41) y

(-6.4) (-3.7) (4.8) (4.4) (12.6)

R 2 = 0.9885, DW = 2.09, F = 429, s.e. = 10.34

上式说明,在上述期间自动铅笔年产量每增加1百万支,平均使铅笔的年销售量减少2950

万支。全国人口数每增加1百万人,平均使铅笔的年销售量增加310万支。对数的居民年均消费水平每增加1个单位,平均使铅笔的年销售量增加17亿支。一般性政策负面变动使铅笔的年销售量减少4.551亿支。当政策出现大的负面变动时,铅笔的年销量会减少9.102亿支。

当y t 对所有变量都进行线性回归时(见下式),显然估计结果不如(4.41)式好。

ˆt = -254.26 - 3.29 x t 1 + 0.42 x t 2 + 0.66 x t 3 + 40.74 x t 4 (4.42) y

(-12.0) (-3.0) (8.6) (3.5) (11.7)

R 2 = 0.9857, DW = 1.77, F = 346, s.e. = 11.5


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn