动态面板数据分析步骤详解

动态面板数据分析算法

1. 面板数据简介

面板数据(Panel Data, Longitudinal Data ),也称为时间序列截面数据、混合数据,是指同一截面单元数据集上以不同时间段的重复观测值,是同时具有时间和截面空间两个维度的数据集合,它可以被看作是横截面数据按时间维度堆积而成。自20世纪60年代以来,计量经济学家开始关注面板数据以来,特别是近20年,随着计量经济学理论,统计方法及计量分析软件的发展,面板数据计量经济分析已经成为计量经济学研究最重要的分支之一。

面板数据越来越多地被应用到计量模型的研究中,其在实证分析中的优点是明显的:相对于只具有一个时点的横截面数据模型,面板数据包含了更多时间维度的数据,从而可以利用更多的信息来分析所研究问题的动态关系; 而时间序列模型,其数据往往是由个体数据加总产生的,在实际计量分析中,在研究其动态调整行为时,由于个体差异被忽略,其估计结果有可能是有偏的,而面板数据模型能够通过截距项,捕捉到数据的动态调整过程中的个体差异,有效地减少了由于数据加总所产生的偏误; 同时,面板数据同时具有时间和截面空间的两个维度,从而分享了横截面数据和时间序列数据的优点,另外,由于具有更多的观察值,其推断的可靠性也有所增加。

2. 面板数据的建模与检验

设Y it

3. 动态面板数据的建模与检验

所谓动态面板数据模型,是指通过在静态面板数据模型中引入滞后被解释变量以反映动态滞后效应的模型。这种模型的特殊性在于被解释变量的动态滞后项与随机误差组成部分中的个体效应相关,从而造成估计的内生性。

4、步骤详解

步骤一:分析数据的平稳性(单位根检验)

按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R 平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression )。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。

因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。

单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布, 这些结果也被应用在有异方差的面板数据中, 并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进, 提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出, 该方法允许不同截距和时间趋势, 异方差和高阶序列相关, 适合于中等维度(时间序列介于25~250 之间, 截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法, 但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感, 并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher 和PP-Fisher 面板单位根检验方法。

由上述综述可知,可以使用LLC 、IPS 、Breintung 、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。

其中LLC-T 、BR-T 、IPS-W 、ADF-FCS 、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square 统计量、PP-Fisher Chi-square 统计量、Hadri Z 统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square 统计量的原假设为存在有效的单位根过程, Hadri Z统计量的检验原假设为不存在普通的单位根过程。

有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC (Levin-Lin-Chu )检验和不同根单位根检验Fisher-ADF 检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF 检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。

如果我们以T (trend )代表序列含趋势项,以I (intercept )代表序列含截距项,T&I代表两项都含,N (none )代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。

但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体操作可以参照李子奈的说法:ADF 检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们才认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。

此外,单位根检验一般是先从水平(level )序列开始检验起,如果存在单位根,则对该序列进行一阶差分后继续检验,若仍存在单位根,则进行二阶甚至高阶差分后检验,直至序列平稳为止。我们记I(0)为零阶单整,I(1)为一阶单整,依次类推,I(N)为N 阶单整。

步骤二:协整检验或模型修正

情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。

但也有如下的宽限说法:如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高

于被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相同。也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

协整检验方法的文献综述:(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF 和ADF 检验提出了检验面板协整的方法, 这种方法零假设是没有协整关系, 并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao 的方法不同的是,Pedroni 的检验方法允许异质面板的存在。

(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。 我们主要采用的是Pedroni 、Kao 、Johansen 的方法。

通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。

这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提是变量协整)。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格兰杰因果检验的,不过此时可以先对数据进行处理。引用张晓峒的原话,“如果y 和x 不同阶,不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要看它们此时有无经济意义。”

下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定不变的条件下,如果一个事件X 的发生与不发生对于另一个事件Y 的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又有先后顺序(A 前B 后),那么我们便可以说X 是Y 的原因。考虑最简单的形式,Granger 检验是运用F-统计量来检验X 的滞后值是否显著影响Y (在统计的意义下,且已经综合考虑了Y 的滞后值;如果影响不显著,那么称X 不是Y 的“Granger 原因”(Granger cause);如果影响显著,那么称X 是Y 的“Granger 原因”。同样,这也可以用于检验Y 是X 的“原因”,检验Y 的滞后值是否影响X (已经考虑了X 的滞后对X 自身的影响)。

Eviews好像没有在POOL 窗口中提供Granger causality test ,而只有unit root test和cointegration test。说明Eviews 是无法对面板数据序列做格兰杰检验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews 中是针对普通的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话,不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group) ,再来试试。

情况二:如果如果基于单位根检验的结果发现变量之间是非同阶单整的,即面板数据中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序列进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分

某些序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列进行二阶差分,因为对变动数据或增长率数据再进行差分,我们不好对其冠以经济解释。难道你称其为变动率的变动率?

步骤三:面板模型的选择与回归

面板数据模型的选择通常有三种形式:

一种是混合估计模型(Pooled Regression Model )。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS )估计参数。一种是固定效应模型(Fixed Effects Regression Model)。如果对于不同的截面或不同的时间序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回归参数。一种是随机效应模型(Random Effects Regression Model )。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态分布,则固定效应模型就变成了随机效应模型。

在面板数据模型形式的选择方法上,我们经常采用F 检验决定选用混合模型还是固定效应模型,然后用Hausman 检验确定应该建立随机效应模型还是固定效应模型。

检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归: 在回归的时候,权数可以选择按截面加权(cross-section weights)的方式,对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差现象。估计方法采用PCSE (Panel Corrected Standard Errors,面板校正标准误)方法。Beck 和Katz(1995)引入的PCSE 估计方法是面板数据模型估计方法的一个创新,可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本量不够大时尤为有用。

面板数据的计量方法

1. 什么是面板数据?

面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是截面数据与时间序列综合起来的一种数据资源,是同时在时间和截面空间上取得的二维数据。

如:城市名:北京、上海、重庆、天津的GDP 分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如:2000、2001、2002、2003、2004各年的北京市GDP 分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。

如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP 分别为: 北京市分别为8、9、10、11、12;

上海市分别为9、10、11、12、13;

天津市分别为5、6、7、8、9;

重庆市分别为7、8、9、10、11(单位亿元)。

这就是面板数据。

2. 面板数据的计量方法

利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估计量。

(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000 年30 个省份的农业总产值数据。固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。

面板数据模型的选择通常有三种形式:混合估计模型、固定效应模型和随机效应模型。这三类模型的差异主要表现在系数、截距以及随机误差的假设不同。 第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS )估计参数。此时,对所有横截面数据而言,截距应是相同的。

第二种是固定效应模型(Fixed Effects Regression Model )。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model )。此时,相对于混合效应模型而言,个体间存在差异可以体现在截距的差异也可以体现为系数的差异。

固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model )、时刻固定效应模型(time fixed effects regression model )和时刻个体固定效应模型(time and entity fixed effects regression model )。

(1)个体固定效应模型。

个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著

性变化,那么就应该建立个体固定效应模型。注意:个体固定效应模型的EViwes 输出结果中没有公共截距项。

(2)时刻固定效应模型。

时刻固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。如果确知对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时刻固定效应模型,相对于混合估计模型来说,是否有必要建立时刻固定效应模型可以通过F 检验来完成。

H0:对于不同横截面模型截距项相同(建立混合估计模型)。

H1:对于不同横截面模型的截距项不同(建立时刻固定效应模型)。

(3)时刻个体固定效应模型。

时刻个体固定效应模型就是对于不同的截面(时刻点)、不同的时间序列(个体)都有不同截距的模型。如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显著地不相同,那么应该建立时刻个体效应模型。

相对于混合估计模型来说,是否有必要建立时刻个体固定效应模型可以通过F 检验来完成。

H0:对于不同横截面,不同序列,模型截距项都相同(建立混合估计模型)。 H1:不同横截面,不同序列,模型截距项各不相同(建立时刻个体固定效应模型)。

第三种是随机效应模型。

在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。也可以通过对误差项的分解来描述这种信息的缺失。

yit = a + b1 xit + eit

其中误差项在时间上和截面上都是相关的,用3个分量表示如下。

eit = ui + vt + wit

其中ui ~N(0, su2)表示截面随机误差分量;vt ~N(0, sv2)表示时间随机误差分量;wit ~N(0, sw2)表示混和随机误差分量。同时还假定ui ,vt ,wit 之间互不相关,各自分别不存在截面自相关、时间自相关和混和自相关。上述模型称为随机效应模型。与固定效应模型不同,随机效应模型中。随机误差项和截距项都是随机变量。

随机效应模型和固定效应模型比较,相当于把固定效应模型中的截距项看成两个随机变量。一个是截面随机误差项(ui ),一个是时间随机误差项(vt )。如果这两个随机误差项都服从正态分布,对模型估计时就能够节省自由度,因为此条件下只需要估计两个随机误差项的均值和方差。

假定固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,而且对均值的离差分别是ui 和vt ,固定效应模型就变成了随机效应模型。

注意:随机效应模型EViwes 输出结果中含有公共截距项。

一般常用的具体检验方法是:通过构造F 统计量判断是否所有固定影响为零,对固定效应模型和混合模型进行筛选; 通过ols 估计的残差构造LM 统计量,

即BP 拉格朗日乘数检验进行随即模型和混合模型检验以及通过hausman 检验进行固定效应模型和随机模型的筛选。

由于面板数据带有时间序列和横截面数据的双重性。而在处理时间序列模型时,必须首先对时间序列进行单位根检验,否则很可能出现“伪回归”,因此必须对其进行平稳性检验。Eviews 软件对面板数据的单位根检验包括五种,即LLC 检验、IPS 检验、Fish-ADF, Fish-PP检验和Hadri 检验。其中Hadri 检验的原假设为面板数据不存在单位根,而其它四种检验的原假设为含有单位根。(详细的应用例子可参见:蔡莉,《我国货币政策有效性的区域差异分析:2003-2009》,复旦大学2009届硕士论文,第36-39页。)

随机效应模型和固定效应模型哪一个更好些?实际是各有优缺点。随机效应模型的好处是节省自由度。对于从时间序列和截面两方面上看都存在较大变化的数据,随机效应模型能明确地描述出误差来源的特征。固定效应模型的好处是很容易分析任意截面数据所对应的因变量与全部截面数据对应的因变量均值的差异程度。此外,固定效应模型不要求误差项中的个体效应分量与模型中的解释变量不相关。当然,这一假定不成立时,可能会引起模型参数估计的不一致性。 用EViwes 可以估计固定效应模型(包括个体固定效应模型、时刻固定效应模型和时刻个体固定效应模型3种)、随机效应模型、带有AR(1)参数的模型、截面不同回归系数也不同的面板数据模型。

用EViwes 可以选择普通最小二乘法、加权最小二乘法(以截面模型的方差为权)、似不相关回归法估计模型参数。

时间序列的平稳、非平稳、协整、格兰杰因果关系

步骤:1、先做单位根检验,看变量序列是否平稳序列,若平稳,可构造回归模型等经典计量经济学模型;若非平稳,进行差分,当进行到第i 次差分时序列平稳,则服从i 阶单整(注意趋势、截距不同情况选择,根据P 值和原假设判定)。2、若所有检验序列均服从同阶单整,可构造VAR 模型,做协整检验(注意滞后期的选择),判断模型内部变量间是否存在协整关系,即是否存在长期均衡关系。如果有,则可以构造VEC 模型或者进行Granger 因果检验,检验变量之间“谁引起谁变化”,即因果关系。

1. 单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS 容易导致伪回归。常用的ADF 检验包括三个模型方程。在李子奈的《高级计量经济学》上有该方法的全部步骤,即从含趋势项、截距项的方程开始,若接受原假设,则对模型中的趋势项参数进行t 检验,若接受则进行对只含截距项的方程进行检验,若接受,则对一阶滞后项的系数参数进行t 检验,若接受,则进行差分后再ADF 检验;若拒绝,则序列为平稳序列。

2.当检验的数据是平稳的(即不存在单位根),要想进一步考察变量的因果联系,可以采用格兰杰因果检验,但要做格兰杰检验的前提是数据必须是平稳的,否则不能做。

3.当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协

整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG 两步法和JJ 检验

(1)EG两步法是基于回归残差的检验,可以通过建立OLS 模型检验其残差平稳性

(2)JJ检验是基于回归系数的检验,前提是建立VAR 模型(即模型符合ADL 模式)

4.当变量之间存在协整关系时,可以建立ECM 进一步考察短期关系,Eviews 这里还提供了一个Wald -Granger 检验,但此时的格兰杰已经不是因果关系检验,而是变量外生性检验,请注意识别

5.格兰杰检验只能用于平稳序列!这是格兰杰检验的前提,而其因果关系并非我们通常理解的因与果的关系,而是说x 的前期变化能有效地解释y 的变化,所以称其为“格兰杰原因”。

6.非平稳序列很可能出现伪回归,协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。

7.平稳性检验有3个作用:

(1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。

(2)协整检验中要用到每个序列的单整阶数。

(3)判断时间学列的数据生成过程。

8.其实很多人存在误解。有如下几点,需要澄清:

(1)格兰杰因果检验是检验统计上的时间先后顺序,并不表示而这真正存在因果关系,是否呈因果关系需要根据理论、经验和模型来判定。

(2)格兰杰因果检验的变量应是平稳的,如果单位根检验发现两个变量是不稳定的,那么,不能直接进行格兰杰因果检验,所以,很多人对不平稳的变量进行格兰杰因果检验,这是错误的。

(3)协整结果仅表示变量间存在长期均衡关系,那么,到底是先做格兰杰还是先做协整呢?因为变量不平稳才需要协整,所以,首先因对变量进行差分,平稳后,可以用差分项进行格兰杰因果检验,来判定变量变化的先后时序,之后,进行协整,看变量是否存在长期均衡。

(4)长期均衡并不意味着分析的结束,还应考虑短期波动,要做误差修正检验。在变量均非平稳但协整的情况下则可以建立误差修正模型(Error

Correction Model, ECM)来研究变量间的关系,由于误差修正项的出现,ECM 可以同时研究短期与长期的因果关系。

(5)当变量之间存在协整关系时,可以建立ECM 进一步考察短期关系,Eviews 里提供了一个Wald -Granger 检验,但这个格兰杰已经不是因果关系检验,而是变量外生性检验,一定要区分开。

向量自回归(VAR,Vector Auto regression )常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响。VAR 方法通过把系统中每一个内生变量, 作为系统中所有内生变量的滞后值的函数来构造模型,从而回避了结构化模型的要求。Engle 和Granger (1987a )指出两个或多个非平稳时间序列的线性组合可能是平稳的。假如这样一种平稳的或的线性组合存在,这些非平稳(有

单位根)时间序列之间被认为是具有协整关系的。这种平稳的线性组合被称为协整方程且可被解释为变量之间的长期均衡关系。

VAR模型对于相互联系的时间序列变量系统是有效的预测模型,同时,向量自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。如果变量之间不仅存在滞后影响,而不存在同期影响关系,则适合建立VAR 模型,因为VAR 模型实际上是把当期关系隐含到了随机扰动项之中。

注意点:

1、单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS 容易导致伪回归。

2、当检验的数据是平稳的(即不存在单位根),要想进一步考察变量的因果联系,可以采用格兰杰因果检验,但要做格兰杰检验的前提是数据必须是平稳的,否则不能做。

3、当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG 两步法和JJ 检验

A 、EG 两步法是基于回归残差的检验,可以通过建立OLS 模型检验其残差平稳性

B 、JJ 检验是基于回归系数的检验,前提是建立VAR 模型(即模型符合ADL 模式)

4、当变量之间存在协整关系时,可以建立ECM 进一步考察短期关系,Eviews 这里还提供了一个Wald -Granger 检验,但此时的格兰杰已经不是因果关系检验,而是变量外生性检验,请注意识别。

5、格兰杰检验只能用于平稳序列!这是格兰杰检验的前提,而其因果关系并非我们通常理解的因与果的关系,而是说x 的前期变化能有效地解释y 的变化,所以称其为“格兰杰原因”。

6、非平稳序列很可能出现伪回归,协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。

7、平稳性检验有3个作用:1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。2)协整检验中要用到每个序列的单整阶数。3)判断时间学列的数据生成过程。

ADF 检验:1 view---unit root test,出现对话框,默认的选项为变量的原阶序列检验平稳性,确认后,若ADF 检验的P 值小于0.5,拒绝原假设,说明序列是平稳的,若P 值大于0.5,接受原假设,说明序列是非平稳的;2 重复刚才的步骤,view---unit root test,出现对话框,选择1st difference,即对变量的一阶差分序列做平稳性检验,和第一步中的检验标准相同,若P 值小于0.5,说明是一阶平稳,若P 值大于0.5,则继续进行二阶差分序列的平稳性检验。

先做单位根检验,看变量序列是否平稳序列,若平稳,可构造回归模型等经典计量经济学模型;若非平稳,进行差分,当进行到第i 次差分时序列平稳,则服从i 阶单整(注意趋势、截距不同情况选择,根据P 值和原假设判定)。若所有检验序列均服从同阶单整,可构造VAR 模型,做协整检验(注意滞后期的选择),

判断模型内部变量间是否存在协整关系,即是否存在长期均衡关系。如果有,则可以构造VEC 模型或者进行Granger 因果检验,检验变量之间“谁引起谁变化”,即因果关系。

第一,格兰杰因果检验是检验统计上的时间先后顺序,并不表示而这真正存在因果关系,是否呈因果关系需要根据理论、经验和模型来判定。

第二,格兰杰因果检验的变量应是平稳的,如果单位根检验发现两个变量是不稳定的,那么,不能直接进行格兰杰因果检验,所以,很多人对不平稳的变量进行格兰杰因果检验,这是错误的。

第三,协整结果仅表示变量间存在长期均衡关系,那么,到底是先做格兰杰还是先做协整呢?因为变量不平稳才需要协整,所以,首先因对变量进行差分,平稳后,可以用差分项进行格兰杰因果检验,来判定变量变化的先后时序,之后,进行协整,看变量是否存在长期均衡。

第四,长期均衡并不意味着分析的结束,还应考虑短期波动,要做误差修正检验。

8.单位根检验是检验数据的平稳性,或是说单整阶数。

9.协整是说两个或多个变量之间具有长期的稳定关系。但变量间协整的必要条件是它们之间是同阶单整,也就是说在进行协整检验之前必须进行单位跟检验。

10.协整说的是变量之间存在长期的稳定关系,这只是从数量上得到的结论,但不能确定谁是因,谁是果。而因果关系检验解决的就是这个问题。

单位根检验是检验时间序列是否平稳,协整是在时间序列平稳性的基础上做长期趋势的分析,而格兰杰检验一般是在建立误差修正模型的后,所建立的短期的因果关系。故顺序自然是先做单位根检验,再过协整检验,最后是格兰杰因果检验。

单位根检验是对时间序列平稳性的检验,只有平稳的时间序列,才能进行计量分析,否则会出现伪回归现象;协整是考察两个或者多个变量之间的长期平稳关系,考察两者的协整检验通常采用恩格尔-格兰杰检验,两者以上则用

Johansen 检验;格兰杰因果检验是考察变量之间的因果关系,协整说明长期稳定关系不一定是因果关系,所以需要在通过格兰杰因果检验确定两者的因果关系。顺序一般是单位根检验,通过后如果同阶单整,在进行协整,然后在进行因果检验。要特别注意的是:只有同阶单整才能进行协整。

11.VAR建模时lag intervals for endogenous要填滞后期,但是此时你并不能判断哪个滞后时最优的,因此要试,选择不同的滞后期,至AIC 或SC 最小时,所对应着的滞后为最优滞后,此时做出来的VAR 模型才较为可靠。

12.做协整检验前作VAR 的原因是,协整检验是对滞后期和检验形式非常敏感的检验,首先需要确定最优滞后。由于VAR 是无约束的,而协整是有约束的,因此协整检验的最优滞后一般为VAR 的最优滞后减去1,确定了最优滞后后,再去诊断检验形式,最终才能做协整。

13.当确定了协整的个数后,往下看,有个标准化的结果,这个结果就是协整方程,由于在结果中各变量均在方程一侧,因此如果系数为正,则说明是负向关系,反之亦然。

14.协整表示变量间的长期均衡关系,貌似与你的OLS 不矛盾。

(1)如检验不协整,说明没长期稳定关系,可以做VAR 模型,但是模型建立后要做

稳定性分析:做AR 根的图表分析,如所有单位根小于1,说明VAR 模型定,满足脉冲分析及方差分解所需条件之一

模型的因果关系检验 2 不过注意在做因果检验前要先确定滞后长度,方法见高铁梅 计量分析方法与建模 第2版 P302 只有满足因果关系,加上满足条件一:稳定性,则可进行脉冲及方差分解

如不满足因果关系,则所有不满足因果关系的变量将视为外生变量,至此要重新构建VAR 模型,新的VAR 模型将要引入外生变量的VAR 模型

(2)VAR 与VEC 关系是:VEC 是有协整约束(即有长期稳定关系)的VAR 模型,多用于具有协整关系的非平稳时间序列建模 高铁梅 计理分析方法与建模 第2版 P295

15.简单说VAR 模型建立时

第一步:不问序列如何均可建立初步的VAR 模型(建立过程中数据可能前平稳序列,也可能是部分平稳,还可能是没协整关系的同阶不平稳序列,也可能是不同阶的不平稳序列,滞后阶数任意指定。所有序列一般视为内生向量) , 第二步:在建立的初步VAR 后进行

1、滞后阶数检验,以确定最终模型的滞后阶数

2、在滞后阶数确定后进行因果关系检验,以确定哪些序列为外生变量 至此重新构建VAR 模型(此时滞后阶数已定,内外生变量已定),再进行AR 根图表分析,

如单位根均小于1,VAR 构建完成可进行脉冲及方差分解

如单位根有大于1的,考虑对原始序进行降阶处理(一阶单整序列处理方法:差分或取对数,二阶单整序列:理论上可以差分与取对数同时进行,但由于序列失去了经济含义,应放弃此处理,可考虑序列的趋势分解,如分解后仍然不能满足要求,可以罢工,不建立任何模型,休息或是打砸了电脑),处理过后对新的序列(包括最初的哪些平稳序列)不断重复第一步与第二步,直至满足稳定性为止

第三步,建立最终的VAR 后,可考虑SVAR 模型

如果变量不仅存在滞后影响,还存在同期影响关系,则建立VAR 模型不太合适,这种情况下需要进行结构分析。

误差修正模型(Error Correction Model,ECM )

向量误差修正模型(VEC,Vector Error Correction,)是一个有约束的VAR 模型,并在解释变量中含有协整约束,因此它适用于已知有协整关系的非平稳序列。当有一个大范围的短期动态波动时,VEC 表达式会限制内生变量的长期行为收敛于它们的协整关系。因为一系列的部分短期调整可以修正长期均衡的偏离,所以协整项被称为是误差修正项。误差修正项反映了长期均衡对短期波动偏离自我修正的动态机制。理论上,误差修正项应为负值,表示当失衡时,时间序列应收敛并回归长期均衡,绝对值越大则队本期误差修正作用与越强。如果为正,则表示前期的失衡部分无法在后一期作反向回归调整。

应用可参考文献:常海滨、徐成贤:我国货币政策传导机制区域差异的实证分析,经济科学,2007年第5期

1. 误差修正模型的产生原因

对于非稳定时间序列,可通过差分的方法将其化为稳定序列,然后才可建立经典的回归分析模型

如:建立人均消费水平(Y )与人均可支配收入(X )之间的回归模型: Yt = α0 + α1X t + μt

如果Y 与X 具有共同的向上或向下的变化趋势, 进行差分,X,Y 成为平稳序列,建立差分回归模型得:

ΔY t = α1ΔX t + v t 式中,v t = μt -μt -1

然而,这种做法会引起两个问题: (1)如果X 与Y 间存在着长期稳定的均衡关系 Y t = α0 + α1X t + μt 且误差项μt 不存在序列相关,则差分式 ΔY t = α1ΔX t + v t 中的v t 是一个一阶移动平均时间序列,因而是序列相关的;(2)如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时模型只表达了X 与Y 间的短期关系,而没有揭示它们间的长期关系。

因为,从长期均衡的观点看,Y 在第t 期的变化不仅取决于X 本身的变化,还取决于X 与Y 在t-1期末的状态,尤其是X 与Y 在t-1期的不平衡程度。另外,使用差分变量也往往会得出不能令人满意回归方程。

例如,使用ΔY 1 = ΔX t + v t 回归时,很少出现截距项显著为零的情况,即我们常常会得到如下形式的方程:

式中, (*) 在X 保持不变时,如果模型存在静态均衡(static equilibrium ),Y 也会保持它的长期均衡值不变。

但如果使用(*)式,即使X 保持不变,Y 也会处于长期上升或下降的过程中,这意味着X 与Y 间不存在静态均衡。这与大多数具有静态均衡的经济理论假说不相符。可见,简单差分不一定能解决非平稳时间序列所遇到的全部问题,因此,误差修正模型便应运而生。

2. 误差修正模型的简单原理(Error Correction Model,简记为ECM )

误差修正模型(Error Correction Model,简记为ECM )是一种具有特定形式的计量经济学模型,为了便于理解,我们通过一个具体的模型来介绍它的结构。 假设两变量X 与Y 的长期均衡关系为:

Yt = α0 + α1X t + μt

由于现实经济中X 与Y 很少处在均衡点上,因此实际观测到的只是X 与Y 间的短期的或非均衡的关系,假设具有如下(1,1)阶分布滞后形式

该模型显示出第t 期的Y 值,不仅与X 的变化有关,而且与t-1期X 与Y 的状态值有关。

由于变量可能是非平稳的,因此不能直接运用OLS 法。对上述分布滞后模型适当变形得: (**) , 式中,λ = 1 - μ,

如果将(**)中的参数,与Y t = α0 + α1X t + μt 中的相应参数视为相等,则(**)式中括号内的项就是t-1期的非均衡误差项。

(**)式表明:Y 的变化决定于X 的变化以及前一时期的非均衡程度。同时,(**)式也弥补了简单差分模型ΔY 1 = ΔX t + v t 的不足,因为该式含有用X 、Y 水平值表示的前期非均衡程度。因此,Y 的值已对前期的非均衡程度作出了修正。 (**)称为一阶误差修正模型(first-order error correction model)。 (**)式可以写成:

其中:ecm表示误差修正项。由分布滞后模型知:一般情况下|μ|

(1)若(t-1)时刻Y 大于其长期均衡解α0 + α1X ,ecm 为正,则(-λecm) 为负,

使得ΔY t 减少;

(2)若(t-1)时刻Y 小于其长期均衡解α0 + α1X ,ecm 为负,则(-λecm) 为正,

使得ΔY t 增大。

(***)体现了长期非均衡误差对的控制。

需要注意的是:在实际分析中,变量常以对数的形式出现。

其主要原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是稳定序列,因此适合于包含在经典回归方程中。

于是:

(1)长期均衡模型

Y t = α0 + α1X t + μt

中的α1可视为Y 关于X 的长期弹性(long-run elasticity)

(2)短期非均衡模型 中的β1可视为Y 关于X 的短期弹性(short-run

elasticity )。

更复杂的误差修正模型可依照一阶误差修正模型类似地建立。

3。误差修正模型的建立

(1)Granger 表述定理

误差修正模型有许多明显的优点:如 a)一阶差分项的使用消除了变量可能存在的趋势因素,从而避免了虚假回归问题; b)一阶差分项的使用也消除模型可能存在的多重共线性问题; c)误差修正项的引入保证了变量水平值的信息没有被忽视; d)由于误差修正项本身的平稳性,使得该模型可以用经典的回归方法进行估计,尤其是模型中差分项可以使用通常的t 检验与F 检验来进行选取。 因此,一个重要的问题就是:是否变量间的关系都可以通过误差修正模型来表述?

就此问题,Engle 与 Granger 1987年提出了著名的Grange 表述定理(Granger representaion theorem):

如果变量X 与Y 是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述:

ΔY t = lagged (ΔY , ΔX ) − λμ

式中,μ

数。 t − 1t − 1 + εt 是非均衡误差项或者说成是长期均衡偏差项, λ是短期调整参

对于(1,1)阶自回归分布滞后模型

如果 Yt~I(1), Xt~I(1) ; 那么 的左边ΔY t ~I(0) ,右边的ΔX t ~I(0) ,因此,只有Y 与X 协整,才能保证右边也是I(0)。

因此,建立误差修正模型,需要首先对变量进行协整分析,以发现变量之间的协整关系,即长期均衡关系,并以这种关系构成误差修正项。然后建立短期模型,将误差修正项看作一个解释变量,连同其它反映短期波动的解释变量一起,建立短期模型,即误差修正模型。

(2)Engle-Granger 两步法

由协整与误差修正模型的的关系,可以得到误差修正模型建立的E-G 两步法:第一步,进行协整回归(OLS 法),检验变量间的协整关系,估计协整向量(长期均衡关系参数);第二步,若协整性存在,则以第一步求到的残差作为非均衡误差项加入到误差修正模型中,并用OLS 法估计相应参数。需要注意的是:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时,对残差项的稳定性检验就无须再设趋势项。另外,第二步中变量差分滞后项的多少,可以残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分的滞后项。

(3)直接估计法

也可以采用打开误差修整模型中非均衡误差项括号的方法直接用OLS 法估计模型。但仍需事先对变量间的协整关系进行检验。

如对双变量误差修正模型

可打开非均衡误差项的括号直接估计下式:

这时短期弹性与长期弹性可一并获得。需注意的是,用不同方法建立的误差修正模型结果也往往不一样。

这是我在查阅各种资料后得出的关于面板数据的总结,最近在做面板的实证论文,所以需要这个,欢迎大家继续扩充,只要是关于面板的都行,关于具体如何在Eviews6中实现的更好,不甚感激。

*横截面的异方差与序列的自相关性是运用面板数据模型时可能遇到的最为常见的问题, 此时运用OLS 可能会产生结果失真, 因此为了消除影响, 对我国东、中、西部地区的分析将采用不相关回归方法( SeeminglyUnrelated

Regression, SUR)来估计方程。而对于全国范围内的估计来说, 由于横截面个数大于时序个数, 所以采用截面加权估计法(Cross SectionWeights, CSW) 。

*一般而言,面板数据可用固定效应(fixed effect) 和随机效应(random effect) 估计方法, 即如果选择固定效应模型, 则利用虚拟变量最小二乘法(LSDV) 进行估计; 如果选择随机效应模型, 则利用可行的广义最小二乘法(FGLS) 进行估计(Greene ,2000) 。它可以极大限度地利用面板数据的优点, 尽量减少估计误差。至于究竟是采用固定效应还是随机效应, 则要看Hausman 检验的结果。

*单位根检验:在进行时间序列的分析时, 研究者为了避免伪回归问题, 会通过单位根检验对数据平稳性进行判断。但对于面板数据则较少关注。随着面板数据在经济领域应用, 对面板数据单位根的检验也逐渐引起重视。面板数据单位根的检验主要有Levin 、Lin 和Chu 方法(LLC 检验) (1992 ,1993 ,2002) 、Im 、Pesaran 和Shin 方法( IPS 检验) (1995 ,1997) 、Maddala 和Wu 方法(MW检验) (1999) 等。

*协整检验:协整检验是考察变量间长期均衡关系的方法。在进行了各变量的单位根检验后, 如果各变量间都是同阶单整,那么就可以进行协整检验了。面板协整检验理论目前还不成熟, 仍然在不断的发展过程中, 目前的方法主要有:

(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF 和ADF 检验提出了检验面板协整的方法, 这种方法零假设是没有协整关系, 并且利用静态面板回归的残差来构建统计量。

(2)Pedron(i1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao 的方法不同的是,Pedroni 的检验方法允许异质面板的存在。

(3)Larsson et a(l2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法。这种检验的方法是检验变量存在共同的协整的秩。

*一般的顺序是:先检验变量的平稳性, 当变量均为同阶单整变量时, 再采用协整检验以判别变量间是否存在长期均衡关系。如果变量间存在长期均衡的关系, 我们可以通过误差修正模型(ECM) 来检验变量间的长期因果关系; 如变量间不存在协整关系, 我们将对变量进行差分, 然后通过向量自回归模型(VAR),检验变量间的短期因果关系。

关于平稳性检验和协整检验、因果检验流程图

同阶单整→协整检验→协整?(YES :EG 两步法 for 长期因果关系;NO :误差修正模型ECM/VEC for 短期因果关系)

平稳?(单位根检验)

非同阶单整→差分使平稳→VAR →Granger 因果检验 for 短期因果关系

关于面板数据模型选择回归与检验流程图

混合 固定(main :个体固定) 随机(main :个体随机) ▏▁▁▁▁▁▁▁▁▁▁▁▁ ▏▁▁▁▁▁▁▁▁▁▁▁▁▁ ▏ ▏先回归估计 ▏先回归估计

↓Cross-section:fixed ↓Cross-section:random F检验 Hausman检验

▏ ▏

H0:混合 H1:个体固定 HO:个体随机 H1:个体固定

--

Output : ▏ ▏

If: If:

F=(Cross-section F Stat.)>Fa(df1,df2) H=(Cross-section Random Stat.)>χ2a(df1)

or Prob.

Then:reject H0,accept H1 Then:reject H0,accept H1

是先做F 检验还是先做Hausman 检验啊;做F 检验的时候,Fixed and Random 、comm 和Cross-section specific 选项应该怎么设置啊;另外我看高铁梅上面对面板的分类有些不同,能说说有啥区别么?

以Eviews6为例,来说明一下面板模型的选择问题:

F 检验是用来在混合模型和固定效应模型中做出选择,而Hausman 检验是用来在固定效应模型和随机效应模型中做出选择,所以不存在孰先孰后的问题;

由于我们通常估计的个体效应而不是时刻效应,所以我们进行回归和检验的时候,Period 选择None 。

回归的时候,具体操作设置如下,

Depedent Variable里填因变量,Common Coefficients里填自变量(包括截距项c ),Cross-Section 视回归需要选择None 、Fixed 、Random ,Period 选择None ,可以依次实现混合回归、个体固定回归、个体随机回归。然后在个体固定回归之后,进行F 检验进行模型选择决策1;在个体随机回归之后,进行Hausman 检验进行模型选择决策2,从而最终得出最佳回归。

用计量模型分析问题的步骤 (2011-04-21 21:09:11)

转载

标签: 分类: 产经知识

最小二

乘法

估计量

变量

随机误

经济计

一、建立一个理论假说。

二、收集数据。

数据的类型有:1、时间序列数据。2、截面数据:一个或多个变量在某一时点上的数据集合。3、面板数据:同一个横截面单位在跨期调查数据。

三、设定数学模型(变量之间是确定性的数量关系)

四、设立经济计量模型(变量之间的关系是不确定的或统计的)。 总体回归函数::Yi=B1+B2Xi+ui,其中ui 是随机误差项。

样本回归函数:Yi=b1+b2Xi+ei ,其中b1是B1的估计量,b2是B2的估计量,ei (残差)是ui 的估计量。

五、估计经济计量模型参数。

普通最小二乘法(OLS )原理:选择参数b1,b2,使得残差平方和最小。

六、检验模型的适用性。

1、古典线性回归模型假设CLRM (只有假定了随机误差项的生成过程,才能判定SRF 对PRF 拟合的好与坏):(1)回归模型是参数线性的。(2)解释变量与扰动误差项u 不相关。(3)给定xi ,扰动项的均值为零。(4)ui 的方差是常数,即同方差。(5)两个误差项之间不自相关,即无自相关。(6)模型设定正确。(7)ui 服从正态分布。以上这些假设保证了估计量是最优线性无偏估计量:(1)一致性。随样本规模趋于无穷,估计量将收敛于他们的真实值。(2)无偏性。平均值等于真实值。(3)有效性。没有其他估计量方差比他小。

2、假设检验(判定回归系数是否是统计显著的,即是否显著不为零)。有两种方法:显著性检验法和置信区间法。假设检验中容易犯两种错误:第一类

错误(拒绝一个真实的H0,发生的概率是a )和第二类错误(实际是错误的,但我们并没有拒绝)。这两类错误是此消彼长的。于是我们有了确切的显著性水平,即P 值。他给出了在拒绝和不拒绝零假设之间无差别时的边际显著性水平。P 值是软件自动提供的,避免了对任意一个显著水平的识别要求。P 值还被用于说明零假设的合理性(P 值越小,零假设越缺乏合理性)。

3、拟合优度。R^2=ESS/TSS。但是存在问题:如果有更多的回归自变量加入回归方程中去,R^2的值永远不会降低。于是引出了调整了的R^2。

4、解释变量之间的多重共线性. 后果:R^2很高,但单个系数确有较大的标准差。诊断:R^2较高但t 值统计量显著的不多;解释变量两两高度相关。补救:删除变量;获取额外的数据或新的样本;重新考虑模型;利用先验信息;变量变换。

5、异方差检验(截面数据):后果:无偏估计量中不再有最小方差。诊断:残差图(ei 与x );怀特检验。补救:加权处理(误差方差与谁成比例)。

6、自相关检验(时间序列):诊断:图形法(ei 与t );d-w 检验。补救:广义最小二乘法(ut=put-1+vt)。

七、 利用模型进行预测


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn