第十章短面板-－金锄头文库

第十章短面板, 第十章短面板一、面板数据的特点面板数据或平行数据 panel data or longitudinaldata) 指的是在一段时间内跟踪同一组个体Cindividual) 的数据。它既有横截面的维度 n个个体) ，又有时间维度IT个时间) 。通常的面板数据T较小而a较大，这种面板数据称为短面板short panel) 。反之，如果了长大而x檬小，则称为长面板long panel) 。在面板模型中，如果解释变量包含被解释变量的滞后值，则称为动态面板 dynamic panel) 。反之，则称为静态面板 static paneD) 本章介绍静态的短面板，下一章介绍长面板与动态面板。如果在面板数据中，每个时期在样本中的个体完全一样，则称为平衡面板数据 balanced panel反之，则称为非平衡面板数据 unbalanced paneb面板数据的主要优点如下:(1)可以解决遗漏变量问题。遗漏变量偏差是一个普遍存在的问题。里然可以用工具变量法解闷，但有效的工具变量常常很难找。遗漏变量常常是由于不可观测的个体差异或异质性heterogeneity% 造成的如果这种个体差异不随时间而改变，则面板数据提供了解决遗漏变量问题的又一利器。 (提供更多个体动态行为的信息。由于面板数据同时有横截面与时间两个维度，有时它可以解决单独的截面数据或时间序列数据所不能解决的问题。如，考虑如何区分规模效应与技术进步对企业生产效率的影响。对于截面数据来说，由于没有时间维度，故无法观测到技术进步，然而，对于单个企业的时间序列数据来说，我们无法区分其生产效率 :的提高究竟有多少是由于规模扩大，有多少是由于技术进步。上忆又比如，对于失业问题，截面数据能告诉我们在某个时点上哪些人失业，而时间序列数据能告诉我们某个人就业与失业的历史，但这两种数据均无法告诉我们，是否总是同一批人在失业意味着低流转率) ，还是失业的人群总在变动意味着高流转率)如果有面板数据，就可能解决上述问题。(3)样本容量绞大。由于同时有截面睹度与时间维度通常面板数据的样本容量更大，从而可以提高估计的精确度当然，面板数据通常不满足独立同分布的假定，因为同一个体在不同期的扰动项一般存在自相关二、估计面板数据模型的策略目计面板数据模型的一个极端策略是将其看成是截面数据而进行混合回归 pbooled tregression) ，即要求样本中每个个体都拥有完全相同的回归方程。另一极端策略则是，机汪虽个单独的下归方程。前者名略了个体问不可观测或该遗漏的异质性 (让入了入动硕) ，而该异质性可能与解释变量相关从而导致估计不一致。后者则包略了个体间的共性因此，在实践中常采用折中的估计策略，即假定个体的回归方程拥有相同的斜率，但可以有不同的截距项，以此来捕捉异质性。这种模型称为个体效应模型 (individual-specific_ effects modelD) ，即yi一XU8TZOTUT二Si=1 Di 全1 ，T)其中，z为不随时间而变的个体特征 (即交二崔比如性别，而xi可Cu十s) 两部分构以随个体及时间而变。扰动项由成，称为复合扰动项 composite ertor term) ，其，不可观测的随机变量 u是代表个体异质性的截距项。&为随个体与时间而改变的扰动项。假设 ss 为独立同分布的，且与u不相关。如果u与某个解释变量相关，则进一步称之为固定效应模型(Fixed Effects Model，简记为FE) 。固定效应这个名词容易引起误解。因为即使在固定效应模型中，个体效应u也是随机的尽管其取值不随时间而变) ，而非固定的第歼。当u与某个解释变量相关，即固定效应模型下，OLS是不一致的，解决的方法是将模型转换，消去ui后获得一致估计量。如果uj与所有解释变量xi， z) 均不相关，则称之为随机效应模型Random Effects Model ，简记为RE) 。从经济理论的角度来看，随机效应模型比较少见，因为一般来说，不可观测的异质性通常会对解释变量产生影响。须通过检验来确定是 F逊是 RE 三、混合回归如果所有个体都拥有完全一样的回归方程，则方程yi一x+Z6+Tu二el 雹1，DJ 可与为:yi ovBHE9TS 其中，xi不包括常数项。这样，就可以把所有数据放在一起，像对待横截下数据那样进行OLS回归，故称为混合回归 pooledTegression) 。由于面板数据的特点，虽然通常可以假设不同个体之间的扰动项相互独立，但同一个体在不同时期的扰动项之间往往存在自相关。此时，对标准差的估计应该使用聚类稳健的标准竹 clusterrobuststandard error) ，而所谓聚类就是由每个个体不同时期的所有观测值所组成。同一聚类个体) 的观测值人多许存在相关性，而不同聚类个体) 的观测值则不相关。互互