分位数回归张晓峒-－金锄头文库

1第第 15 章章分位数回归模型分位数回归模型15.1 总体分位数和总体中位数 15.2 总体中位数的估计 15.3 分位数回归 15.4 分位数回归模型的估计 15.5 分位数回归模型的检验 15.6 分位数的计算与分位数回归的 EViews 操作 15.7 分位数回归的案例分析以往介绍的回归模型实际上是研究被解释变量的条件期望。人们当然也关心解释变量与被解释变量分布的中位数，分位数呈何种关系。这就是分位数回归，它最早由 Koenker 和 Bassett(1978)提出，是估计一组回归变量 X 与被解释变量 Y 的分位数之间线性关系的建模方法。正如普通最小二乘 OLS 回归估计量的计算是基于最小化残差平方和一样，分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化，其中，中位数回归运用的是最小绝对值离差估计(LAD，least absolute deviations estimator)。它和 OLS 主要区别在于回归系数的估计方法和其渐近分布的估计。在残差检验、回归系数检验、模型设定、预测等方面则基本相同。分位数回归的优点是，（1）能够更加全面的描述被解释变量条件分布的全貌，而不是仅仅分析被解释变量的条件期望（均值），也可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计量常常不同，即解释变量对不同水平被解释变量的影响不同。另外，中位数回归的估计方法与最小二乘法相比，估计结果对离群值则表现的更加稳健，而且，分位数回归对误差项并不要求很强的假设条件，因此对于非正态分布而言，分位数回归系数估计量则更加稳健。15.1 总体分位数和总体中位数总体分位数和总体中位数在介绍分位数回归之前先介绍分位数和中位数概念。对于一个连续随机变量 y，其总体第分位数是 y()的定义是：y 小于等于 y()的概率是，即 = P( y y() = F(y()其中 P()表示概率，F(y() 表示 y 的累积（概率）分布函数(cdf)。比如 y(0.25) = 3，则意味着 y 3 的概率是 0.25。且有y() = F-1(y()即 F(y()的反函数是 y()。当 =0.5 时，y() 是 y 的中位数。= 0.75 时，y() 是 y 的第 3/4 分位数， = 0.25 时，y() 是 y 的第 1/4 分位数。若 y 服从标准正态分布，y(0.5) = 0，y(0.95) =1.645，y(0.975) =1.960。另外，如果随机变量 y 的分布是对称的，那么其均值与中位数是相同的。当其中位数小于均值时，分布是右偏的。反之，分布是左偏的。对于回归模型，被解释变量 yt对以 X 为条件的第分位数用函数 y()tX 表示，其含义是：以 X 为条件的 yt小于等于 y()tX 的概率是。这里的概率是用 yt对 X 的条件分布计算的。且有2y()tX = F-1(y()tX)其中 F(y()tX) 是 yt在给定 X 条件下的累积概率分布函数(cdf)。则 y()tX 称作被解释变量 yt对 X 的条件分位数函数。而 F (y()tX)= f (y()tX)则称作分位数概率密度函数。其中 F(y()tX)表示 F(y()tX)对 y()tX 求导。15.2 总体中位数的估计总体中位数的估计在介绍分位数回归之前，先来看中位数的估计和中位数回归。下面以连续变量为例介绍定理 15.1。定理 15.1连续变量用 y 表示，其概率密度函数用 f(y)表示，累计概率密度函数用 F(y)表示，y 的中位数用 y(0.5)表示，则 y 与任一值的离差绝对值的期望以 = y(0.5) 时为最小。)(yE证明：=)(yEdyyfydyyfy)()()()(- - = (15.1)()()()(- -ydFyydFy 根据莱布尼兹公式，若，则有。令，dyyfFba),()(dyyfFba),()(-),(yyf则有。运用于式（15.1），得babadydyyF-)-()(=)(tyE dyyfydyyfy)()()()( -)(-)( -ydFydF= 1-)(2)(-(1-)( )(-1-)( -FFFydFF式（15.1）求极小的一阶条件是= 0，即=0，。这意味着等)(tyE1-)(2F0.5)(F于中位数 y(0.5)。 = y(0.5)与定理 15.1 等价的表述是以 = y(0.5)（中位数）时为最小。因此，中位数回归估y计量可以通过最小绝对离差法（least absolute deviation, LAD）估计。其中 X 和分别为(k1)阶列向量。同理，对于线性回归模型 yt = X + ut，通过求最小，估计的中位数回归(0.5)Xty系数估计量，从而得到 yt的中位数回归估计量。(0.5)(0.5)5 . 0()(XX ty15.3 分位数回归分位数回归 Koenker 和 Bassett(1978)证明，若用表示 yt的分位数回归估计量，则对于以检查函数ty)(（check function）w为权数，yt 对任意值的加权离差绝对值和只有在 =时tywty)(3取得最小值。其中= (15.2)tyw)()(1 (: TyttTyitiiyy(0, 1)。据此，分位数回归可以通过加权的最小绝对离差和法（weighted least absolute deviation, WLAD）进行估计。根据式(15.2)，对于线性回归模型 yt = X + ut，求第分位数回归方程系数的估计量的方法是求下式（目标函数）最小，)( TutTutttuuQ0)( 0)()()()1 (15.3) TXyttTXyttttyy)()(:)( :)()()(1 ( XX其中表示第分位数回归方程对应的残差。(0, 1)。第分位数的回归方程表达式是tu)(=ty)()(X其中 X，都是 k1 阶列向量。称作分位数回归系数估计量，或最小绝对离差和估计量，估)(计方法称作最小绝对离差和估计法。当=0.5 时，式（15.3）变为 TttTXyttTXyttyyyQtt1)0.5( :)0.5( :)0.5(0.5)(0.5)(0.5)0.5()0.5(XXX=称作中位数回归方程，称作中位数回归系数估计量。ty)0.5()0.5(X)0.5(一旦得到估计的分位数回归方程，就可以计算分位数回归的残差。tu)(-ttttyyyu)()()(X对一个样本，估计的分位数回归式越多，对被解释变量 yt条件分布的理解就越充分。以一元回归为例，如果用 LAD 法估计的中位数回归直线与用 OLS 法估计的均值回归直线有显著差别，则表明被解释变量 yt的分布是非对称的。如果散点图上侧分位数回归直线之间与下侧分位数回归直线之间相比，相互比较接近，则说明被解释变量 yt的分布是左偏倚的。反之是右偏倚的。对于不同分位数回归函数如果回归系数的差异很大，说明在不同分位数上解释变量对被解释变量的影响是不同的。15.4 分位数回归模型的估计分位数回归模型的估计由于目标函数（15.3）不可微，因此传统的对目标函数求导的方法不再适用。估计分位数回归方程参数的一种较好的方法是线性规划方法。)(基于 Barrodale 和 Roberts (1973，以下简写为 BR)提出的单纯形法(simplex algorithm)， Koenker 和 DOrey(1987)提出一种估计分位数回归系数的方法。EViews 中应用的是上述算法的4改进形式。 BR 算法由于其非有效性和大样本下的一些非优良特性曾备受批评。Koenker 和 Hallock(2001) 以及 Portnoy 和 Koenker(1997)通过模拟证实，与内点法(interior point method)等替代方法相比，BR 算法的估计次数往往较多，大约是样本容量的平方次数。然而，改进的 BR 算法的估计次数在一定程度上是可以接受的，大约是样本容量的线性倍次数，在实际中是可以使用的。分位数回归方程的 BR 算法原理略。下面讨论分位数回归系数估计量的渐近分布。在弱条件下，分位数回归系数渐近服从正态分布(Koenker, 2005)。回归系数的方差协方差矩阵的计算在分位数回归的系数估计中占有重要位置。其方差协方差矩阵的估计方法根据分位数密度函数是否与解释变量相关分为三种方法：误差项独立同分布(i.i.d.)假设下的直接估计方法。由 Koenker 和 Bassett(1978)提出。误差项独立但不同分布(i.n.i.d.)条件下的直接估计方法。误差项独立同分布(i.i.d.)和独立但不同分布(i.n.i.d.)条件下都可使用的自举法。（1）独立同分布假设下的参数渐近分布）独立同分布假设下的参数渐近分布 Koenker 和 Bassett(1978)在独立同分布假设下得出分位数回归系数渐近服从正态分布，可以表述为在弱条件下： (15.5)()()(n)1 (, 0(12)(JsN其中(15.6)(lim)(limTXX TXXJ niiin (15.7)(/1)(11)(FfFs其中 s() 称为稀疏函数(Sparsity function)或分位数密度函数(quantile density function)。s()是分位数函数的导数，或在第分位数条件下概率密度函数的倒数(见 Welsh,1988)。另外，模型误差项独立同分布假设意味着 s()与解释变量 X 无关，因此，分位数方程只和 X 在局部期间相关，即所有的条件分位数平面互相平行。事实上，式(15.5)中的就是误差项独立同)1 (12)(Js分布假设下解释变量的回归系数估计量的渐近方差协方差矩阵表达式，而代表的是2)()1 (s一般回归方程中随机误差项的方差。误差项独立同分布假设下，分位数回归参数估计量的渐近方差协方差矩阵表达式中含有 s()，但 s() 是未知分布的函数，而且必须要估计。 EViews 提供了三种估计 s()的方法。两种是基于 Siddiqui(1960)的方法分别提出的差分商方法(Siddiqui Difference Quotient)（Koenker(1994)以及 Bassett 和 Koenker(1982)），一种是核密度（Kernel Density）估计法。简述如下： Siddiqui 差分商法：差分商方法是用实际的分位数函数构造一个简单的差分商，从而求得 s()的估计量，表达式如下：(15.8) nnn hhFhFs2)()( )( 115其中带宽 hn随着样本容量 n而趋向于 0。要计算 ()需要做两件事，一是得到分位数函数在两个点上的值，二是确定带宽。EViews 中提供了两种