资源预览内容
第1页 / 共35页
第2页 / 共35页
第3页 / 共35页
第4页 / 共35页
第5页 / 共35页
第6页 / 共35页
第7页 / 共35页
第8页 / 共35页
第9页 / 共35页
第10页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
为什么要放宽古典假定?为什么要放宽古典假定?为了不使问题复杂化,在此之前是从所有古典假定都为了不使问题复杂化,在此之前是从所有古典假定都满足的条件下,去讨论计量经济模型的估计与检验的满足的条件下,去讨论计量经济模型的估计与检验的基本理论和方法。基本理论和方法。在这种情况下:在这种情况下: 我们几乎可以直接运用统计学中的现成方法去估计我们几乎可以直接运用统计学中的现成方法去估计模型中的参数,并得到令人满意的结果。模型中的参数,并得到令人满意的结果。 我们也可以直接运用统计学中的假设检验方法对模我们也可以直接运用统计学中的假设检验方法对模型的显著性作各种统计检验。型的显著性作各种统计检验。然而,现实的经济活动是十分复杂的,这些古典然而,现实的经济活动是十分复杂的,这些古典假定经常会违反,我们经常不得不放宽古典假定条件,假定经常会违反,我们经常不得不放宽古典假定条件,需要讨论假定违反以后的一些专门的计量方法。需要讨论假定违反以后的一些专门的计量方法。1基本假定的回顾与分析基本假定的回顾与分析:零均值假定零均值假定( (由于由于 有正有负,一般说来,有正有负,一般说来, 的假的假定是合理的。并且违背的话只是影响截距项,不影响斜率项。)定是合理的。并且违背的话只是影响截距项,不影响斜率项。)同方差假定同方差假定无自相关假定无自相关假定解释变量与解释变量与u不相关的假定不相关的假定 在某些单一方程模型和联立方程模型的特殊情况下可能违反。在某些单一方程模型和联立方程模型的特殊情况下可能违反。无多重共线性假定无多重共线性假定正态性假定正态性假定(不影响OLS估计是BLUE)根据中心极限定理,样本容量无限增大时,根据中心极限定理,样本容量无限增大时,OLSOLS趋于正态分布趋于正态分布结论:结论:需要着重加以讨论的易于违反的主要是需要着重加以讨论的易于违反的主要是无多重共线性、无多重共线性、 同方差、同方差、 无自相关无自相关等假定。等假定。2引子:引子:案例案例1:发展农业和建筑业会减少财政收入吗?发展农业和建筑业会减少财政收入吗?为了分析各主要因素对国家财政收入的影响,建立财政收为了分析各主要因素对国家财政收入的影响,建立财政收入模型入模型: :其中其中: : CSCS财政收入财政收入( (亿元亿元) ) ; ; NZNZ农业增加值农业增加值( (亿元亿元); ); GZGZ工业增加值工业增加值( (亿元亿元);); JZZJZZ建筑业增加值建筑业增加值( (亿元亿元); ); TPOPTPOP总人口总人口( (万人万人);); CUMCUM最终消费最终消费( (亿元亿元); ); SZMSZM受灾面积受灾面积( (万公顷万公顷) ) 数据:样本时期数据:样本时期19781978年年-2003-2003年(资料来源:年(资料来源:中国统计年鉴中国统计年鉴20042004,中国统计出版社中国统计出版社20042004年版)年版) 采用普通最小二乘法得到以下估计结果采用普通最小二乘法得到以下估计结果3财政收入模型的财政收入模型的EViewsEViews估计结果估计结果特别关注:特别关注:1、可决系数;、可决系数;2、F检验;检验;3、t 检验;检验;4、参数符号、参数符号4 可决系数可决系数为为0.9950.995,校正的可决系数为,校正的可决系数为0.9930.993,模型拟合模型拟合很好很好。模型对财政收入的解释程度高达。模型对财政收入的解释程度高达99.5%99.5%。 F F统计量统计量为为632.10632.10,说明,说明0.050.05水平下回归方程水平下回归方程整体上显著整体上显著。 t t 检验检验结果表明,除了工农业增加值和总人口以外,其结果表明,除了工农业增加值和总人口以外,其他因素对财政收入的影响均不显著,他因素对财政收入的影响均不显著,与预想不符合与预想不符合! ! 农业增加值和建筑业增加值的农业增加值和建筑业增加值的回归系数回归系数是负数是负数, , 农业和建筑业的发展农业和建筑业的发展反而会使反而会使财政收入减少吗?财政收入减少吗?! !这样的结果显然与理论分析和实践经验不相符。这样的结果显然与理论分析和实践经验不相符。为什么会出现这样的异常结果?为什么会出现这样的异常结果?如果模型设定和数据真实性没有问题,问题出在哪里呢?如果模型设定和数据真实性没有问题,问题出在哪里呢?模型估计检验结果分析:模型估计检验结果分析:5经济分析:经济分析:天津市粮食销售体制改革中粮食销量逐年增长,天津市粮食销售体制改革中粮食销量逐年增长,分析粮食销量的变化及原因。影响粮食销量的主要因素可能是人分析粮食销量的变化及原因。影响粮食销量的主要因素可能是人口数量、居民收入,以及与粮食相关的肉、蛋、鱼虾销售量等。口数量、居民收入,以及与粮食相关的肉、蛋、鱼虾销售量等。变量选择:变量选择:被解释变量被解释变量 Y Y 粮食年销售量(万吨)粮食年销售量(万吨) 解释变量:常住人口解释变量:常住人口X2X2(万人)、人均收入(万人)、人均收入X3X3(元)、(元)、 肉销售量肉销售量X4X4(万吨)、蛋销售量(万吨)、蛋销售量X5X5(万吨)、(万吨)、 鱼虾销售量鱼虾销售量X6X6(万吨)(万吨)模型设定:模型设定:样本选择:样本选择:选天津市粮食销售体制改革前选天津市粮食销售体制改革前19741974年年19871987年的年的有关数据为样本。有关数据为样本。数据收集:数据收集:来源于天津统计年鉴(来源于天津统计年鉴(19881988) (数据见下页)(数据见下页) 案例案例2 2:天津市粮食销售量及影响因素分析天津市粮食销售量及影响因素分析67估计参数:估计参数:用OLS估计8估计结果:取取 ,查临界值表得,查临界值表得 分析:分析: 样本回归方程的样本回归方程的 较大,较大,F F检验也十分显著检验也十分显著 但是但是所有参数所有参数的的 t t 统计量统计量均小于临界值均小于临界值(不显著)(不显著) X4 X4、X5X5的参数为正,而的参数为正,而X6X6的参数为负,如何解释?的参数为负,如何解释? 为什么也出现这种结果?事不过三为什么也出现这种结果?事不过三,其中必有规律性其中必有规律性!9 一、多重共线性本章讨论四个问题:多重共线性的实质与产生的原因多重共线性的实质与产生的原因多重共线性的后果多重共线性的后果多重共线性的检测(判断)方法多重共线性的检测(判断)方法多重共线性的补救方法多重共线性的补救方法10(一)(一) 什么是多重共线性什么是多重共线性1、多重共线性的概念、多重共线性的概念在在多多元元回回归归模模型型中中,各各个个解解释释变变量量之之间间可可能能存存在在一一定定的的线线性相关关系。可能会有三种情况:性相关关系。可能会有三种情况:能找到不全为0的数 ,使得(正交变量)完全的线性关系完全的线性关系不完全的线性关系不完全的线性关系完全无线性关系完全无线性关系多重共线性多重共线性指解释变量间的线性关系解释变量间的线性关系,既包括完全的线性关系,又包括不完全的线性关系 11对多重共线性的理解应注意:对多重共线性的理解应注意:两个或多个解释变量之间出现线性相关性,都称为两个或多个解释变量之间出现线性相关性,都称为存在多重共线性。存在多重共线性。 在多元回归中,多重共线性几乎总是存在的,因此在多元回归中,多重共线性几乎总是存在的,因此值得关注的多重共线性,主要不是有无的问题,而值得关注的多重共线性,主要不是有无的问题,而是程度的问题。是程度的问题。 无多重共线性只排除解释变量间的线性关系,并不无多重共线性只排除解释变量间的线性关系,并不排除相互之间的非线性关系排除相互之间的非线性关系。122、多重共线性产生的原因、多重共线性产生的原因时间序列数据在时间上常有共同变动的趋势时间序列数据在时间上常有共同变动的趋势 如工业产值、商品零售额、固定资产投资常有共同趋势如工业产值、商品零售额、固定资产投资常有共同趋势经济变量之间本身具有内在联系经济变量之间本身具有内在联系如如截截面面数数据据中中某某行行业业企企业业的的资资本本量量、劳劳动动投投入入等等都都与与企企业业规模相关规模相关某些决定性因素可能使各变量呈同方向的变化某些决定性因素可能使各变量呈同方向的变化如经济景气对各经济指标的同方向影响如经济景气对各经济指标的同方向影响滞滞后后变变量量引引入入模模型型后后,同同一一变变量量的的逐逐次次值值很很可可能能存存在相互联系在相互联系如:如:13 (二)多重共线性产生的后果(二)多重共线性产生的后果1、OLSOLS估计式变得不确定或不精确估计式变得不确定或不精确 (1)完全无多重共线性完全无多重共线性时时各解释变量都分别独立地影响因变量,多元回归是否必要各解释变量都分别独立地影响因变量,多元回归是否必要?以两个解释变量模型为例:以两个解释变量模型为例:当完全无多重共线性时当完全无多重共线性时 则有则有这时这时这正是分别以这正是分别以 和和 为解释变量的一元回归的参数估计为解释变量的一元回归的参数估计式式14(2)解释变量完全线性相关时)解释变量完全线性相关时 OLS 估计式不确定估计式不确定 从偏回归系数意义看从偏回归系数意义看:在:在 和和 完全共线性时,完全共线性时, 将将肯定随肯定随 而变化,将无法保持而变化,将无法保持 不变,去单独考虑不变,去单独考虑 对对Y Y的影响(的影响( 和和 的作用事实上不可区分)的作用事实上不可区分) 从从OLSOLS估计式看:估计式看:可以证明此时可以证明此时 (证明见教材(证明见教材P108P108) (3)解释变量不完全线性相关,但存在高度多重共线性时)解释变量不完全线性相关,但存在高度多重共线性时 此时回归系数可以估计,但方差会变得很大,此时回归系数可以估计,但方差会变得很大,OLS估估计式会不精确(计式会不精确(后面论证后面论证) 152、OLSOLS估计式方差变得很大,标准误差增大估计式方差变得很大,标准误差增大(1)当当 和和 完全线性相关完全线性相关时时OLS估计式的方差估计式的方差 成为成为无穷大无穷大 (证明见教材(证明见教材P109) (2)当)当 和和 不完全线性相关不完全线性相关时时 OLS估计式的估计式的方差方差 会增大会增大,例如在二元回归时可证明(证明见教材例如在二元回归时可证明(证明见教材P110) 当当 增大时,方差扩大因子增大时,方差扩大因子VIF2 增大,增大, 也会增大也会增大 ,思考思考: 当当 时时(与一元回归比较与一元回归比较)当当 时时16例如例如当当 时,引入任意不为时,引入任意不为0的数的数模型变换模型变换估计结果估计结果当当 时,所估计的时,所估计的 的参数与真实的参数与真实 的符号可能相反的符号可能相反(3)当)当多重共线性严重多重共线性严重时,甚至可能使估计的回时,甚至可能使估计的回归系数归系数 符号相反符号相反,得出完全错误的结论,得出完全错误的结论17(4)区间估计时,对总体参数的区间估计时,对总体参数的置信区间会趋于增大置信区间会趋于增大 (共共线线性性越越严严重重, 和和 越越大大,置置信信区区间间也也增大)增大)(5)严严重重多多重重共共线线时时,假假设设检检验验作作出出错错误误判判断断的的概概率率会会增增大大因因为为 ,当当因因多多重重共共线线性性使使方方差差变变大大时时会会使使 t 值值减减小小,导导致致在在无无多多重重共共线线性性时时本应否定的本应否定的“参数为参数为”的原假设而被接受。的原假设而被接受。 18 (三)多重共线性的检验(三)多重共线性的检验(判断是否严重)(判断是否严重)1、利用解释变量之间的相关系数去判断、利用解释变量之间的相关系数去判断(1)只有两个解释变量时:)只有两个解释变量时:用二者相关系数用二者相关系数 判断判断 (2)两个以上解释变量时:)两个以上解释变量时:可用两两变量的相关系数可用两两变量的相关系数 判断判断(K K个变量可用相关系数矩阵)个变量可用相关系数矩阵)例如例如注意注意:简单相关系数只是多重共线性的充分条件,不是必要条件。在简单相关系数只是多重共线性的充分条件,不是必要条件。在有多个解释变量时,较低的相关系数也可能存在较严重多重共线性有多个解释变量时,较低的相关系数也可能存在较严重多重共线性192、直观判断法直观判断法(经验方法)(经验方法)以下情况的出现提示很可能存在多重共线性:以下情况的出现提示很可能存在多重共线性: (1 1)从定性分析认为一些是)从定性分析认为一些是重要的解释变量重要的解释变量,但其但其回归系数的标准误差较大,在回归方程中回归系数的标准误差较大,在回归方程中没有通过没有通过显著性检验显著性检验 (2 2)有些解释变量的回归系数所带)有些解释变量的回归系数所带正负号正负号与定性分与定性分析结果违背析结果违背 (3 3)可决系数较高,可决系数较高,F F检验显著检验显著,但偏回归系数的,但偏回归系数的 t t 检验不显著检验不显著203、方差扩大因子法(容许度)、方差扩大因子法(容许度)多元线性回归模型多元线性回归模型 中,可分别以每个中,可分别以每个解释变量为被解释变量,作与其他解释变量的回归,这称为解释变量为被解释变量,作与其他解释变量的回归,这称为辅辅助回归助回归。以。以 为被解释变量作对其他解释变量的辅助线性回归为被解释变量作对其他解释变量的辅助线性回归为为 辅助回归的辅助回归的可决系数可决系数用用 表示。表示。 原回归方程中解释变量原回归方程中解释变量 的参数估计值的参数估计值 的方差可表示为的方差可表示为(证明从略)(证明从略)其中的其中的 VIFj 是变量是变量 所对应参数估计量的方差扩大因子,也所对应参数估计量的方差扩大因子,也称容许度。称容许度。 21由由越大越大 VIFj 越大越大 多重共线性越严重多重共线性越严重VIFj的大小可以反映解释变量之间存在多重共线性的严重程的大小可以反映解释变量之间存在多重共线性的严重程度。度。优点:优点:可从数量上判断多重共线性的程度可从数量上判断多重共线性的程度 (总是给出了一种经验规则)(总是给出了一种经验规则)经验表明:经验表明: VIFj 10时,也就是时,也就是Rj2 0.9说明该解释变量说明该解释变量与其余解释变量之间有严重的多重共线性。与其余解释变量之间有严重的多重共线性。方差扩大因子的作用方差扩大因子的作用22(四)多重共线性的补救(四)多重共线性的补救1、增加样本容量、增加样本容量多重共线性的后果主要是参数估计量方差变大,例如一元回多重共线性的后果主要是参数估计量方差变大,例如一元回 归中归中 因为式中因为式中 为常数,为常数, 确定后,当样本容量越大时,确定后,当样本容量越大时, 越大,可使越大,可使 减小,从而减轻多重共线性的影响减小,从而减轻多重共线性的影响 注意:注意: 增大样本容量只能减轻多重共线性的影响,不能根本解增大样本容量只能减轻多重共线性的影响,不能根本解 决它,当决它,当 时,仍有时,仍有 增大样本容量有时十分困难,受到数据来源的限制增大样本容量有时十分困难,受到数据来源的限制232、逐步回归法、逐步回归法基本思想基本思想: 设法删除引起多重共线性但又不那么重要的变量。设法删除引起多重共线性但又不那么重要的变量。用逐步回归方法发现产生共线性的解释变量,并将用逐步回归方法发现产生共线性的解释变量,并将其剔除,从而减少多重共线性影响其剔除,从而减少多重共线性影响 方法方法:这既是判断是否存在多重共线性的方法,又是解决这既是判断是否存在多重共线性的方法,又是解决多重共线性的方法,基本思路的框图为多重共线性的方法,基本思路的框图为:(见下页见下页) 存在的问题:存在的问题: 有可能删除重要变量,而引起设定误差!有可能删除重要变量,而引起设定误差! 使用逐步回归剔除变量时要格外小心!使用逐步回归剔除变量时要格外小心!24将Y对各个 分别回归计算各 以 最大的作逐步回归的基础逐个将其他 加入模型回归用F检验检验新加入 的显著性F检验改善不显著F检验改善显著多余变量对先引入的变量的显著性无影响使先引入的变量参数发生明显变化或使 t 检验不显著剔除剔除保留此变量保留此变量出现多重共线性出现多重共线性剔除此变量剔除此变量25(五)案例分析(五)案例分析 中国国内旅游收入的分析中国国内旅游收入的分析研究目的研究目的:中国国内旅游市场发展迅速,需要定量地研究影中国国内旅游市场发展迅速,需要定量地研究影响中国国内旅游市场发展的主要原因。经分析,可以旅游响中国国内旅游市场发展的主要原因。经分析,可以旅游收入表示旅游市场发展,除了国内旅游人数和旅游支出外,收入表示旅游市场发展,除了国内旅游人数和旅游支出外,还可能与旅游基础设施有关。还可能与旅游基础设施有关。模型设定:模型设定:其中:其中:第第 t年全国旅游收入年全国旅游收入 国内旅游人数(万人)国内旅游人数(万人) 城镇居民人均旅游支出城镇居民人均旅游支出 (元)(元) 农村居民人均旅游支出农村居民人均旅游支出 (元)(元) 公路里程(万公里)公路里程(万公里) 铁路里程(万公里)铁路里程(万公里) 2619942003年的统计数据年的统计数据 27OLS回归结果28结果分析该模型该模型 , 可决系数很高可决系数很高,F检验检验值值173.3525,173.3525,明显显著。但是当明显显著。但是当 时时, , 不仅不仅 、 系数的系数的t检验不检验不显著,而且显著,而且 系数的符号与预期的相反,这表明很系数的符号与预期的相反,这表明很可能存在严重的多重共线性可能存在严重的多重共线性。各解释变量的相关系数各解释变量的相关系数 各解释变量相互之间的相关系数较高,证实确实存在严重多各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性重共线性。29用方差扩大因子法检验例如作例如作X3对对X2、X4、X5、X6的辅助回归得的辅助回归得方差扩大因子为:方差扩大因子为:由于由于 ,根据经验,说明,根据经验,说明X3与其与其他解释变量间有严重多重共线性。他解释变量间有严重多重共线性。其他变量间的多重共线性可用类似方式检验。其他变量间的多重共线性可用类似方式检验。30修正多重共线性修正多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。采用逐步回归的办法,去检验和解决多重共线性问题。分别作分别作Y对对X2、X3、X4、X5、X6的一元回归。的一元回归。一元回归结果:一元回归结果:加入加入X3X3的方程的方程最大最大, ,以以X3X3为基础,顺次加入其他变量逐步回归为基础,顺次加入其他变量逐步回归 31加入新变量回归结果(一)加入新变量回归结果(一)新加入新加入X5X5的方程的方程,改进最大改进最大, 且且 t 检验显著检验显著保留保留X5X5,再加入其他新变量逐步回归,再加入其他新变量逐步回归 32加入新变量的回归结果(二)加入新变量的回归结果(二)在在X3X3、X5X5基础上加入基础上加入X4X4后的方程后的方程 明显增大,而且各个参数明显增大,而且各个参数t t检验都显著。加入检验都显著。加入X2X2后不仅后不仅 下降,而且下降,而且X5X5参数的参数的t t检验变得检验变得不显著;加入不显著;加入X6X6后不仅后不仅 下降,下降,X6X6参数的参数的t t检验不显著,甚至检验不显著,甚至X6X6的符号也变得不合理。保留的符号也变得不合理。保留X4X4,再加入其他新变量逐步回归,再加入其他新变量逐步回归 33加入新变量的回归结果(三)加入新变量的回归结果(三)加入加入X2X2后后 没有改进没有改进, ,而且而且X2X2参数的参数的t t检验不显著。加入检验不显著。加入X6X6后虽然后虽然 略有改进,但略有改进,但X6X6参数的参数的t t检验不显著,并且参检验不显著,并且参数为负值不合理。这说明数为负值不合理。这说明X2X2、X6X6引起较严重多重共线性,引起较严重多重共线性,应予剔除。应予剔除。34修正严重多重共线性影响后的回归结果修正严重多重共线性影响后的回归结果t=(-8.2537)(3.9502)(3.0633)(4.6945) F=231.7958 DW=1.9520存在的问题存在的问题: 1、样本容量过小、样本容量过小, 自由度太小(自由度太小(n-k)=10-4=6, 其可靠性其可靠性受到影响。受到影响。 2、剔除的、剔除的X2、X6有可能是重要变量。有可能是重要变量。35
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号