资源预览内容
第1页 / 共84页
第2页 / 共84页
第3页 / 共84页
第4页 / 共84页
第5页 / 共84页
第6页 / 共84页
第7页 / 共84页
第8页 / 共84页
第9页 / 共84页
第10页 / 共84页
亲,该文档总共84页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第五章 异 方 差 性,引子:更为接近真实的结论是什么?,根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下: (291.5778) (0.644284) t =(-1.931062) (8.340265) 式中: Y表示卫生医疗机构数(个) X表示人口数量(万人)。,真的不到2000人(1860人)就需要一个医疗机构吗?,人口数量对应参数的标准误差较小 t 统计量远大于临界值 可决系数和修正的可决系数结果较好 F检验结果明显显著 表明该模型的估计效果不错,即可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。 然而,这里得出的结论可靠吗?平均说来每增加1万人口真的需要增加这样多的医疗机构吗?所得结论好象并不符合实际情况。 有什么充分的理由说明这一回归结果不可靠呢?如果这一结论不可靠,更为接近真实的结论又是什么呢?,第五章异方差性,本章将讨论四个问题: 异方差的实质和产生的原因 异方差产生的后果 异方差的检测方法 异方差的补救,第一节 异方差性的概念,一、 异方差的实质,同方差(Homoscedasticity)的含义 同方差性:对所有的 有: 因为方差是度量被解释变量 的观测值围绕条件期望 的分散程度,因此同方差性指的是所有观测值围绕回归线的分散程度相同。,同方差性的图示,当只有一个解释变量时,异方差性含义 模型中的随机扰动项主要代表两方面的影响: (1)被模型忽略的其他变量对被解释变量的影响 (2)测量误差的影响 实际上随机扰动代表的两方面因素有可能随 的 变化而变化,使随机扰动的方差也随 的变化而 变化,这种情况称为存在异方差性,表现为 对比同方差时为 异方差可看成是由于某个解释变量的变化而引起的,则,异方差性的图示,当只有一个解释变量时,异方差一般可归结为三种类型:,(1)单调递增型: i2随X的增大而增大; (2)单调递减型: i2随X的增大而减小; (3)复 杂 型: i2与X的变化呈复杂形式。,(1)模型中缺失了某些解释变量 服装需求函数模型 服装需求量为被解释变量,收入、服装价格和其他商品价格为解释变量,于是有: i=1,2,n 在该模型中,气候因素没有包括在解释变量中,其影响被包含在随机误差项中。如果该项影响构成随机误差项的主要部分,则可能出现异方差性。 为什么?,实际经济问题中的异方差性,解释: 对于不同的样本点,即对于不同的收入的消费者,由于气候变化带来的对服装需求量的影响是不同的。高收入者在气候变化时可以拿出较多的钱购买服装以适应气候的变化,而低收入者的适应能力则很有限。于是不同收入的消费者的服装需求量偏离均值的程度是不同的,也就是说不同收入的消费者的服装需求量具有不同的方差,这就产生了异方差性。更进一步分析,在这个例子中,随机误差项的方差是随着解释变量(收入)的观测值的增大而增大。 单调递增型,(2)样本数据的观测误差,例如,以绝对收入假设为理论假设、以截面数据作样本建立居民消费函数: Ci= 0+1Ii+i 将居民按照收入等距离分成n组,取组平均数为样本观测值。,居民消费模型,一般情况下:居民收入服从正态分布,处于中等收入组中的人数最多,处于两端收入组中的人数最少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的增大而先减后增。 如果样本观测值的观测误差构成随机误差项的主要部分,那么对于不同的样本点,随机误差项的方差随着解释变量观测值的增大而先减后增(即U型考虑到收入的正态分布),出现了异方差性。 单调递增递减型,以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3eI 产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。,由于每个企业所处的外部环境(宏观经济政策等等)对产出量的影响程度不同,造成了随机误差项的异方差性。,企业生产函数模型(截面数据易产生异方差),这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,为复杂型的一种。,二、 产生异方差性的原因,从模型中略去的变量随列入模型的解释变量 的变化, 也呈现规律性的变化,导致 随 而变化 模型设定不恰当产生的异方差。如果一些重要变量被忽 略,或把非线性模型设为线性,可能导致异方差 统计测量误差导致的异方差 测量误差可能随解释变量X的增大而增大 截面数据中总体各单位的差异 一般说异方差性在截面数据中比在时间序列数据中更常出现 原因:同一时点不同对象的差异(如某年各省的GDP) 一般大于 同一对象不同时间的差异(同一个省不同年份的GDP) 注意:在经济结构发生较大变化时,时间序列也常存在异方差,第二节 异方差性的后果,存在异方差时,OLS估计仍然是无偏估计,但是 一、 OLS估计式不再具有最小方差特性 后面将证实,存在异方差时,可证明能够找到比OLS 的方差 更小的估计方法。表明OLS估计式的方差不一定是最小的, 即OLS估计式虽然无偏,但不一定是最佳的。 二、 解释变量的显著性检验失效 1. 参数方差的确定会有困难 ,例如一元回归时 可证明异方差时 (证明见下页) 未知, 不再是常数,也不能再用 去估计,事实上 难以确定。,异方差和自相关对方差的影响,对于,见教材P37(2.36),在异方差且自相关时 在同方差且无自相关时 在异方差但无自相关时 在同方差但自相关时,在异方差但无自相关时 设存在异方差时的参数为 ,估计式为 例如为 存在异方差时,用OLS估计的 的方差为: 因为 所以有 注意: 是不存在异方差时 的方差, 具有效性(最小方差性), 则不具有有效性。,2.如果仍然用不存在异方差性时的OLS方式估计其方差,即用 所估计的方差,可能会低估或高估存在异方差时的的真实方差。 后果: 低估或高估 ,也就会高估或低估 t 统计量,用t检验对参数统计显著性的检验失去意义。,尽管参数的OLS估计量仍然无偏,并且基于此的预 测也是无偏的,但是 由于异方差的存在, 的方差增大或缩小,Y的预测 区间会偏大或偏小。 由于 难以确定,Y的方差也难以确定,Y置信 区间的确定事实上会出现困难 在 是 无偏估计的证明中用到 了 的同方差性假定,由于存在异方差性,使得 是有偏的,在此基础上的区间估 计和假设检验都将不可靠。,3. 预测精度降低,区间预测面临困难,1、检验方法的共同思路,由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。 问题在于用什么来表示随机误差项的方差,第三节 异方差性的检验,一般的处理方法:,一. 图形分析法 基本思想: 异方差性的表现是 的方差随某个解释变量的变化而变化,或Y的分散程度随X的变化而变化。因此可利用 的代表 与某解释变量的散布图,观察是否存在异方差及其异方差的形式。 具体方法: 假定不存在异方差,进行回归,并计算剩余平方 ,描绘 与 的散点图,作出近似判断。 分析Y与X的相关图形,也可以初略地看到Y的离散程度与X之间是否有相关关系。,用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图,其中用 表示农村家庭消费支出, 表示家庭纯收入。,Y与X之间图形举例:,二、 Goldfeld-Quandt 检验(GQ检验) 作用:检验递增性(或递减性)异方差。 基本思想: 将观测值按 的大小顺序排列 去掉中间位置的一部分 观测值,从而把观测值分 为前后两部分 (目的是提高分辨性),将前后两部分分别作回归,分别计算出各部分剩余 , 比较前后两个回归的剩余平方和 : 如果两个 之比接近于1,为同方差; 如果两个 之比不同于1,为异方差 前提条件: 样本容量较大 服从正态分布,并除异方差外满足其他基本假定,递增性(或递减性)异方差,具体步骤: 排序:将观测值按解释变量X大小顺序排列 数据分组:去掉中间的C个(约1/4)观测值,分别进行前后两部分 个观测值的回归 提出假设:分别进行前后两部分回归的基础上,提出检验假设: 是同方差(前后两部分方差无显著差异), 即 是异方差(方差随X递增或递减) 如为递增 如为递减,构造F统计量: 1. 若方差随X递增 统计量 F服从第一、二自由度均为 的F 分布。 判断: 查表得F临界值 若 (临界值),说明后部分比前部分显著大,就拒绝 (同方差) ,即接受存在异方差性 若 (临界值),说明后部分比前部分不显著大,就接受 ,认为是同方差性,2. 如果方差随X递减 统计量 F服从第一、二自由度均为 的F 分布。 判断:查表得F临界值 若 (临界值),说明前部分比后部分显著大, 就拒绝 (同方差) ,即接受存在异方差性 若 (临界值),说明前部分比后部分不显著大, 就接受 ,认为是同方差性,要求大样本 异方差的表现既可为递增型,也可为递减型 检验结果与选择数据删除的个数c的大小有关 只能判断异方差是否存在,在多个解释变量的情况下,对是哪一个变量引起异方差的判断存在局限。,Goldfeld-Quandt 检验的特点,三、 White检验 基本思想: 如果存在异方差,其方差 与某解释变量有关系。在不知道关于异方差的任何先验信息时,在大样本的情况下,将OLS估计后的残差平方对解释变量的各种形式(如常数、解释变量、解释变量的平方及其交叉乘积等)构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。,例如两个解释变量的模型中 设 与 的关系为如下辅助回归: 但一般 未知,可用原模型回归剩余 作为 的 估计值,进行以上辅助回归。在大样本情况下寻求 能确定分布的统计量,判断 的变化是否与解释 变量有关 (当有K个解释变量时,可作类似的含两两交互的辅 助回归),其中 为随机误差项。,1.估计原模型并计算 用OLS法估计原模型,计算残差 ,并求残差的平方 。生成新变量 2.求辅助函数 用残差平方 作为异方差 的估计,并建立对 的辅助回归,即,检验的基本步骤:,并计算辅助回归的,3.提出假设 4.计算统计量 为样本容量, 为辅助回归可决系数 在大样本情况下可以证明,在零假设成立下, 服从自由度为5的 分布,即,5.检验 给定显著性水平 ,查 分布表得临界值 ,如果 , 不合理,则拒绝原假设 ,即认为模型中随机误差存在异方差 。 如果 则不拒绝 ,即认为模型中随机误差是同方差。, 要求为大样本 不仅能够检验异方差的存在性,同时在多变量的 情况下,还能判断出是哪一些变量引起的异方差。,White检验的特点,怀特(White)检验,以二元模型为例,在同方差假设下,辅助回归可决系数,渐近服从,辅助回归解释变量的个数,建立辅助回归模型,四、 ARCH检验 什么是ARCH(autoregressive conditionanl helecosecdasticity自回归条件异方差)过程? 即 p为ARCH过程的阶数,并且 为随
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号