资源预览内容
第1页 / 共123页
第2页 / 共123页
第3页 / 共123页
第4页 / 共123页
第5页 / 共123页
第6页 / 共123页
第7页 / 共123页
第8页 / 共123页
第9页 / 共123页
第10页 / 共123页
亲,该文档总共123页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第四章 其他回归方法 本本章章讨讨论论加加权权最最小小二二乘乘估估计计,异异方方差差性性和和自自相相关关一一致致协协方方差差估估计计,两两阶阶段段最最小小二二乘乘估估计计(TSLS),非非线线性性最最小小二二乘乘估估计计和和广广义义矩矩估估计计(GMM)。这这里里的的大大多多数数方方法法在在第第十十二二章章的联立方程系统中也适用。的联立方程系统中也适用。 本章中某些估计方法中含有本章中某些估计方法中含有AR和和MA误差项,这些概念误差项,这些概念将在第五章中深入介绍。将在第五章中深入介绍。 瞪烯困演份狭波较搐含割棚罕忍驻罕撤酿饱窿属扣鸣阳砾笑牲泳愈讯僚十第04章其他回归方法第04章其他回归方法1 线性回归模型的基本假设线性回归模型的基本假设线性回归模型的基本假设线性回归模型的基本假设 i = 1 , 2 , , N 在在普普通通最最小小二二乘乘法法中中,为为保保证证参参数数估估计计量量具具有有良良好好的的性性质质,通常对模型提出若干基本假设:通常对模型提出若干基本假设: 1解释变量之间互不相关;解释变量之间互不相关; 2随机误差项具有随机误差项具有0均值和同方差。即均值和同方差。即 i = 1 , 2 , , N 即随机误差项的方差是与观测时点即随机误差项的方差是与观测时点t无关的常数;无关的常数; 3不同时点的随机误差项互不相关(序列不相关),即不同时点的随机误差项互不相关(序列不相关),即 s 0, i = 1 , 2 , , N 蝶掘斡厅烈利傀焙纪狮疙熟援置棠皇敖挡脾瞥餐巡辰鬼煤锻率芯恢众橇骇第04章其他回归方法第04章其他回归方法2 当随机误差项满足假定当随机误差项满足假定1 4时,将回归模型时,将回归模型”称为称为“标准回归模型标准回归模型”,当随机误差项满足假定,当随机误差项满足假定1 5时,将回归时,将回归模型称为模型称为“标准正态回归模型标准正态回归模型”。如果实际模型满足不了。如果实际模型满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型。法来估计模型。 5随机误差项服从随机误差项服从0均值、同方差的正态分布。即均值、同方差的正态分布。即 i = 1 , 2 , , N 4随机误差项与解释变量之间互不相关。即随机误差项与解释变量之间互不相关。即 j = 1 , 2 , , k , i = 1 , 2 , , N 秀嚣骡虽束噶拧番粗狰选缕翅财茂啤掘蛰世鼻奖揖减苟锣炭返鸯蛊议杉剐第04章其他回归方法第04章其他回归方法3 古古典典线线性性回回归归模模型型的的一一个个重重要要假假设设是是总总体体回回归归方方程程的的随随机机扰扰动动项项 ui 同同方方差差,即即他他们们具具有有相相同同的的方方差差 2。如如果果随随机机扰扰动动项项的的方方差差随随观观测测值值不不同同而而异异,即即ui 的的方方差差为为 i2,就就是是异异方方差差。用用符号表示异方差为符号表示异方差为E(ui2) = i2 。 异异方方差差性性在在许许多多应应用用中中都都存存在在,但但主主要要出出现现在在截截面面数数据据分分析析中中。例例如如我我们们调调查查不不同同规规模模公公司司的的利利润润,会会发发现现大大公公司司的的利利润润变变化化幅幅度度要要比比小小公公司司的的利利润润变变化化幅幅度度大大,即即大大公公司司利利润润的的方方差差比比小小公公司司利利润润的的方方差差大大。利利润润方方差差的的大大小小取取决决于于公公司司的的规规模模、产产业业特特点点、研研究究开开发发支支出出多多少少等等因因素素。又又如如在在分分析析家家庭庭支支出出模模式式时时,我我们们会会发发现现高高收收入入家家庭庭通通常常比比低低收收入入家家庭庭对对某某些些商商品品的的支出有更大的方差。支出有更大的方差。4.1 4.1 异方差异方差异方差异方差 举侯葡娄呛吕流揪藉拨复奴静吱傅呕狗呼恕减妈旅脑饮茄愉截园帛屡排涯第04章其他回归方法第04章其他回归方法4 变量变量可支配收入可支配收入 交通和通讯支出交通和通讯支出变量变量可支配收入可支配收入交通和通讯支出交通和通讯支出 地区地区INCUM地区地区INCUM 甘甘 肃肃 山山 西西 宁宁 夏夏 吉吉 林林 河河 南南 陕陕 西西 青青 海海 江江 西西黑龙江黑龙江内蒙古内蒙古 贵贵 州州 辽辽 宁宁 安安 徽徽 湖湖 北北 海海 南南4009.614098.734112.414206.644219.424220.244240.134251.424268.504353.024565.394617.244770.474826.364852.87159.60137.11231.51172.65193.65191.76197.04176.39185.78206.91227.21201.87237.16214.37265.98新新 疆疆 河河 北北四四 川川山山 东东广广 西西湖湖 南南重重 庆庆江江 苏苏云云 南南福福 建建天天 津津浙浙 江江北北 京京上上 海海广广 东东5000.795084.645127.085380.085412.245434.265466.576017.856042.786485.637110.547836.768471.988773.108839.68212.30270.09212.46255.53252.37255.79337.83255.65266.48346.75258.56388.79369.54384.49640.56表表表表1 1 中国中国中国中国19981998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出 单位:元单位:元单位:元单位:元消汝骋妖帛习套史裳衡班生半妻烩楔惟毕扯捣蓟巫闻肉盟掂拧锚监渭妆棠第04章其他回归方法第04章其他回归方法5 例例例例4.14.1:我我们们研研究究人人均均家家庭庭交交通通及及通通讯讯支支出出( (cum) )和和可可支支配配收收入入( (in) )的关系,考虑如下方程的关系,考虑如下方程: cumi= 0 + 1ini + ui 利用普通最小二乘法,得到如下回归模型利用普通最小二乘法,得到如下回归模型: cumi= -56.917+ 0.05807 ini (4.1.4) (-1.57) (8.96) R2=0.74 D.W.=2.008解寇疟肚浚垮鸳粉恶奉骗盆蛆非吗涵桥龚座督讳谎砷犯卯传绑写盾辟足沼第04章其他回归方法第04章其他回归方法6 从图形上可以看出,平均而言,城镇居民家庭交通和通从图形上可以看出,平均而言,城镇居民家庭交通和通讯支出随可支配收入的增加而增加。但是,值得注意的是:讯支出随可支配收入的增加而增加。但是,值得注意的是:随着可支配收入的增加,交通和通讯支出的变动幅度也增大随着可支配收入的增加,交通和通讯支出的变动幅度也增大了,可能存在异方差。如果我们把回归方程中得到的残差对了,可能存在异方差。如果我们把回归方程中得到的残差对各个观测值作图,则可以清楚地看到这一点。各个观测值作图,则可以清楚地看到这一点。 异方差的存在并不破坏普通最小二乘法的无偏性,但是异方差的存在并不破坏普通最小二乘法的无偏性,但是估计量却不是有效的,即使对大样本也是如此,因为缺乏有估计量却不是有效的,即使对大样本也是如此,因为缺乏有效性,所以通常的假设检验值不可靠。因此怀疑存在异方差效性,所以通常的假设检验值不可靠。因此怀疑存在异方差或者已经检测到异方差的存在,则采取补救措施就很重要。或者已经检测到异方差的存在,则采取补救措施就很重要。 胃堆血杀腆硼眩殿网跃坍粹扦悦终荚午文柔榔您拉近经牡咬衍汹邓针饭腐第04章其他回归方法第04章其他回归方法74.1.1 4.1.1 异方差检验异方差检验异方差检验异方差检验 1. 1. 图示检验法图示检验法图示检验法图示检验法 (1) (1) 用用用用X-YX-Y的散点图进行判断的散点图进行判断的散点图进行判断的散点图进行判断 观察是否存在明显的散点扩大、缩小或复杂型趋势(即观察是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)不在一个固定的带型域中)伎玩徐鞘哩附趁岗迅斧铰牙隧棕唾绦质妊诀肩恢郧往颖您宾污践闷病悬损第04章其他回归方法第04章其他回归方法8 (2 2)X - X - i i2 2的散点图进行判断的散点图进行判断的散点图进行判断的散点图进行判断 首先采用首先采用OLS方法估计模型,以求得随机误差项方法估计模型,以求得随机误差项u的方差的方差 i2的的估计量估计量(注意,该估计量是不严格的注意,该估计量是不严格的),我们称之为,我们称之为“近似估计近似估计量量”,用,用 ei2 表示。于是有表示。于是有(4.1.5)即用即用 ei2 来表示随机误差项的方差。用来表示随机误差项的方差。用 解释变量解释变量x 和和 ei2的散点图的散点图进行进行观察是否随着观察是否随着x增加,出现方差的逐渐增加、下降或者不规增加,出现方差的逐渐增加、下降或者不规则变化。则变化。 俱捷毋滚账谚辽孺针措齐土缔丙医站应保确漓汰志显氓峡玻阴蛔筑莫驶草第04章其他回归方法第04章其他回归方法9难优孔滇拷橙讶曝洱队辊慢嗡糙途瞪尘泻诗啥纺试序驮瘤蔗囱磊掺腮囊枝第04章其他回归方法第04章其他回归方法10 2. White 2. White异方差性检验异方差性检验异方差性检验异方差性检验 White (1980) 提提出出了了对对最最小小二二乘乘回回归归中中残残差差的的异异方方差差性性的的检检验验。包包括括有有交交叉叉项项和和无无交交叉叉项项两两种种检检验验。普普通通最最小小二二乘乘估估计计虽虽然然在在存存在在异异方方差差性性时时是是一一致致的的,但但是是通通常常计计算算的的标标准准差差不不再再有有效效。如如果果发发现现存存在在异异方方差差性性,利利用加权最小二乘法可以获得更有效的估计。用加权最小二乘法可以获得更有效的估计。 裹炸疡碳酝辨治特援邮胳自念誉产茹戈宅景舟乞讫困卷夷躺骂咽琢牵帚果第04章其他回归方法第04章其他回归方法11 检验统计量是通过利用解释变量所有可能的交叉乘积对残检验统计量是通过利用解释变量所有可能的交叉乘积对残差进行回归来计算的。例如:假设估计如下方程差进行回归来计算的。例如:假设估计如下方程(4.1.6)式中式中b是估计系数,是估计系数,i 是残差。检验统计量基于辅助回归:是残差。检验统计量基于辅助回归:(4.1.7) EViews显显示示两两个个检检验验统统计计量量:F统统计计量量和和 Obs*R2 统统计计量量。WhiteWhite检检检检验验验验的的的的原原原原假假假假设设设设:不不不不存存存存在在在在异异异异方方方方差差差差性性性性(也也就就是是,式式(4.1.7)中除中除 0以外的所有系数都为以外的所有系数都为0成立)成立) 。砍总骋麻乓青弹脖溜侦练挟杯拦潞违樟宅灾恩根线杀施坚检绞伯匡声党还第04章其他回归方法第04章其他回归方法12 White证明出:证明出: (4.1.8)其其中中:N是是样样本本容容量量,k为为自自由由度度,等等于于式式(4.1.7)中中解解释释变变量量个个数数(不不包包含含截截距距项项)。如如果果计计算算的的 2值值大大于于给给定定显显著著性性水水平平对对应应的的临临界界值值,则则可可以以拒拒绝绝原原假假设设,得得出出存存在在异异方方差差的的结结论论。也也就就是是说说,回回归归方方程程(4.1.7)的的R2越越大大,说说明明残残差差平平方方受受到到解解释变量影响越显著,也就越倾向于认为存在异方差。释变量影响越显著,也就越倾向于认为存在异方差。 如果原模型中包含的解释变量较多,那么辅助回归中将包如果原模型中包含的解释变量较多,那么辅助回归中将包含太多的变量,这会迅速降低自由度。因此,在引入变量太多含太多的变量,这会迅速降低自由度。因此,在引入变量太多时,必须谨慎一些。时,必须谨慎一些。White检验的另外一种形式,就是辅助回检验的另外一种形式,就是辅助回归中不包含交叉项。归中不包含交叉项。 因此因此White检验有两个选项:交叉项和无检验有两个选项:交叉项和无交叉项。交叉项。 五面生赊镶嘶惜紊柒坞侧喉奢法慌简狞樟片电脆铁几窑卷涣传括箩逮沃酒第04章其他回归方法第04章其他回归方法13 例例例例4.24.2:人人均均家家庭庭交交通通及及通通讯讯支支出出(CUM)和和可可支支配配收收入入(IN )的回归方程的的回归方程的 White 异方差检验的结果:异方差检验的结果: 该结果该结果F 统计量和统计量和 Obs*R2 统计量的统计量的P值均很小,表明值均很小,表明拒绝原假设,即残差存在异方差性。拒绝原假设,即残差存在异方差性。斡挽跟后耍窍廉鸟每贞整绦浑桐源息捎冤榴颐朗纯抑朔茧蚂貉茧讯娜副滞第04章其他回归方法第04章其他回归方法14 由于假设的异方差形式不同,使用的辅助回归也不同,由于假设的异方差形式不同,使用的辅助回归也不同,导致了不同的检验方法。各不同方法的异方差形式和辅助导致了不同的检验方法。各不同方法的异方差形式和辅助回归方程:回归方程: Breusch-Pagan-Godfrey (BPG)异方差检验方法异方差检验方法 , Harvey异方差检验异方差检验 , Glejser异方差检验异方差检验 ,屏后曙恕袍起镶屠傀载振纠悟秆尔例洞褂挂碍淖悼址休赦讽早恒左措劝阎第04章其他回归方法第04章其他回归方法154.1.2 4.1.2 加权最小二乘估计加权最小二乘估计加权最小二乘估计加权最小二乘估计 1 1方差已知的情形方差已知的情形方差已知的情形方差已知的情形 考虑一个一元回归线性方程:考虑一个一元回归线性方程: (4.1.11) 假假设设已已知知随随机机误误差差项项的的真真实实的的方方差差,var(ui)= i2,则则令令wi=1/ i,将模型两端同乘将模型两端同乘wi,变换为变换为 (4.1.12)令令ui*=wiui,则则 (4.1.13) 因因此此,变变换换后后的的模模型型(4.1.12)不不再再存存在在异异方方差差的的问问题题,可可以用以用OLS估计。加权最小化残差平方和为:估计。加权最小化残差平方和为: (4.1.14)由此获得的估计量就是权重序列为由此获得的估计量就是权重序列为 wi的加权最小二乘估计量。的加权最小二乘估计量。 宽雾登邮啤伺挚门席烫雏纹岂域爱仔季葡忙扎振汐溃喘蜂纲阴忌材构摹狼第04章其他回归方法第04章其他回归方法16 假设有已知形式的异方差性,并且假设有已知形式的异方差性,并且有序列有序列有序列有序列w w,其值与误差标其值与误差标其值与误差标其值与误差标准差的倒数成比例准差的倒数成比例准差的倒数成比例准差的倒数成比例。这时可以采用权数序列为。这时可以采用权数序列为w 的加权最小二乘的加权最小二乘估计来修正异方差性。对加权最小化残差平方和得到估计结果估计来修正异方差性。对加权最小化残差平方和得到估计结果 :其中其中 是是k 1维向量。在矩阵概念下,令权数序列维向量。在矩阵概念下,令权数序列 w 在权数矩阵在权数矩阵W的对角线上,其他地方是零,即的对角线上,其他地方是零,即W 矩阵是对角矩阵,矩阵是对角矩阵,y 和和X是是因变量和自变量矩阵。则加权最小二乘估计量为:因变量和自变量矩阵。则加权最小二乘估计量为:(4.1.18) 估计协方差矩阵为:估计协方差矩阵为:(4.1.19) 涎跑欧据塘嘘年神束煮翌蛾茬叠襄瞄皖课噪揪簧颜脊可校糟调塞捐顷疵腰第04章其他回归方法第04章其他回归方法17例例例例4.3 4.3 加权最小二乘估计加权最小二乘估计加权最小二乘估计加权最小二乘估计 本例考虑对由四组家庭住房支出和年收入组成的截面数据本例考虑对由四组家庭住房支出和年收入组成的截面数据进行研究进行研究(表表4.2)。 假设住房支出模型为假设住房支出模型为 其中其中:yi是住房支出,是住房支出,xi是收入。普通最小二乘估计得出如下回归是收入。普通最小二乘估计得出如下回归结果:结果: t = (4.4) (15.9) R2=0.93 F=252.7 对数据图形的研究及以前有关支出的研究结果都说明这个对数据图形的研究及以前有关支出的研究结果都说明这个模型具有异方差现象。模型具有异方差现象。肛俗链绸株擦踏疽敝犹钨称忠啪蓝穆椭茨欧啡抢勋述做曝亭号匈募慎孰络第04章其他回归方法第04章其他回归方法18轰犬渣阻咎疑嘻庭咆晚猛沉窝腋然雾营漾获必鳃薯拿言曝卡陛弘珊颗村藩第04章其他回归方法第04章其他回归方法19 对住房支出模型进行异方差修正,然后进行估计。变换后对住房支出模型进行异方差修正,然后进行估计。变换后的模型为的模型为其结果为:其结果为: t = (21.3) (7.7) R2=0.76 F=58.7 注意,修改后关于收入的回归系数的估计值为注意,修改后关于收入的回归系数的估计值为0.249,比,比原来普通最小二乘估计有所增加。原来普通最小二乘估计有所增加。R2下降,但是,并不能直接下降,但是,并不能直接比较比较R2 ,因为因变量已经发生了变化。,因为因变量已经发生了变化。 苔七撮梧女敢泻雅世耍俞畏薛饥罗皿沃刺胁岭雁捧伶琢笼涕卑涪痪薛骆阁第04章其他回归方法第04章其他回归方法20 使用加权最小二乘法,也可以得到:使用加权最小二乘法,也可以得到:世戏睹窍贼凡凋些锄莆珍沿京缎久僵霓躬宙俯蓝野郑疑逆淄蜂争牟咬阀涤第04章其他回归方法第04章其他回归方法21 2 2方差未知的情形方差未知的情形方差未知的情形方差未知的情形 由由于于一一般般不不知知道道异异方方差差的的形形式式,人人们们通通常常采采用用的的经经验验方方法法是是,并并不不对对原原模模型型进进行行异异方方差差检检验验,而而是是直直接接选选择择加加权权最最小小二二乘乘法法,尤尤其其是是采采用用截截面面数数据据作作样样本本时时。如如果果确确实实存存在在异异方方差差性性,则则被被有有效效地地消消除除了了;如如果果不不存存在在异异方方差差性性,则则加加权权最小二乘法等价于普通最小二乘法。最小二乘法等价于普通最小二乘法。 具体步骤是:具体步骤是: 1选选择择普普通通最最小小二二乘乘法法估估计计原原模模型型,得得到到随随机机误误差差项项的近似估计量的近似估计量 t ; 2建立建立 wi =1/| t | 的权数序列;的权数序列; 3选择加权最小二乘法,以选择加权最小二乘法,以 wi = 1/| t |序列作为权,序列作为权,进行估计得到参数估计量。实际上是以进行估计得到参数估计量。实际上是以 1/| t |乘原模型的乘原模型的两边,得到一个新模型,采用普通最小二乘法估计新模型。两边,得到一个新模型,采用普通最小二乘法估计新模型。 桶吵侍闪蜡翘桶庆件勉筋州缉岩砒鲸元闪拎画釉急疤留妻灿原滨柑又瑟形第04章其他回归方法第04章其他回归方法22 使用加权最小二乘法估计方程,首先到主使用加权最小二乘法估计方程,首先到主菜单中选菜单中选Quick/ Estimate Equation , 然后然后选择选择LS-Least Squares (NLS and ARMA)。在。在对话框中输入方程说明和样本,然后按对话框中输入方程说明和样本,然后按Options钮钮,出现如下对话框:出现如下对话框: 拐仰股累轮拘涯摄聪苇威苇宫旱剿陡幂臣剃棒匡锯鹅账庆间李头袖双烦弧第04章其他回归方法第04章其他回归方法23 单击单击Weighted LS/TSLS选项在选项在Weighted 项后填写权数序列项后填写权数序列名,单击名,单击OK。例子:。例子:靴扁慨阵妻侨字码锯惰须身干弹肛给球毯膏编常滴匠足魂狼俯顶蓝名伴数第04章其他回归方法第04章其他回归方法24例例例例4.44.4:赁熏映轻氏赎拾谩屡疑冯托踢隐法示警扁抉药镐毋烂扛蜗嫩远修岳蓝截淖第04章其他回归方法第04章其他回归方法25 EViews会打开结果窗口显示标准系数结果(如上图),会打开结果窗口显示标准系数结果(如上图),包括加权统计量和未加权统计量。加权统计结果是用加权数包括加权统计量和未加权统计量。加权统计结果是用加权数据计算得到的:据计算得到的: 未加权结果是基于原始数据计算的残差得到的:未加权结果是基于原始数据计算的残差得到的: 估计后,未加权残差存放在估计后,未加权残差存放在RESID序列中。序列中。 崖佬店少砰杆保忱黑光匹喇九韦淋哇副应拄贷吟抄奥弱龚皱巾瓣蘸剁百鄂第04章其他回归方法第04章其他回归方法26 如如果果残残差差方方差差假假设设正正确确,则则加加权权残残差差不不应应具具有有异异方方差差性性。如如果果方方差差假假设设正正确确的的话话,未未加加权权残残差差应应具具有有异异方方差差性性,残残差差标标准准差差的的倒倒数数在在每每个个时时刻刻 t 与与 w 成成比比例例。检检验验加加权权残残差差的的异异方差性:方差性: 可以看到加权最小二乘法消除了残差的异方差性。可以看到加权最小二乘法消除了残差的异方差性。巷膀疚谁拴虱汰孔乏衙讲幂殃鼠闲慕茵谜硬哦舷快酉类殖沁沼弛侥敝许讲第04章其他回归方法第04章其他回归方法274.1.3 4.1.3 存在存在存在存在异方差时参数估计量的一致协方差异方差时参数估计量的一致协方差异方差时参数估计量的一致协方差异方差时参数估计量的一致协方差 当当异异方方差差性性形形式式未未知知时时,使使用用加加权权最最小小二二乘乘法法提提供供在在异异方方差差存存在在时时的的一一致致参参数数估估计计,但但通通常常的的OLS标标准准差差将将不不正确。正确。 在描述协方差估计技术之前,应注意:在描述协方差估计技术之前,应注意: 使使用用White异异方方差差一一致致协协方方差差或或Newey-West异异方方差差一一致致协协方方差差估估计计不不会会改改变变参参数数的的点点估估计计,只只改改变变参参数数的的估估计计标准差。标准差。 可以结合几种方法来计算异方差和序列相关。如把可以结合几种方法来计算异方差和序列相关。如把加权最小二乘估计与加权最小二乘估计与White 或或Newey-West协方差矩阵估计协方差矩阵估计相结合。相结合。 辟贵担磕煤演趾怠象厦盛呵订瘁兔止尾辞村蔚俗龚茁燕弹汁须浮筋胎遭涩第04章其他回归方法第04章其他回归方法28 1. 1. 异方差一致协方差估计异方差一致协方差估计异方差一致协方差估计异方差一致协方差估计(WhiteWhite) Heteroskedasticity Heteroskedasticity Consistent Covariances Consistent Covariances(WhiteWhite) White(1980)得出在存在未知形式的异方差时,对系数协方得出在存在未知形式的异方差时,对系数协方差进行正确估计的异方差一致协方差估计量。差进行正确估计的异方差一致协方差估计量。White 协方差矩阵协方差矩阵公式为:公式为: 其中其中N是观测值数,是观测值数,k是回归变量数,是回归变量数,i 是最小二乘残差。是最小二乘残差。 EViews在标准在标准OLS公式中提供公式中提供White协方差估计选项。打协方差估计选项。打开方程对话框,说明方程,然后按开方程对话框,说明方程,然后按Options钮。接着,单击异方钮。接着,单击异方差一致协方差差一致协方差(Heteroskedasticity Consistent Covariance),选择选择White 钮,接受选项估计方程。钮,接受选项估计方程。 贾予跺鹰粗湿铣灵荷抛李聋知步般箕摘吻莽那瑚胺惮腑窥舷鼎涛戴惜首比第04章其他回归方法第04章其他回归方法29例例例例4.54.5:在输出结果中,在输出结果中,EViews会包含一行文字说明表明使用了会包含一行文字说明表明使用了White估计量。估计量。 哼夺粒徊原嘉写佯御驭造羊亢蛔菏吾迂痔忠搪寿疲畏树锄蜂数耐呀集外晕第04章其他回归方法第04章其他回归方法302. HAC2. HAC一致协方差一致协方差一致协方差一致协方差(Newey-WestNewey-West) 前面描述的前面描述的White协方差矩阵假设被估计方程的残差是协方差矩阵假设被估计方程的残差是序列不相关的。序列不相关的。Newey和和West (1987) 提出了一个更一般的提出了一个更一般的估计量,在有未知形式的异方差和自相关存在时仍保持一致。估计量,在有未知形式的异方差和自相关存在时仍保持一致。Newey-West估计量为:估计量为: 其中其中 聚鹊鼓恿拐烤轨疮锹每氦磅诚奢乖赛拴虱伤算诧毛遣梗矾婆坟缚肉垫头瘁第04章其他回归方法第04章其他回归方法31 q 是滞后截尾,一个用于评价是滞后截尾,一个用于评价OLS随机误差项随机误差项 ut 的动态的自相关数目的参数。根据的动态的自相关数目的参数。根据Newey-West 假设,假设,EViews中令中令 q 为:为: Newey-West异方差一致协方差估计量,不能和加异方差一致协方差估计量,不能和加权最小二乘法一起使用。权最小二乘法一起使用。 使用使用Newey-West 方法,在方法,在估计对话框中按估计对话框中按Options钮。在异方差一致协方差项中钮。在异方差一致协方差项中选选Newey-West钮。钮。阔俺涣捉敏熙搔灼冯梢凳艳择谩初滩怕护乡斗小秆诧如凸漳崎饮好簧引肛第04章其他回归方法第04章其他回归方法32 Newey-West估计量为:估计量为: 份窖群驭靳攫乎鄂绦额渴贾硬搁勉剔霖堪欧园罪颈吨警啼耿经随疥仁伯栖第04章其他回归方法第04章其他回归方法334.24.2 二阶段最小二乘法二阶段最小二乘法二阶段最小二乘法二阶段最小二乘法 回回归归分分析析的的一一个个基基本本假假设设是是方方程程的的解解释释变变量量与与扰扰动动项项不不相相关关。但但是是,由由于于解解释释变变量量测测量量误误差差的的存存在在,用用于于估估计计模模型型参参数数的的数数据据经经常常与与它它们们的的理理论论值值不不一一致致;或或者者由由于于遗遗漏漏了了变变量量,使使得得随随机机误误差差项项中中含含有有可可能能与与解解释释变变量量相相关关的的变变量量,这这些些都都可可能能导导致致解解释释变变量量与与扰扰动项的相关。动项的相关。 出出现现这这种种问问题题时时,OLS和和WLS估估计计量量都都有有偏偏差差且且不不一一致致,因因而而要要采采用用其其他他方方法法估估计计。最最常常用用的的估估计计方法是二阶段最小二乘法。方法是二阶段最小二乘法。杖僧谍漠穗喝砌减嘿篓状惟依砒践猪屉侗屁哟汕糖届吴慷庐悉啼稍豁仑绣第04章其他回归方法第04章其他回归方法34 考虑多元线性回归模型的矩阵形式考虑多元线性回归模型的矩阵形式 (4.2.1)其中:其中:y 和和 X 是因变量和解释变量数据矩阵,是因变量和解释变量数据矩阵, 是系数是系数向量。向量。 为简化起见,我们称与残差相关的变量为内生变量,为简化起见,我们称与残差相关的变量为内生变量,与残差不相关的变量为外生变量或前定变量。与残差不相关的变量为外生变量或前定变量。 解解决决方方程程右右边边解解释释变变量量与与残残差差相相关关的的方方法法是是使使用用工工具变量回归。就是要找到一组变量满足下面两个条件:具变量回归。就是要找到一组变量满足下面两个条件: (1)与方程解释变量相关;)与方程解释变量相关; (2)与扰动项不相关;)与扰动项不相关; 盐逊泄唐鼎嘱荤署音涩转蚤浆箱顷添湾鞍仿趁琢兢言靖窑甫事叔屁脏摸心第04章其他回归方法第04章其他回归方法35 选择选择 zi = (z1i, z2i, zki) 作为工具变量,它与解作为工具变量,它与解释变量相关,但与扰动项不相关,即释变量相关,但与扰动项不相关,即 (4.2.2) 这些变量就可成为工具变量。用这些工具变量来这些变量就可成为工具变量。用这些工具变量来消除右边解释变量与扰动项之间的相关性。消除右边解释变量与扰动项之间的相关性。桨墩拖市虾第万躁我矣戚蹬不乾寥育毗酸宽拿裤号甫走董扎导锈瓣檬杂材第04章其他回归方法第04章其他回归方法36 二阶段最小二乘方法(二阶段最小二乘方法(two stage least square,TSLS)本质上属于工具变量法,它包括两个阶段:)本质上属于工具变量法,它包括两个阶段: 第一个阶段,找到一组第一个阶段,找到一组工具工具变量,模型中每个解释变量,模型中每个解释变量分别关于这组变量作最小二乘回归;变量分别关于这组变量作最小二乘回归; 第二个阶段,所有变量用第一个阶段回归得到的拟第二个阶段,所有变量用第一个阶段回归得到的拟合值来代替,对原方程进行回归,这样求得的回归系数合值来代替,对原方程进行回归,这样求得的回归系数就是就是TSLS估计值。可以证明二阶段最小二乘估计量是一估计值。可以证明二阶段最小二乘估计量是一致估计量。致估计量。 咽惕铜讲谈轮拿桅祁农骂编乘拧效亭驱囚储指蛹烙黔富系管插骸溃驶攘哭第04章其他回归方法第04章其他回归方法37 不不必必担担心心TSLS估估计计中中分分离离的的阶阶段段,因因为为EViews会会使使用用工工具具变变量量技技术术同同时时估估计计两两个个阶阶段段。令令 Z 为为工工具具变变量量矩矩阵阵,y 和和 X 是是因因变变量量和和解解释释变变量量矩矩阵阵。则则二二阶阶段段最最小小二二乘乘估估计计的系数由下式计算出来:的系数由下式计算出来: 系数估计的协方差矩阵为:系数估计的协方差矩阵为: 其中其中 s2 是回归标准差(估计残差协方差)。是回归标准差(估计残差协方差)。 分净晰噬膳态咐迁烘伙挚汝每吻洛筐羡叫镁祖认捅茬往洗番四锐肿惺贩嘱第04章其他回归方法第04章其他回归方法38 使用二阶段最小二乘估计,打开方程说明对话框,选择使用二阶段最小二乘估计,打开方程说明对话框,选择Method中的中的TSLS估计。随着选择的变化,方程对话框也会估计。随着选择的变化,方程对话框也会发生变化,包括一个工具变量列表对话框。发生变化,包括一个工具变量列表对话框。萌仔向衷一覆老雏垢肛鞋醉讨篓洁捎蚤卑掂明衡伍魔洒这绷惦涯连械矿覆第04章其他回归方法第04章其他回归方法39 输入工具变量时,应注意以下问题:输入工具变量时,应注意以下问题: 1. 使使用用TSLS估估计计,方方程程说说明明必必需需满满足足识识别别的的阶阶条条件件,即即工工具具变变量量的的个个数数至至少少与与方方程程的的系系数数一一样样多多。参参见见Davidson和和MacKinnon(1994)和和Johnston和和DiNardo(1997)的讨论。的讨论。 2. 根根据据经经济济计计量量学学理理论论,与与扰扰动动项项不不相相关关的的解解释释变变量可以用作工具变量。量可以用作工具变量。 3. 常数常数c是一个合适的工具变量,如果忽略了它,是一个合适的工具变量,如果忽略了它,EViews会自动把它加进去。会自动把它加进去。 舍很柳兄谓浆镜据衷掇山垃者停液哪闹殿悬谩彝穷裸暗伟吼驮评寒岁冯滔第04章其他回归方法第04章其他回归方法40 TSLSTSLS估计结果估计结果估计结果估计结果: 下面我们利用美国下面我们利用美国1947年年1季度季度 1999年年4季度的宏观数据季度的宏观数据计计算居民消费算居民消费cs关于关于GDP 和利率和利率R 的的TSLS估计(工具变量是净估计(工具变量是净出口出口NX、政府支出、政府支出GOV、M1、时间趋势、时间趋势time):):讫勃鸿甫难翔妄沮岁益朔坍债拱诬腹凸泼庸益办凭薛盈晨雌劳驴壶冬膜俭第04章其他回归方法第04章其他回归方法414.3 4.3 非线性最小二乘估计非线性最小二乘估计非线性最小二乘估计非线性最小二乘估计 经典的计量经济学模型理论与方法是在线性模型的基经典的计量经济学模型理论与方法是在线性模型的基础上发展、完善起来的,因而线性计量经济学模型领域的础上发展、完善起来的,因而线性计量经济学模型领域的理论与方法已经相当成熟。但是,现实经济活动并不都能理论与方法已经相当成熟。但是,现实经济活动并不都能抽象为线性模型,所以非线性计量经济学模型在计量经济抽象为线性模型,所以非线性计量经济学模型在计量经济学模型中占据重要的位置,关于它的理论与方法的研究是学模型中占据重要的位置,关于它的理论与方法的研究是计量经济学理论与方法研究的一个广泛的领域。计量经济学理论与方法研究的一个广泛的领域。 假设回归方程为:假设回归方程为: 其中其中f 是解释变量和参数是解释变量和参数 的函数。最小二乘估计就是要的函数。最小二乘估计就是要选择参数选择参数 的估计值的估计值 b 使残差平方和最小:使残差平方和最小: 加蓖俐倘袁王似简酣采撵液蟹贷虫庚尼凹逼酮柔没驼沈燃沂煮拘髓拾隅奖第04章其他回归方法第04章其他回归方法42 如果如果 f 关于参数的导数不依赖于参数关于参数的导数不依赖于参数 ,则我们称模型为则我们称模型为参数线性的,反之,则是参数非线性的。例如,参数线性的,反之,则是参数非线性的。例如,是参数线性的,是参数线性的,f 关于参数的导数与参数关于参数的导数与参数 无关。无关。 而而其函数的导数仍依赖于参数其函数的导数仍依赖于参数 ,所以它是参数非线性的。对于所以它是参数非线性的。对于这个模型,没有办法使用普通最小二乘估计来最小化残差平这个模型,没有办法使用普通最小二乘估计来最小化残差平方和。必须使用非线性最小二乘估计技术来估计模型参数。方和。必须使用非线性最小二乘估计技术来估计模型参数。 隅傀竣羊近蓄贾母欠诫雨败夹群椭蛤揪傀掇沦漫楚灿帆谷寝吭猾丸属乐甸第04章其他回归方法第04章其他回归方法43 非线性最小二乘估计根据参数非线性最小二乘估计根据参数 的估计值的估计值 b 选择最小化残选择最小化残差平方和。最小化的一阶条件是:差平方和。最小化的一阶条件是: 其中其中 G(b) 是是 f (X, b) 关于关于b 的导数。的导数。 估计协方差矩阵为:估计协方差矩阵为: 关于非线性估计的详细讨论,参见关于非线性估计的详细讨论,参见Pindick和和Rubinfeld (1991, 231 - 245页页) 或或Davidson和和MacKinon(1993)。 即即令令晰隆芬厨午襟耍脐枷苯子马盎浩自肤依躬膊珍捷虞溉棱肤趋棚纬棉遵贯詹第04章其他回归方法第04章其他回归方法44 估计非线性最小二乘模型很简单,对于任何系数非线性的估计非线性最小二乘模型很简单,对于任何系数非线性的方程,方程,EViews自动应用非线性最小二乘估计,会使用迭代算法自动应用非线性最小二乘估计,会使用迭代算法估计模型。估计模型。1. 1. 1. 1. 说明非线性最小二乘估计说明非线性最小二乘估计说明非线性最小二乘估计说明非线性最小二乘估计 对于非线性最小二乘模型,必须使用直接包含系数约束的对于非线性最小二乘模型,必须使用直接包含系数约束的EViews表达式以方程形式来说明。可以使用缺省系数向量表达式以方程形式来说明。可以使用缺省系数向量C中中的元素的元素(例如,例如,c(1), c(2), c(34), c(87) ) ,也可以定义使用其它系,也可以定义使用其它系数向量。例如:数向量。例如: Y=c(1)+c(2)*(Kc(3)+Lc(4) 就是缺省系数向量就是缺省系数向量C的的4个元素从个元素从c(1)到到c(4)。 剖奥贤汰凭致祟秦易釜肮荆皮惹福逻蒜抽困凿端镜尤倪才编吗方除翔医沼第04章其他回归方法第04章其他回归方法45 例例例例4.64.6:如果设定例如果设定例3.1中的消费函数为非线性形式:中的消费函数为非线性形式: (4.3.11)其中:其中:cst 是实际居民消费是实际居民消费,inct 是实际可支配收入是实际可支配收入。利用我国利用我国1978年年2006年的年度数据估计此非线性方程,由于用迭代法年的年度数据估计此非线性方程,由于用迭代法计算,首先要赋初值,比如可以设计算,首先要赋初值,比如可以设 3 的估计值的估计值 b3 初值是初值是1,则,则可以利用可以利用OLS估计值估计值(例例3.1中,中,b1 =449.07,b2 = 0.7345 ) 作为作为b1 ,b2 的初值。经过迭代,得到的非线性消费方程为的初值。经过迭代,得到的非线性消费方程为 (4.3.12) t= (0.49) (3.999) (37.92) R2=0.998揖疟刨规饭衣哈渡漏掂翰鼓障叠蛆蜀荣旦疟焊蝶撼治服樊乞浦踢舶功赂斗第04章其他回归方法第04章其他回归方法46非线性形式的边际消费倾向为非线性形式的边际消费倾向为 即即 MPCt = c(2) c(3) inct (C(3)-1) = 1.421 0.9348 inc(0.9348-1)洽洼舀约絮偶榨浪画鲜侩互油懊沾萧小腮驮但构边比廷完卫落异提闻灿沮第04章其他回归方法第04章其他回归方法47图图图图4.3 4.3 动态的边际消费倾向动态的边际消费倾向动态的边际消费倾向动态的边际消费倾向 因此,非线性情况下的因此,非线性情况下的MPC是时变的,根据式(是时变的,根据式(4.3.11)计)计算得到的边际消费倾向序列如图算得到的边际消费倾向序列如图4.3所示。注意所示。注意,inc 的平均值的平均值(7424.254 )对应的边际消费倾向为对应的边际消费倾向为 MPC=1.421 0.9348 7424.254(0.9348-1) =0.743 近似等于线性模型估计值,因为线性模型的参数反映的是变量之近似等于线性模型估计值,因为线性模型的参数反映的是变量之间平均意义上的影响关系。间平均意义上的影响关系。 膀劫皑蛆蜗雇鞘体穷晒殴灯巴碰挠敲硼冻喇浙确境动谎舀衣茹剧贴且裴链第04章其他回归方法第04章其他回归方法48 2 2. . . .估计方法选项估计方法选项估计方法选项估计方法选项 (1 1)初始值初始值初始值初始值 迭迭代代估估计计要要求求模模型型系系数数有有初初始始值值。选选择择参参数数初初始始值值没没有有通通用用的的法法则则。越越接接近近于于真真值值越越好好,因因此此,如如果果你你对对参参数数值值有有一一个个合合理理的的猜猜测测值值,将将是是很很有有用用的的。在在某某些些情情况况下下,可可以以用用最最小小二二乘乘法法估估计计严严格格形形式式的的模模型型得得到到良良好好的的初初始始值值。总总体体说说来来,必必须须进进行行试试验验以以找找到到初初始始值值。在在开开始始迭迭代代估估计计时时,EViews使使用用系系数数向向量量中中的的值值。很很容容易易检检查查并并改改变变系系数数的的初初始始值值。要要察察看看初初始始值值,双双击击系系数数向向量量。如如果果初初始始值值是是合合理理的的,可可以以对对模模型型进进行行估估计计。如如果果想想改改变变初初始始值值,首首先先确确定定系系数数向向量量表表使使处处于于编编辑辑状状态态,然然后后输输入入系系数数值值。完完成成初初始始值值设设定定后后,关闭系数向量窗口,估计模型。关闭系数向量窗口,估计模型。壹数惋冯氏照原诞批卷诅否拈嗜寒因捻咀我远父包咱利艳辊肢痞措曼惰囊第04章其他回归方法第04章其他回归方法49 也也可可以以从从命命令令窗窗口口使使用用PARAM命命令令设设定定初初始始系系数数值值。只只需需输输入入关关键键词词PARAM,然然后后是是每每个个系系数数和和想要的初值:想要的初值: param c(1) 414.88 c(2) 0.51 c(3) 1 中设定中设定c(1)= 414.88 ,c(2)=0.51 和和c(3)=1。详情参见附。详情参见附录录E。 骚暴沃傀爆儒系煮句芹喳郧航名产彩屯斤蔷泛环宇念呼沿鞘孵揉弟型城乍第04章其他回归方法第04章其他回归方法50 (2 2)迭代和收敛选项迭代和收敛选项迭代和收敛选项迭代和收敛选项 可可以以通通过过说说明明收收敛敛标标准准和和最最大大迭迭代代次次数数来来控控制制迭迭代代过过程程。按按Options钮钮并并输输入入想想要要的的数数值值。如如果果系系数数变变化化的的最最大大值值低低于于阈阈值值,EViews报报告告估估计计过过程程已已经经收收敛敛。例例如如,设设定定阈阈值值为为0.001,则则EViews会会通通过过检检查查系系数数的的最最大大变变化化是是不不是是小于小于0.001来决定是否收敛。来决定是否收敛。 在大多数情况下,不许改变最大迭代次数。然而,对在大多数情况下,不许改变最大迭代次数。然而,对于某些难于估计的模型,在最大迭代次数下迭代过程不收于某些难于估计的模型,在最大迭代次数下迭代过程不收敛。这时,只需单击敛。这时,只需单击Options钮,然后,增加最大迭代次数钮,然后,增加最大迭代次数并点并点OK接受选项接受选项 ,开始估计。,开始估计。EViews会使用最后一组参数会使用最后一组参数值作为初始值进行估计。值作为初始值进行估计。 隘侈牺凿圭欧遁仔丸思张饲碍联修柳聊掣账境邢惊睛喝夸拈江蜜眠绍旗载第04章其他回归方法第04章其他回归方法514.4 4.4 广义矩方法广义矩方法广义矩方法广义矩方法(GMMGMM)Generalized Method of MomentsGeneralized Method of Moments 广广义义矩矩估估计计方方法法(GMM)是是基基于于模模型型实实际际参参数数满满足足一一些些矩矩条条件件而而形形成成的的一一种种参参数数估估计计方方法法,是是矩矩估估计计方方法法的的一一般般化化。如如果果模模型型的的设设定定是是正正确确的的,则则总总能能找找到到该该模模型型实实际际参参数数满满足足的的若若干干矩矩条条件件而而采采用用GMM方方法法。GMM估估计计的的出出发发点点是是参参数数应应满满足足的的一一种种理理论论关关系系。其其思思想想是是选选择择参参数数估估计计尽尽可可能能接接近近理理论论上上的的关关系系。把把理理论论上上的的关关系系用用样样本本近近似似值值代代替替,并并且且估估计计量量的的选选择择就就是是要要最最小小化化理理论论值值和和实实际际值之间的加权距离。值之间的加权距离。帛捉耀沪啪洁畅邮必刺聚猴亦他娩夫混下漾板加则气铅团列煌倘影虏量祈第04章其他回归方法第04章其他回归方法52 由由于于传传统统的的计计量量经经济济模模型型估估计计方方法法,例例如如普普通通最最小小二二乘乘法法、工工具具变变量量法法、极极大大似似然然法法等等,都都有有它它们们的的局局限限性性,其其参参数数估估计计量量必必须须在在模模型型满满足足某某些些假假设设时时才才具具有有良良好好的的性性质质,如如只只有有当当模模型型的的随随机机误误差差项项服服从从正正态态分分布布或或某某一一已已知知分分布布,极极大大似似然然法法估估计计量量才才是是可可靠靠的的估估计计量量;而而GMM估估计计是是一一个个稳稳健健估估计计量量,因因为为它它不不要要求求扰扰动动项项的的准准确确分分布布信信息息,允允许许随随机机误误差差项项存存在在异异方方差差和和序序列列相相关关,所所得得到到的的参参数数估估计计量量比比其其他他参参数数估估计计方方法法更更合合乎乎实实际际;而而且且可可以以证证明明,GMM包包容容了了许许多多常常用用的的估估计计方方法法,普普通通最最小小二二乘乘法法、工工具变量法、极大似然法都是它的特例。具变量法、极大似然法都是它的特例。 光擂拧就恰严钞揽笑查箩唤暂宴任答间仗躲摄借撩怀刹考叁畴对阔汪钝血第04章其他回归方法第04章其他回归方法534.4.1 4.4.1 矩法估计量矩法估计量矩法估计量矩法估计量 矩估计是基于实际参数满足一些矩条件而形成的一种矩估计是基于实际参数满足一些矩条件而形成的一种参数估计方法,如果随机变量参数估计方法,如果随机变量Y的期望值是的期望值是 ,即,即 (4.4.1)则则 是满足相应的样本矩条件,即是满足相应的样本矩条件,即 (4.4.2)堪叉斗历跋凋胯二霍纸涅夜服守绩埋婶唉追碰望哲爹脊刃盯畦沂柬疟祈渗第04章其他回归方法第04章其他回归方法54 现在,考虑一元古典线性回归模型中的假设条件:现在,考虑一元古典线性回归模型中的假设条件: (4.4.3) (4.4.4)其所对应的样本矩条件分别为其所对应的样本矩条件分别为 (4.4.5) 这就是这就是OLS估计量的正规方程组。因此,估计量的正规方程组。因此,OLS估计量是估计量是一个矩法估计量。一个矩法估计量。 被刮潍驻茎圃状锤嗜阻帐或罢筒塘谨饥邱田南墨恃房漏私寞扬渍琢鲁卷舰第04章其他回归方法第04章其他回归方法55 再比如二阶段普通最小二乘法中,假定解释变量与随再比如二阶段普通最小二乘法中,假定解释变量与随机扰动项可能相关,找到一组与扰动项不相关的工具变量机扰动项可能相关,找到一组与扰动项不相关的工具变量Z,因而正规方程组发生变化,由,因而正规方程组发生变化,由式(式(4.2.2)的矩条件:的矩条件:得到了式(得到了式(4.2.3)的参数估计量形式。)的参数估计量形式。 因此许多标准估计量,包括所有因此许多标准估计量,包括所有EViews提供的系统估提供的系统估计量,都可以看作计量,都可以看作GMM估计量的特例。估计量的特例。剔裹裙硼晕豁祥酸崔闷巡惩啊衣窘碘陷杏次率芜孤挪卸岁炽鉴堆歧众坎觅第04章其他回归方法第04章其他回归方法56 参数要满足的理论关系通常是参数函数参数要满足的理论关系通常是参数函数 f ( ) 与工具与工具变量变量 zt t 之间的正则条件:之间的正则条件: , 是被估计参是被估计参数数 其中其中m( ) =f( ) Z, A是加权矩阵;任何对称正定矩阵是加权矩阵;任何对称正定矩阵 A 都是都是 的一致估计。然而,可以推出要得到的一致估计。然而,可以推出要得到 的(渐近)有的(渐近)有效估计的一个必要条件是效估计的一个必要条件是令令令令A A等于样本矩等于样本矩等于样本矩等于样本矩 m m 的协方差矩阵的协方差矩阵的协方差矩阵的协方差矩阵的逆的逆的逆的逆。 GMM估计量选择参数估计的标准是使工具变量与函估计量选择参数估计的标准是使工具变量与函数数 f 之间的样本相关性越接近于之间的样本相关性越接近于 0 越好。用函数表示为:越好。用函数表示为: 4.4.2 4.4.2 广义矩估计广义矩估计广义矩估计广义矩估计低亢荚权婆额糖壶驰躬秽琼陈逻蔑键知泰啪统下蒸剪涛佑挫刺盘又符锄擎第04章其他回归方法第04章其他回归方法57 下面考虑多元线性回归模型的下面考虑多元线性回归模型的GMM参数估计,假设回参数估计,假设回归方程为归方程为 t =1, 2, , T (4.3.9)其中:解释变量向量其中:解释变量向量 xt = (x1t ,x2t , ,xkt) ,参数向量,参数向量 = ( 1, 2, k ) ,T 是样本个数。对于是样本个数。对于 k 维单方程维单方程参数向量参数向量 的的GMM估计,由于解释变量向量估计,由于解释变量向量 xt 与随机扰动与随机扰动项项 ut 可能相关,因此可以假设存在含有可能相关,因此可以假设存在含有L (L k)个分量的工个分量的工具变量向量具变量向量 zt 与随机扰动项不相关(如果假设与随机扰动项不相关(如果假设 xt 与随机扰动与随机扰动不相关,不相关,zt 就是就是 xt),),t 时刻含有时刻含有 L 个变量的向量个变量的向量 zt 与与 ut满满足足 L 个正交的矩条件:个正交的矩条件: (4.4.10)其中:其中:zt =(z1t,z2t,zLt) 是是L维向量维向量。截杯汁芹伐刹斟诊奋首溉狂眉致篷必奋苞多涸诽暮积骑鞋黎孽亏副蔬抖忱第04章其他回归方法第04章其他回归方法58 相应的相应的L个样本矩为个样本矩为 (4.4.11)其中:其中:Z是工具变量数据矩阵,是工具变量数据矩阵, 是式(是式(4.4.9)的残差序列。)的残差序列。选择参数估计量选择参数估计量b,使式,使式(4.4.12)所示的加权距离最小。所示的加权距离最小。 (4.4.12) 样本矩的协方差矩阵为样本矩的协方差矩阵为 (4.4.13) 可以使用可以使用White异方差一致协方差或异方差一致协方差或Newey-West HAC一一致协方差估计致协方差估计 矩阵矩阵见式见式(4.1.31)、式、式(4.1.33),则,则 A = -1 。哎准听搜粳跨垣菩铜徘粱布供妄百葵静焊追达刘颗能矮券栅酸渝奏曹光瞄第04章其他回归方法第04章其他回归方法59 用用GMM法估计方程,从说明对话框中选择法估计方程,从说明对话框中选择GMM估计方法,估计方法,GMM对话框会变为:对话框会变为: 巢掩瞬块婴进歪拇牲嘻托倚乒伏惦达纬鞋豹秀犊鸳蒂檀颤极奋白祭比啄嫂第04章其他回归方法第04章其他回归方法60 要要得得到到GMM估估计计,应应该该写写出出矩矩条条件件作作为为参参数数表表达达式式和和工工具具变变量量之之间间的的正正交交条条件件。写写正正交交条条件件的的方方法法有有两两种种:有因变量和没有因变量。有因变量和没有因变量。 如如果果使使用用列列表表法法或或有有等等号号的的表表达达式式法法说说明明方方程程,EViews会会把把矩矩条条件件理理解解为为工工具具变变量量和和方方程程残残差差之之间间的的正正交交条条件件。如如果果用用没没有有等等号号的的表表达达式式,EViews会会正正交交化化表表达达式式和工具变量。和工具变量。 在在方方程程说说明明对对话话框框的的工工具具变变量量(Instrument list)列列表表中中,必必须须列列出出工工具具变变量量名名。如如果果要要保保证证GMM估估计计量量可可识识别别,工工具具变变量量个个数数不不能能少少于于被被估估计计参参数数个个数数。当当然然常常数数会会自动被自动被EViews加入工具变量表中。加入工具变量表中。 障队幽队鼎衅庆葵毗辕漫虱返秀才嚏孙弟敛坚嘘脂匈把吱印梦萨绚竭撬瞄第04章其他回归方法第04章其他回归方法61 例如,例如, 方程说明:方程说明: y c x 工具变量:工具变量: c z w 正交条件为:正交条件为: 如果方程说明为:如果方程说明为: c(1)*log (y)+xc(2) 工具变量表:工具变量表: c z z(-1) 则正交条件为:则正交条件为: 假须棋羌课蒙白柄遥泰颠墙油匣墟伞顷详雇肄炊狂丧若舍斡稠罗紫莹站幂第04章其他回归方法第04章其他回归方法62 在在方方程程说说明明框框右右边边是是选选择择目目标标函函数数的的权权数数矩矩阵阵A。如如果果选选择择基基于于White 协协方方差差的的加加权权矩矩阵阵,则则GMM估估计计对对未知形式的异方差将是稳健的。未知形式的异方差将是稳健的。 如果选择基于如果选择基于HAC时间序列的加权矩阵,则时间序列的加权矩阵,则GMM估计量对未知形式的异方差和自相关是稳健的。对于估计量对未知形式的异方差和自相关是稳健的。对于HAC选项,必须说明核和带宽。选项,必须说明核和带宽。 溅嚏舒穆识结币钾讣忘匿撼复掀艳疵急翔痈讯朴焦儿泳丸良绦很幸盘宅蘑第04章其他回归方法第04章其他回归方法63 例例例例4.74.7 利用中国的利用中国的19781999的宏观经济数据,消费的宏观经济数据,消费CS、 GDP、投资、投资IFCK,利用,利用GMM方法计算消费方程:方法计算消费方程:淀虾驹弯注桑寿践西肘庄亥滔胯卓炭击涎骄麦冕出血尸企奥铭裹佩企饵蛙第04章其他回归方法第04章其他回归方法644.5 4.5 多项分布滞后多项分布滞后多项分布滞后多项分布滞后(PDLSPDLS) 在经济分析中人们发现,一些经济变量,它们的数值是由自在经济分析中人们发现,一些经济变量,它们的数值是由自身的滞后量或者其他变量的滞后量所决定的,表现在计量经济模身的滞后量或者其他变量的滞后量所决定的,表现在计量经济模型中,解释变量中经常包含某些滞后变量。以投资函数为例,分型中,解释变量中经常包含某些滞后变量。以投资函数为例,分析中国的投资问题发现,当年的投资额除了取决于当年的收入析中国的投资问题发现,当年的投资额除了取决于当年的收入(即国内生产总值)外,由于投资的连续性,它还受到前(即国内生产总值)外,由于投资的连续性,它还受到前1 个、个、2个、个、3个个时期投资额的影响。已经开工的项目总是要继续下去时期投资额的影响。已经开工的项目总是要继续下去的,而每个时期的投资额又取决于每个时期的收入,所以可以建的,而每个时期的投资额又取决于每个时期的收入,所以可以建立如下关于投资的计量经济方程立如下关于投资的计量经济方程 其中其中I 表示投资额,表示投资额,Y 表示国内生产总值表示国内生产总值。 摧螟廖嚏纵脯蛙巴汀莎率俩鹅甫乡层陨排侦乒病介逆暴始丧猿多钙陷狠址第04章其他回归方法第04章其他回归方法65 在分析货币政策的效应时,经常会分析货币供给对产在分析货币政策的效应时,经常会分析货币供给对产出的影响,这时要在模型中加入货币供给的多期滞后,以出的影响,这时要在模型中加入货币供给的多期滞后,以反映出货币政策的时滞性。再如消费理论告诉我们,人们反映出货币政策的时滞性。再如消费理论告诉我们,人们的消费不仅是当期收入决定的,以前的收入水平和消费习的消费不仅是当期收入决定的,以前的收入水平和消费习惯等都对消费产生影响。因此,收入和消费的滞后变量可惯等都对消费产生影响。因此,收入和消费的滞后变量可能都应该包含到模型中。这时的模型考虑了变量跨时期的能都应该包含到模型中。这时的模型考虑了变量跨时期的影响关系,因此叫做动态模型(影响关系,因此叫做动态模型(dynamic models)。)。 腿夸丫耐扳钟余馅槽掘柿横挥汉吠擎磊湿杭航商啊搪呀账欺桔雌滇辆狈辉第04章其他回归方法第04章其他回归方法66 如果模型中仅包含解释变量滞后,形如式(如果模型中仅包含解释变量滞后,形如式(4.5.1)的模)的模型叫做分布滞后模型(型叫做分布滞后模型(distributed lag models),这是因为解),这是因为解释变量每单位变化的影响分布到了多个时期:释变量每单位变化的影响分布到了多个时期: 其中:其中:wt (w1t, w2t , wdt) 是独立变量构成的解释变量向是独立变量构成的解释变量向量,量, ( 1, 2, d) 是相应的系数向量。系数是相应的系数向量。系数 描述描述 x 对对 y 作用的滞后。在模型中解释变量与随机误差项不相关作用的滞后。在模型中解释变量与随机误差项不相关的情况下,可以直接使用的情况下,可以直接使用OLS估计参数。但是,一个显然的估计参数。但是,一个显然的问题是解释变量之间,即问题是解释变量之间,即 x 的当前和滞后值之间具有高度共的当前和滞后值之间具有高度共线性,而共线性问题的一个直接后果是参数估计量失去意义,线性,而共线性问题的一个直接后果是参数估计量失去意义,不能揭示不能揭示 x 的各个滞后量对因变量的影响,所以必须寻求另的各个滞后量对因变量的影响,所以必须寻求另外的估计方法。外的估计方法。 (4.5.1) 一、多项式分布滞后模型的估计方法一、多项式分布滞后模型的估计方法一、多项式分布滞后模型的估计方法一、多项式分布滞后模型的估计方法 认妇耻霹聊呈尺迫维肯础袖后芬傍灼搏担腻挨吴纫翠怯衙盈禾篡讼泊痢韵第04章其他回归方法第04章其他回归方法67 可以使用多项式分布滞后(可以使用多项式分布滞后(Polynomial Distributed Lags , PDLs)来减少要估计的参数个数,以此来平滑滞后系数。)来减少要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对低阶的多项式。平滑就是要求系数服从一个相对低阶的多项式。p 阶阶PDLs模型限制模型限制 系数服从如下形式的系数服从如下形式的 p 阶多项式阶多项式 j = 0 , 1 , 2 , , k (4.5.3)c 是事先定义常数:是事先定义常数: 玉真貉绞喻山御桂筏鄙烁晤萌盟徘恩携技赣沽颓箩播谊绥较伞霓船厚斌晕第04章其他回归方法第04章其他回归方法68 PDLs有时被称为有时被称为Almon分布滞后模型。常数分布滞后模型。常数 c 仅用来避仅用来避免共线性引起的数值问题,不影响免共线性引起的数值问题,不影响 的估计。这种定义允许的估计。这种定义允许仅使用参数仅使用参数 p 来估计一个来估计一个 x 的的 k 阶滞后的模型(如果阶滞后的模型(如果 p k,将显示将显示“近似奇异近似奇异”错误信息)。错误信息)。 定义一个定义一个PDL模型,模型,EViews用用(4.5.3)式代入到式代入到(4.5.1)式,将产生如下形式方程式,将产生如下形式方程 其中其中 (4.5.4)窟魁脑樱绰腿炕仍晦诉诧敦仔剑遂晴维凳截盎埋滨题骨有噪脊猎渺剥蛤浇第04章其他回归方法第04章其他回归方法69 一一旦旦从从(4.5.3)式式估估计计出出 ,利利用用(4.5.3)式式就就可可得得到到 的的各各系系数数。这这一一过过程程很很明明了了,因因为为是是 的的 线线性性变变换换。定定义义一一个个PDLs要要有有三三个个元元素素:滞滞后后长长度度k,多多项项式式阶阶数数(多多项项式式最最高高次次幂数)幂数)p和附加的约束条件。和附加的约束条件。 一个近端约束限制一个近端约束限制 x 对对 y 一期超前作用为零:一期超前作用为零: 一个远端约束限制一个远端约束限制 x 对对 y 的作用在大于定义滞后的数目衰的作用在大于定义滞后的数目衰减:减: 如果限制滞后算子的近端或远端,参数个数将减少一个来如果限制滞后算子的近端或远端,参数个数将减少一个来解释这种约束。如果对近端和远端都约束,参数个数将减少二解释这种约束。如果对近端和远端都约束,参数个数将减少二个。个。 EViews缺省不加任何约束。缺省不加任何约束。 牺使蛋搞扇烦匣一圾当屿列守钟洽迟逆靛秉哄坏掉补蔚珍毯桶利漂窃膏篡第04章其他回归方法第04章其他回归方法70 二、如何估计包含二、如何估计包含二、如何估计包含二、如何估计包含PDLsPDLs的模型的模型的模型的模型 通通过过PDL项项定定义义一一个个多多项项式式分分布布滞滞后后,信信息息在在随随后后的的括括号号内,按下列规则用逗号隔开:内,按下列规则用逗号隔开: 1. 序列名序列名 2. 滞后长度(序列滞后数)滞后长度(序列滞后数) 3. 多项式阶数多项式阶数 4. 一个数字限制码来约束滞后多项式:一个数字限制码来约束滞后多项式: 1 = 限制滞后近端为零限制滞后近端为零 2 = 限制远端为零限制远端为零 3 = 两者都限制两者都限制 如如果果不不限限制制滞滞后后多多项项式式,可可以以省省略略限限制制码码。方方程程中中可可以以包包含多个含多个PDL项。项。 例例如如: sales c pdl(y , 8 , 3 )是是用用常常数数,解解释释变变量量 y 的的当当前前和和8阶阶分分布布滞滞后后来来拟拟合合因因变变量量sales,这这里里解解释释变变量量 y 的的滞滞后后系数服从没有约束的系数服从没有约束的3阶多项式。阶多项式。截甩懂箍是余试寥焰闰检伊及遏夸嫩逞莆氢碴媚染荤肌瘫烫哺加汤妄桌争第04章其他回归方法第04章其他回归方法71 类类似似地地, y c pdl(x , 12 , 4 , 2) 包包含含常常数数,解解释释变变量量 x 的的当当前前和和12阶阶分分布布滞滞后后拟拟合合因因变变量量 y,这这里里解解释释变变量量x的的系系数数服服从从带带有有远端约束的远端约束的4阶多项式。阶多项式。 PDL也也可可用用于于二二阶阶段段最最小小二二乘乘法法TSLS。如如果果PDL序序列列是是外外生生变变量量,应应当当在在工工具具表表中中也也包包括括序序列列的的PDL项项。为为此此目目的的,可可以以定定义义PDL(*)作作为为一一个个工工具具变变量量,则则所所有有的的PDL变变量量都都将将被被作作为工具变量使用。例如:如果定义为工具变量使用。例如:如果定义TSLS方程为方程为 sales c inc pdl(y(-1) , 12 , 4) 使用工具变量:使用工具变量:z z(-1) pdl(*)则则 y 的分布滞后和的分布滞后和 z,z(-1) 都被用作工具变量。都被用作工具变量。 PDLsPDLs不能用于非线性定义。不能用于非线性定义。不能用于非线性定义。不能用于非线性定义。庸钱佐旬祟岿氛仓冶冻唉硼涪畏吱鞋吝沥栋瓣街戏颐蒋话奠风诊体正敦焚第04章其他回归方法第04章其他回归方法72 例例例例4.84.8 投资投资INV关于关于关于关于GDP的的 分布滞后模型的结果如下分布滞后模型的结果如下惫挠耽棱赌沂航纂僳蛛政蔗拓绞梗孺坎肛异肮问伸游破酮荚膳剩筋杏他庐第04章其他回归方法第04章其他回归方法73 逐逐个个观观察察,GDP滞滞后后的的系系数数多多数数在在统统计计上上都都不不显显著著。但但总总体体上上讲讲回回归归具具有有一一个个合合理理的的R2。这这是是回回归归自自变变量量中中多多重重共共线线的的典典型型现现象象,建建议议拟拟合合一一个个多多项项式式分分布布滞滞后后模模型型。估估计计一一个个无无限限制制的的3阶阶多多项项式式滞滞后后模模型型,输输入入变变量量列列表表: c INV(-1) PDL(GDP, 3, 2),窗窗口口中中显显示示的的多多项项式式估估计计系系数数,PDL01, PDL02, PDL03 分别对应方程分别对应方程(4.5.4)中中z1, z2, z3 的系数的系数 1, 2, 3。 维博称煮氢毙经戏摈谁抬逮牟氦滋齐滋遍镣剂等著警食敝蔫豪菱唉砌跌荧第04章其他回归方法第04章其他回归方法74 方程(方程(4.5.1)中的系数)中的系数 j j 在表格底部显示。在表格底部显示。 表格底部的滞后值是分布滞后的估计系数值,并且在平稳表格底部的滞后值是分布滞后的估计系数值,并且在平稳的假设下有的假设下有GDP对对INV的长期影响的解释。的长期影响的解释。 蹈捏长姓嚷敖幢擅魔扒阻妮怖蚊耘赋硼歇呻楚晰调浆秋来捆酝悼腕需皇识第04章其他回归方法第04章其他回归方法75待估计的方程:待估计的方程: INV=C(1)+C(2)*INV(-1)+C(6)*GDP+C(7)*GDP(-1)+C(8)*GDP(-2)+C(9)*GDP(-3)估计的方程:估计的方程: INVt= -17.36 + 0.97INVt-1 +0.18 GDPt+ 0.026GDPt-1 +0.12GDPt-2 - 0.09GDPt-3 +0.057GDPt-4+ t誉睹根东亮零瑚颁宗究耀斡婆菠宙配钥陆被兹笛奇舅晃矗右挂龟管项蝇碘第04章其他回归方法第04章其他回归方法76加了限制滞后近端为零的近端约束,显著性有明显改善。加了限制滞后近端为零的近端约束,显著性有明显改善。扯岛编娟睛钩焦著他芥渣狸酶罩寅浩诽晕怪桓酬汉亏掺滔权佑涩辛祥碗郧第04章其他回归方法第04章其他回归方法774.6 4.6 逐步最小二乘回归逐步最小二乘回归逐步最小二乘回归逐步最小二乘回归 建立回归模型的时候,可能会面临很多解释变量的取舍建立回归模型的时候,可能会面临很多解释变量的取舍问题,这些解释变量(包括相应的滞后变量)在经济意义上问题,这些解释变量(包括相应的滞后变量)在经济意义上可能都对因变量有影响而难以取舍,这种情形下,可以通过可能都对因变量有影响而难以取舍,这种情形下,可以通过逐步回归分析方法(逐步回归分析方法(stepwise least squares regression, STEPLS)利用各种统计准则筛选解释变量。)利用各种统计准则筛选解释变量。 奴讼茹道屯蹭疫攘告鬃筐噪探情噎永晨闰侥徐容毋啥仇埔宜逞垛隔尉疵纶第04章其他回归方法第04章其他回归方法78 这种方法包含前向法这种方法包含前向法(Forwards)和后向法和后向法(Backwards)两种,两种方法都是利用最大两种,两种方法都是利用最大t值或者相对应的最小值或者相对应的最小 p 值作为值作为变量入选标准,即根据变量的显著性进行筛选。前向法是根变量入选标准,即根据变量的显著性进行筛选。前向法是根据最小据最小 p 值进行逐步回归。首先设定变量的入选值进行逐步回归。首先设定变量的入选 p 值标准值标准(比如(比如0.05),即将入选变量的显著性水平设为),即将入选变量的显著性水平设为5%;其次选;其次选择所有变量中择所有变量中 p 值最小并且小于所设定入选值最小并且小于所设定入选 p 值标准的变量值标准的变量加入模型,接着在剩余变量中一直筛选下去;当剩余的每个加入模型,接着在剩余变量中一直筛选下去;当剩余的每个变量加入模型后其变量加入模型后其 p 值都大于设定的值都大于设定的 p 值时,或者增加回归值时,或者增加回归变量的数量达到了建模者事先设定的数值时,逐步回归运算变量的数量达到了建模者事先设定的数值时,逐步回归运算结束。结束。 1. 1. 单方向筛选法(单方向筛选法(单方向筛选法(单方向筛选法(Uni-directional methodUni-directional method)清梢辩纂詹扮炒迪哥防皇褐拂仕认朔董傣钦项泞鹏那叁突陈董疆娄江吃股第04章其他回归方法第04章其他回归方法79 后向法与前向法类似,只不过这种方法一开始就将后向法与前向法类似,只不过这种方法一开始就将全部的备选变量加入模型,然后选择全部的备选变量加入模型,然后选择p值最大的变量,如值最大的变量,如果此变量的果此变量的p值大于事先设定的数值,则将其剔除掉,然值大于事先设定的数值,则将其剔除掉,然后再在剩余的变量中依此做法选择剔除变量,直到模型后再在剩余的变量中依此做法选择剔除变量,直到模型中剩余的解释变量所对应的中剩余的解释变量所对应的p值都小于设定值,或者增加值都小于设定值,或者增加回归变量的个数达到设定数值时结束筛选。回归变量的个数达到设定数值时结束筛选。藐曲扯愚置泻悦查歼炭苛菠悬劣高妄惟厘艳孕渴侩涧躬自腥仰碑淘东下良第04章其他回归方法第04章其他回归方法80 逐步筛选法是以单方向筛选法为基础的,也包含前向法逐步筛选法是以单方向筛选法为基础的,也包含前向法(Forwards)和后向法和后向法(Backwards)两种方法。逐步前向筛选两种方法。逐步前向筛选法最先是和单方向前向法完全相同,将法最先是和单方向前向法完全相同,将p值最小并且小于所值最小并且小于所设定入选设定入选p值标准的变量加入模型,但不同的是,每次增加值标准的变量加入模型,但不同的是,每次增加变量后还要执行单方向后向法的程序,即检查模型中包含的变量后还要执行单方向后向法的程序,即检查模型中包含的解释变量中是否存在最大的解释变量中是否存在最大的p值超过设定值的情况,如果存值超过设定值的情况,如果存在,则剔除这个变量。每次按照单方向前向法增加一个变量在,则剔除这个变量。每次按照单方向前向法增加一个变量的时候,都要按照单方向后向法检查是否要剔除一些不显著的时候,都要按照单方向后向法检查是否要剔除一些不显著的变量。筛选结束规则与上述两种方法相同。的变量。筛选结束规则与上述两种方法相同。2. 2. 逐步筛选法(逐步筛选法(逐步筛选法(逐步筛选法(Stepwise methodStepwise method)深庙至者痛整蘸体屠栖揖恶补盎渺踏转缎迫缔莎受拽飞讶刻许辆受毋嫁耳第04章其他回归方法第04章其他回归方法81 这种方法基于模型整体效果,即通过判断拟合优度这种方法基于模型整体效果,即通过判断拟合优度R2作为筛选变量的标准。首先选择能够使得方程的作为筛选变量的标准。首先选择能够使得方程的R2增加最增加最大的变量入选,然后选择下一个能使回归方程大的变量入选,然后选择下一个能使回归方程R2增加最大增加最大的变量。接下来,将第一个选中的变量逐一与未选中的变的变量。接下来,将第一个选中的变量逐一与未选中的变量互换,一旦出现量互换,一旦出现R2超过现在的数值的情况,就将新的变超过现在的数值的情况,就将新的变量换入方程中,再将另一个变量与其他未选中的变量互换,量换入方程中,再将另一个变量与其他未选中的变量互换,这个过程一直进行下去,直到这个过程一直进行下去,直到R2无法改善的时候,再考虑无法改善的时候,再考虑加入第三个变量。加入了第三个变量后,仍然要执行类似加入第三个变量。加入了第三个变量后,仍然要执行类似的变量互换过程,一旦出现的变量互换过程,一旦出现R2超过既有数值的情况,就换超过既有数值的情况,就换入新的变量。当入选变量的个数达到事先设定的数值时,入新的变量。当入选变量的个数达到事先设定的数值时,结束筛选。结束筛选。 3. 3. 互换变量法(互换变量法(互换变量法(互换变量法(Swapwise methodSwapwise method)悯逐闯毒孵走梢狱沧哩粮贡署样适浸揍胆戳驾害乎焰谁侮涉俯姆熟泛降淑第04章其他回归方法第04章其他回归方法82 组合方法与互换变量法作用类似,即将给定的所有组合方法与互换变量法作用类似,即将给定的所有变量进行组合分别进行回归,使得变量进行组合分别进行回归,使得R2最大的变量组合即最大的变量组合即为最终的回归方程。这种方法适合于建模者事先设定了为最终的回归方程。这种方法适合于建模者事先设定了最终希望包含的变量个数的情形。最终希望包含的变量个数的情形。 4. 4. 组合法(组合法(组合法(组合法(Combinatorial methodCombinatorial method)掐迢快忆弘忻拙进朵敷胸萧个谰顶讥姥拣拌旺憎虑化豪赂窜标铸革涛空诺第04章其他回归方法第04章其他回归方法83 例例例例4.9 4.9 逐步回归模型逐步回归模型逐步回归模型逐步回归模型 在本例仍然研究例在本例仍然研究例4.8的美国的投资函数,采用美国的美国的投资函数,采用美国1947年年1季度季度1994年年4季度数据。因变量是美国总投资季度数据。因变量是美国总投资(inv),考虑用,考虑用GDP、个人消费、个人消费(cs)、政府收支、政府收支差额差额 (g_net) 和和GDP平减指数平减指数 (p),以及它们滞后,以及它们滞后1期的序列作为备选解释变量,期的序列作为备选解释变量,通过逐步回归方法最终选择出对投资有显著影响的解释变量。本例中,设定入选通过逐步回归方法最终选择出对投资有显著影响的解释变量。本例中,设定入选的解释变量应该满足其系数在的解释变量应该满足其系数在0.05(5%)的显著性水平下不为)的显著性水平下不为0,使用逐步筛选,使用逐步筛选法的前向法,按照这种方法的操作步骤,最终可以得到满足要求的模型估计结果法的前向法,按照这种方法的操作步骤,最终可以得到满足要求的模型估计结果为:为: t值值= (-5.9) (3.2) (13.98) (5.79) (8.02) (-5.0) (-5.1) (-3.2) R2=0.997 D.W. =1.755 入选变量的入选变量的 t 值对应的值对应的 p 值都远远小于值都远远小于0.05,因此,通过逐步回归方法,在,因此,通过逐步回归方法,在备选变量中,选择出了在备选变量中,选择出了在5%显著性水平下对因变量影响显著的解释变量。显著性水平下对因变量影响显著的解释变量。 瞄痔跋云址煮茨去狮吟者败评刹补怕抗孕冯见姐孰效翼高芽誊侯卫余义姐第04章其他回归方法第04章其他回归方法84 在方程估计方法设定对话框中选择方法:在方程估计方法设定对话框中选择方法:“STEPLS - Stepwise Least Squares”,EViews将会显示图将会显示图4.14所示窗口。所示窗口。在用逐步回归方法时,方程只能用列表法来设定。在上面的在用逐步回归方法时,方程只能用列表法来设定。在上面的对话框中依次输入因变量和必须要在最终方程形式中包含的对话框中依次输入因变量和必须要在最终方程形式中包含的自变量,在下面的对话框中输入可能会在最终方程中出现的自变量,在下面的对话框中输入可能会在最终方程中出现的即备选的解释变量。即备选的解释变量。5. 5. 在在在在EViewsEViews中进行逐步回归估计中进行逐步回归估计中进行逐步回归估计中进行逐步回归估计图图4.14 逐步最小二乘分析变量设定对话框逐步最小二乘分析变量设定对话框粟鸟陋羊昔欠暗邢骂制炼社专万虞蹿钧闯脾浆宣祁堡性那福晰禾昼遗军肢第04章其他回归方法第04章其他回归方法85图图图图4.14 4.14 逐步最小二乘分析变量设定对话框逐步最小二乘分析变量设定对话框逐步最小二乘分析变量设定对话框逐步最小二乘分析变量设定对话框宵谣篡允灭翘薯所撼疚哩讶溯疙蝶物咨报蛾留瞄器眷席缠疮任蒜邓咎开谎第04章其他回归方法第04章其他回归方法864.7 4.7 分位数回归分位数回归分位数回归分位数回归 分位数回归(分位数回归(Quantile Regression)最早由)最早由Koenker和和Bassett于于1978年提出年提出 ,它提供了回归变量,它提供了回归变量X和因变量和因变量Y的分位的分位数之间线性关系的估计方法。绝大多数的回归模型都关注因变数之间线性关系的估计方法。绝大多数的回归模型都关注因变量的条件均值,但是人们对于因变量条件分布的其他方面的模量的条件均值,但是人们对于因变量条件分布的其他方面的模拟方法也越来越有兴趣,尤其是能够更加全面地描述因变量的拟方法也越来越有兴趣,尤其是能够更加全面地描述因变量的条件分布的分位数回归。利用分位数回归解决经济学问题的文条件分布的分位数回归。利用分位数回归解决经济学问题的文献越来越多,尤其是在劳动经济学中取得了广泛应用。如在教献越来越多,尤其是在劳动经济学中取得了广泛应用。如在教育回报和劳动市场歧视等方面都出现了很好的研究成果。在经育回报和劳动市场歧视等方面都出现了很好的研究成果。在经济学中的应用研究还包括诸如财富分配不均问题、失业持续时济学中的应用研究还包括诸如财富分配不均问题、失业持续时间问题、食品支出的恩格尔曲线问题、酒精需求问题和日间用间问题、食品支出的恩格尔曲线问题、酒精需求问题和日间用电需求问题等。在金融学领域也涌现出大量使用分位数回归的电需求问题等。在金融学领域也涌现出大量使用分位数回归的应用研究成果,主要应用领域包括风险价值(应用研究成果,主要应用领域包括风险价值(Value at Risk, VaR)研究和刻画共同基金投资类型的指数模型。)研究和刻画共同基金投资类型的指数模型。 虫麓污挝翁综坯濒学蔚掩秆下珍咙门盲衍截可盾刊芒洞捞瓤涧释您燎师搽第04章其他回归方法第04章其他回归方法87 相对于最小二乘估计,分位数回归模型具有四个方面的相对于最小二乘估计,分位数回归模型具有四个方面的优势:优势: (1)分位数模型特别适合具有异方差性的模型;)分位数模型特别适合具有异方差性的模型; (2)对条件分布的刻画更加的细致,能给出条件分布的)对条件分布的刻画更加的细致,能给出条件分布的大体特征。每个分位点回归都赋予条件分布上某个特殊点(中大体特征。每个分位点回归都赋予条件分布上某个特殊点(中央或尾部)一些特征;把不同的分位点回归集中起来就能提供央或尾部)一些特征;把不同的分位点回归集中起来就能提供一个关于条件分布的更完整的统计特征描述。并且不同分位点一个关于条件分布的更完整的统计特征描述。并且不同分位点下所给出的参数估计本身也可能有值得进一步探讨的意义;下所给出的参数估计本身也可能有值得进一步探讨的意义; (3)分位数回归并不要求很强的分布假设,在扰动项非)分位数回归并不要求很强的分布假设,在扰动项非正态的情形下,分位数估计量可能比最小二乘估计量更为有效。正态的情形下,分位数估计量可能比最小二乘估计量更为有效。 (4)与最小二乘法通过使误差平方和最小得到参数的估)与最小二乘法通过使误差平方和最小得到参数的估计不同,分位数回归是通过使加权误差绝对值之和最小得到参计不同,分位数回归是通过使加权误差绝对值之和最小得到参数的估计,因此估计量不容易受到异常值的影响,从而估计更数的估计,因此估计量不容易受到异常值的影响,从而估计更加稳健。加稳健。 众废橙聘丝驳甫伴锋见桨财韭茨饵为曝敷堰待阅伞八禾辙给酮领脐靛急充第04章其他回归方法第04章其他回归方法884.7.1 4.7.1 分位数回归的基本思想和系数估计分位数回归的基本思想和系数估计分位数回归的基本思想和系数估计分位数回归的基本思想和系数估计 假设随机变量假设随机变量 Y 的概率分布为:的概率分布为: (4.7.1)Y 的的 分位数定义为满足分位数定义为满足 F(y) 的最小的最小y值,即:值,即:, (4.7.2)的分位点可以由最小化关于的目标函数得到,即:的分位点可以由最小化关于的目标函数得到,即:(4.7.3)其中,其中,argmin 函数表示取函数最小值时函数表示取函数最小值时 的取值,的取值, (u) u( I(u 0) 称为检查函数(称为检查函数(check function),),依据依据 u 取值符号进行非对称的加权。取值符号进行非对称的加权。 泣绍赢沼壤颤膜况摧列晤就的激排舒击沥雄顷锑计蓖谎康冗椭宙缺孟氧岸第04章其他回归方法第04章其他回归方法89 考察此最小化问题的一阶条件为:考察此最小化问题的一阶条件为: (4.7.4)即即F( ) = ,也就是说,也就是说F(Y)的第的第 个分位数是上述优化问题的解。个分位数是上述优化问题的解。 F(y) 可以由如下的经验分布函数替代:可以由如下的经验分布函数替代: (4.7.5)其中其中 y1,y2,yn 为为Y 的的 N 个样本观测值;个样本观测值;I(z) 是指示函数,是指示函数,z 是条件关系式,当是条件关系式,当 z 为真时,为真时,I(z) = 1;当;当 z 为假时,为假时,I(z) = 0。式。式(4.7.3)中条件关系式)中条件关系式 z 为为 yi y,当,当 yi y 时,时,I(yi y) = 1,否,否则取值为则取值为0。 示速敲次策惜您肋踌示牺板肘儡胆诸施玩厢裕串颧萧惯雾溃光锣贱甚仗烬第04章其他回归方法第04章其他回归方法90 相应地,经验分位数为:相应地,经验分位数为:, (4.7.6) 式(式(4.7.3)可以等价地表示为下面的形式:)可以等价地表示为下面的形式: (4.7.7) 厅廊羔仪榆粉岿乍妈涌锁屈搔鲤玻侈雄卷渺璃政第蔑荒爸啦洽缄可习海抉第04章其他回归方法第04章其他回归方法91 现假设现假设Y的条件分位数由的条件分位数由k个解释变量组成的矩阵个解释变量组成的矩阵X线性线性表示:表示: (4.7.8)其中,其中,xi =(x1i,x2i,xki) 为解释变量向量,为解释变量向量, ( ) =( 1, 2, k ) 是是 分位数下的系数向量。当分位数下的系数向量。当 在在 (0, 1) 上上变动时,求解下面的最小化问题就可以得到分位数回归不同变动时,求解下面的最小化问题就可以得到分位数回归不同的参数估计:的参数估计: (4.7.9)特别地,当特别地,当 = 0.5 时为最小绝对值离差法(时为最小绝对值离差法(Least Absolute Deviations, LAD)。另外,分位数回归的系数估计需要求解)。另外,分位数回归的系数估计需要求解线性规划问题,很多种方法可以对此问题进行求解。线性规划问题,很多种方法可以对此问题进行求解。 旁需骗沁柬苦消秒违盐酋碴甲捆昂绪杉产耙象卒谊邵吧铡看敷狠盲窿萄圣第04章其他回归方法第04章其他回归方法924.7.2 4.7.2 系数协方差的估计系数协方差的估计系数协方差的估计系数协方差的估计1独立同分布设定下协方差矩阵的直接估计方法独立同分布设定下协方差矩阵的直接估计方法 (1)Siddiqui 差商法差商法 (2)稀疏度的核密度估计量)稀疏度的核密度估计量 2独立但不同分布设定下协方差矩阵的直接估计方法独立但不同分布设定下协方差矩阵的直接估计方法 3自举法(自举法(Bootstrap) (1)X-Y自举法自举法 (2)残差自举方法)残差自举方法 (3)马尔可夫链边际自举法)马尔可夫链边际自举法 咨蔽右胃胡灭奔碘驱逮淤涕鄙慢稠锻稠喜茄徘巩址壳浅渔厘肋镀秃滤搽妒第04章其他回归方法第04章其他回归方法934.7.3 4.7.3 模型评价和检验模型评价和检验模型评价和检验模型评价和检验 1 1拟合优度拟合优度拟合优度拟合优度 与传统的回归分析的拟合优度与传统的回归分析的拟合优度R2类似,分位数回归模型也类似,分位数回归模型也可以计算拟合优度。在分位数回归中,参数估计是通过可以计算拟合优度。在分位数回归中,参数估计是通过 (4.7.29)得到的。将数据写为得到的。将数据写为 xi = (1,x i1) , ( ) = ( 0( ), 1( ) ) ,这样式(,这样式(4.7.29)可以写为)可以写为 (4.7.30)最小化最小化 分位数回归的目标函数(分位数回归的目标函数(objective function),得到),得到 (4.7.31) 希味柠处零捂晌扣押忱郎踩誓量博绞紫谅拭索闪烩陨喂宇入祟泵掷乾年桌第04章其他回归方法第04章其他回归方法94 回归方程中只包含常数项情形下,最小化分位数回归的目回归方程中只包含常数项情形下,最小化分位数回归的目标函数(标函数(objective function),得到),得到 (4.7.32) 定义分位数回归方程的定义分位数回归方程的Machado拟合优度为拟合优度为 (4.7.33) R1( )位于位于01之间,之间,R1( )越大说明模型估计的越好,反越大说明模型估计的越好,反之之R1( )越小模型估计越差。可以看出,这与用普通最小二乘越小模型估计越差。可以看出,这与用普通最小二乘法估计的传统回归方程中定义的拟合优度法估计的传统回归方程中定义的拟合优度R2类似,分位数回归类似,分位数回归拟合优度的计算是基于分位数回归方程目标函数的最小值与只拟合优度的计算是基于分位数回归方程目标函数的最小值与只用常数项作为解释变量时的分位数回归方程目标函数最小值的用常数项作为解释变量时的分位数回归方程目标函数最小值的关系。关系。究维堡滞潜苔的亩刹练谜委莽揽险礼靳阶受葛噎秆待棺辛美借异曝甥奢耍第04章其他回归方法第04章其他回归方法952 2拟似然比检验(拟似然比检验(拟似然比检验(拟似然比检验(Quasi-LR TestQuasi-LR Test) 3 3分位数过程检验(分位数过程检验(分位数过程检验(分位数过程检验(Quantile Process TestingQuantile Process Testing) (1)斜率相等检验()斜率相等检验(Slope Equality Testing) (2)对称检验()对称检验(Symmetry Testing) 勿坛冰掐众苛蕉毕杨氖钵呢灿皑赘傅虏秃唬膨闲惧恳吕漂错蹈肘将迪胀扳第04章其他回归方法第04章其他回归方法96 在在在在EViewsEViews中进行分位数回归中进行分位数回归中进行分位数回归中进行分位数回归 1. 1. 方法选择方法选择方法选择方法选择 为了使用分位数回归方法估计方程,在方程设定对话框的估计方法为了使用分位数回归方法估计方程,在方程设定对话框的估计方法中选择中选择“QREG”,打开分位数回归估计对话框:,打开分位数回归估计对话框:图图4.15 4.15 分位数回归分位数回归 “Quantile to estimate”后面输入值,可以输入后面输入值,可以输入01之间的任意数值,默之间的任意数值,默认值是认值是0.5,即进行中位数回归。,即进行中位数回归。 堪影描疙惠烧屉敢赤娘灯炒弗瞻应湛绵降杉鸯战畔惹仔在拦直啤翅帐啸缘第04章其他回归方法第04章其他回归方法97例例例例4.10 4.10 分位数回归分位数回归分位数回归分位数回归 利用例利用例3.1的消费和收入数据,我们建立如下的回归方程研究的消费和收入数据,我们建立如下的回归方程研究政府支出对居民消费的影响:政府支出对居民消费的影响: (4.7.44)其中,其中,cs为实际居民消费,为实际居民消费,inc为实际可支配收入,为实际可支配收入,fe为财政支出,为财政支出,考虑到财政政策通常具有时滞的特点,模型中采用滞后一期的财考虑到财政政策通常具有时滞的特点,模型中采用滞后一期的财政支出作为解释变量。所有变量均为剔除了价格因素的年度数据,政支出作为解释变量。所有变量均为剔除了价格因素的年度数据,样本区间为样本区间为19782006年。为了进行比较,我们同时给出最小二年。为了进行比较,我们同时给出最小二乘法以及三个不同分位点的分位数回归估计结果(见表乘法以及三个不同分位点的分位数回归估计结果(见表4.4)。)。 叹玻慢与袖羽邑褥睬夯蛇究纯蝶角尊烤匣军橱疼练汇迪钞科宪钎真原银燎第04章其他回归方法第04章其他回归方法98注:括号内为弹性系数的注:括号内为弹性系数的t值;值; Quant20, Quant50, Quant80分别分别 代表代表20%,50%,80%分位数。分位数。系数估计结果系数估计结果OLSQuant20Quant50Quant800.28(5.78)0.21(2.78)0.25(3.44)0.28(3.17)0.47(7.22)0.49(4.49)0.38(2.33)0.45(2.93)0.47(7.57)0.44(4.22)0.56(3.55)0.49(3.43) 0.027 (1.65)0.048(1.62)0.034(1.196)0.026(0.82)R20.9990.970.970.98表表表表4.4 4.4 最小二乘法和分位数回归结果最小二乘法和分位数回归结果最小二乘法和分位数回归结果最小二乘法和分位数回归结果 汀抡芯哩嚼疲弓鼻奋映柏崇湾节产搽叮幕鹤髓私餐苍蓄滔盏备凯凿楔纂澳第04章其他回归方法第04章其他回归方法99 从估计结果可以看出,对于不同的估计方法,居民实际可从估计结果可以看出,对于不同的估计方法,居民实际可支配收入、前期消费水平两个变量的弹性系数变化不大。尽管支配收入、前期消费水平两个变量的弹性系数变化不大。尽管在以往的研究中,政府支出对居民消费的影响还没有得出一致在以往的研究中,政府支出对居民消费的影响还没有得出一致的结论,但是在本例中三种估计的结果表明政府支出对居民消的结论,但是在本例中三种估计的结果表明政府支出对居民消费的弹性值均为正,说明在我们所分析的样本区间内政府支出费的弹性值均为正,说明在我们所分析的样本区间内政府支出与居民消费之间是互补的,政府支出的增加有利于加强基础设与居民消费之间是互补的,政府支出的增加有利于加强基础设施建设和提高社会保障水平,使居民减少储蓄,尤其是预防性施建设和提高社会保障水平,使居民减少储蓄,尤其是预防性储蓄,从而增加消费。最小二乘估计给出的是政府支出对消费储蓄,从而增加消费。最小二乘估计给出的是政府支出对消费的平均影响效果,而分位数回归给出的是消费处于不同分位水的平均影响效果,而分位数回归给出的是消费处于不同分位水平时,政府支出对居民消费的影响。在平时,政府支出对居民消费的影响。在20%,50%和和80%的分的分位点上政府支出的弹性分别为位点上政府支出的弹性分别为0.048,0.034,0.026,并且后两,并且后两个水平的估计是不显著的,说明当消费水平较低时,政府支出个水平的估计是不显著的,说明当消费水平较低时,政府支出的影响相对较大,而对于较高的消费水平,政府支出的影响变的影响相对较大,而对于较高的消费水平,政府支出的影响变小,并且是不显著的。因为当消费水平较高时,进一步提升的小,并且是不显著的。因为当消费水平较高时,进一步提升的空间变小,政府支出对其影响也变小空间变小,政府支出对其影响也变小。 洪掖辱囤宅匿嫩时匝哉榜枉赡居乌向会讣速根娇壶袜燃陛短蕴厩兵品扣依第04章其他回归方法第04章其他回归方法100 例例4.10的结果输出如下的结果输出如下(以以0.2分位数的估计结果为例分位数的估计结果为例):2. 2. 分位数回归的输出结果分位数回归的输出结果分位数回归的输出结果分位数回归的输出结果 DependentVariable:LOG(CSP)Method:QuantileRegression(tau=0.2)CoefficientStd.Errort-StatisticProb.C0.2095580.0752572.7845470.0103LOG(INC)0.4853830.1082084.4856300.0002LOG(EXPFP(-1)0.0475700.0293631.6200650.1183LOG(CSP(-1)0.4381560.1039404.2154700.0003PseudoR-squared0.972919Meandependentvar8.536631AdjustedR-squared0.969534S.D.dependentvar0.604396S.E.ofregression0.029215Objective0.125904Quantiledependentvar7.990470Objective(const.only)4.649230Sparsity0.084695Quasi-LRstatistic667.5910Prob(Quasi-LRstat)0.000000杰溜滥镁键羔琼符围毛驴枕检洪丙配馒谦龟愚娥爹贯械乌驴垫英僳内翠涣第04章其他回归方法第04章其他回归方法101 输出结果的上方显示了设定的内容,本例中设定用输出结果的上方显示了设定的内容,本例中设定用“Huber Sandwich”方法估计系数协方差,用方法估计系数协方差,用“Siddiqui(mean fitted)”方法得到稀疏度,用方法得到稀疏度,用“Hall-Sheather”方法计算带宽。下面显示了系数估计值、标准差、方法计算带宽。下面显示了系数估计值、标准差、t检验值和相应的检验值和相应的p值。最下方显示了拟合优度和调整值、稀值。最下方显示了拟合优度和调整值、稀疏度数值、目标函数的最小值(疏度数值、目标函数的最小值(“objective”)、仅包含)、仅包含常数的目标函数的最小值(常数的目标函数的最小值(“Objective (const. only))、)、因变量序列的经验分位数(因变量序列的经验分位数(“Quantile dependent var”)、)、拟似然比检验值(拟似然比检验值(“Quasi-LR statistic”)和相应的)和相应的p值值(“Prob(Quasi-LR stat)”)等。)等。 佬皋抚威凤众丁芹驻叭玫擎沧磊汉攀旗逆帽班油导虾厌滨扫舔殉酝擒尸枉第04章其他回归方法第04章其他回归方法102 3 3分位数回归中的视图和过程分位数回归中的视图和过程分位数回归中的视图和过程分位数回归中的视图和过程 分位数回归中的多数视图和过程都与用分位数回归中的多数视图和过程都与用OLS法估计的法估计的方程对象中提供的功能相同,但有些地方还是值得注意,方程对象中提供的功能相同,但有些地方还是值得注意,如冗余变量检验、遗漏变量检验和如冗余变量检验、遗漏变量检验和“Ramsey RESET”检验检验将都用到拟似然比检验。而在分位数过程(将都用到拟似然比检验。而在分位数过程(“Quantile process”)里,提供了分位数回归中特有的三个功能:过)里,提供了分位数回归中特有的三个功能:过程系数(程系数(“Process Coefficients”)、斜率相等检验)、斜率相等检验(“Slope Equality Test”)和对称检验()和对称检验(“Symmetric Quantiles Test”)。)。谎裁灭鹅崩泞辰株湾坡商外挚小敲拌偷赘竿复惋泵碱篡念峪拍伙下蜡隘膏第04章其他回归方法第04章其他回归方法103 (1)“Process Coefficients”:通过这个功能可以同时观察多种分:通过这个功能可以同时观察多种分位数设定下的系数估计结果。可以选择结果输出位数设定下的系数估计结果。可以选择结果输出(“output”)的显示方的显示方式,即表格式,即表格(“table”)或者图形或者图形(“graph”),默认状态是以表格形式,默认状态是以表格形式显示系数估计值、标准差、显示系数估计值、标准差、t检验值和检验值和p值。如果选择以图形的方式显示,值。如果选择以图形的方式显示,需要指定置信度,默认状态是需要指定置信度,默认状态是95%。下面一栏中可以设定在何种分位数。下面一栏中可以设定在何种分位数下估计模型,系统默认数值是下估计模型,系统默认数值是10分位数,即对因变量的分位数,即对因变量的10%、20%、一、一直到直到90%分位数情形分别估计系数,如果输入分位数情形分别估计系数,如果输入20,则对因变量的,则对因变量的5%、10%、一直到、一直到95%分位数情形分别估计系数。分位数情形分别估计系数。 (2)“Slope Equality Test”:这个功能用来检验因变量的不同分:这个功能用来检验因变量的不同分位数回归估计中斜率系数是否相同。默认状态下,只比较位数回归估计中斜率系数是否相同。默认状态下,只比较25%、50%、75%三种情形,当然也可以自行设定。三种情形,当然也可以自行设定。 (3)“Symmetric Quantiles Test”检验对称的分位数回归估计出来检验对称的分位数回归估计出来的系数的平均值是否与中位数回归的系数估计值相等。的系数的平均值是否与中位数回归的系数估计值相等。缄获坚苹拿入聊凯赋苗茅该瞻抿播坟嚷庇殴碱黑啦挝科缀诸释范砌辕羔柑第04章其他回归方法第04章其他回归方法1044.8 4.8 非参数回归模型非参数回归模型非参数回归模型非参数回归模型 前面介绍的回归模型,无论是线性形式还是非线性形前面介绍的回归模型,无论是线性形式还是非线性形式,都需要明确地给出被解释变量和解释变量之间的关系,式,都需要明确地给出被解释变量和解释变量之间的关系,才能进行参数估计进而利用模型的估计结果分析问题。然才能进行参数估计进而利用模型的估计结果分析问题。然而,变量之间关系的设定具有很强的主观性,建模者往往而,变量之间关系的设定具有很强的主观性,建模者往往需要尝试多种形式的模型,才能根据统计检验和经济意义需要尝试多种形式的模型,才能根据统计检验和经济意义等多种因素的考虑最终选定模型的形式。本节中将要对非等多种因素的考虑最终选定模型的形式。本节中将要对非参数回归模型作初步的介绍。非参数模型假定变量间的关参数回归模型作初步的介绍。非参数模型假定变量间的关系是未知的,其所要估计的是回归函数本身。对于这个未系是未知的,其所要估计的是回归函数本身。对于这个未知函数的估计通常可以采用核估计和近邻估计等方法。知函数的估计通常可以采用核估计和近邻估计等方法。罚法金蛆愚抿剩人惟娱陈援俄州桨勺窥租痪箔挞闸拙圃煌揩兴撅偿匝御清第04章其他回归方法第04章其他回归方法1054.8.1 4.8.1 密度函数的非参数估计密度函数的非参数估计密度函数的非参数估计密度函数的非参数估计 1 1已知密度函数形式的估计已知密度函数形式的估计已知密度函数形式的估计已知密度函数形式的估计 若已知密度函数的形式,可使用参数估计方法来估计模若已知密度函数的形式,可使用参数估计方法来估计模型参数。假设随机变量型参数。假设随机变量X1,X2,XN 独立同分布,其密独立同分布,其密度函数为度函数为 f (x| ),其中,其中 是未知参数,则是未知参数,则 的最大似然估的最大似然估计为使计为使X1,X2,XN 的联合密度函数的联合密度函数 (4.8.1)达到最大。表达到最大。表4.5给出一些重要的理论分布的密度函数。可以给出一些重要的理论分布的密度函数。可以利用极大似然估计方法得到未知参数利用极大似然估计方法得到未知参数 的估计值,进而求出的估计值,进而求出近似的密度函数。近似的密度函数。 蚌缅斌妒扮钵丽额呵襟窝嚣瓢晒空鸿赖拽扬娜践偿窘啦萤和清中翟凋辊碧第04章其他回归方法第04章其他回归方法1062 2一元密度函数的核估计一元密度函数的核估计一元密度函数的核估计一元密度函数的核估计 随机变量密度函数的具体形式往往是不知道的,本节在对随随机变量密度函数的具体形式往往是不知道的,本节在对随机变量的密度函数没有任何信息的情况下讨论密度函数的核估计。机变量的密度函数没有任何信息的情况下讨论密度函数的核估计。 假设随机变量假设随机变量X1,X2,XN 同分布,其密度函数为同分布,其密度函数为 f (x) 未知。可从经验分布函数导出密度函数的核估计,经验分布函数未知。可从经验分布函数导出密度函数的核估计,经验分布函数为为 (4.8.2)其中其中N是观测值的数目,是观测值的数目,I(z) 是指标函数,是指标函数,z 是条件关系式,当是条件关系式,当 z为真时,为真时,I(z) = 1;当;当 z 为假时,为假时,I(z) = 0。式(。式(4.8.2)中条件关系)中条件关系式式 z 为为Xi y,Xi 是是 i 点的样本观测值,当点的样本观测值,当 Xi y 时,时,I(Xi y) = 1,否则取值为,否则取值为0。镁食冤浊喻骑厘坪退窘缄垛何战溯啡榆僻识弘搭沁冬称罪店逆朵碟丈掂透第04章其他回归方法第04章其他回归方法107 取核函数为均匀核:取核函数为均匀核: (4.8.3)则核密度估计为则核密度估计为 (4.8.4)其中,其中,h是带宽(或平滑参数),将核函数放宽就得到一般的核是带宽(或平滑参数),将核函数放宽就得到一般的核密度估计密度估计 (4.8.5)其中,其中,K是核函数。核函数的形式参见本章是核函数。核函数的形式参见本章4.7.2节的表节的表4.4。铜针废妊纷肺沸女坑检那盈蔑这火缮忱栅芳刮黑腮胚能领壁均涂龟剂器估第04章其他回归方法第04章其他回归方法1084.8.2 4.8.2 一元非参数计量经济模型一元非参数计量经济模型一元非参数计量经济模型一元非参数计量经济模型 设随机变量设随机变量 Y 为被解释变量,为被解释变量,X 为解释变量,表示实际为解释变量,表示实际影响影响 Y 的一个重要因素,它既可以是确定性变量,也可以是的一个重要因素,它既可以是确定性变量,也可以是随机变量。给定样本观测值随机变量。给定样本观测值(Y1, X1),(Y2, X2),(YN, XN),假定,假定Yi 独立同分布,可建立非参数模型:独立同分布,可建立非参数模型: (4.8.6)其中:其中:m( ) 是未知的函数,是未知的函数,ui 为随机误差项。对于模型为随机误差项。对于模型(4.8.6)有许多种非参数估计方法:核估计、局部线性估计、有许多种非参数估计方法:核估计、局部线性估计、近邻估计、正交序列估计和样条估计等。近邻估计、正交序列估计和样条估计等。沾挠疹妻咐审驼完承肝眼塑同楚揩辜序遣稽搅张簿崔淡磐页桔蔷鹏项驼邯第04章其他回归方法第04章其他回归方法109 局部多项式核估计是对每一个局部多项式核估计是对每一个x点进行局部加权最小二点进行局部加权最小二乘估计来拟合乘估计来拟合Y,即最小化,即最小化 (4.8.12) 可见,核估计等价于局部加权最小二乘估计。需要注意可见,核估计等价于局部加权最小二乘估计。需要注意的是对于不同的的是对于不同的 x,各参数,各参数 的估计值不同。的估计值不同。k 是局部多项是局部多项式阶数,当式阶数,当 k =1 时,就是局部线性回归。时,就是局部线性回归。化截堕勉衔砸淄窗眯蔡遂婚诞句松橱锨辐喜白府摆辆初紊蛊巴胀艺垄狸甭第04章其他回归方法第04章其他回归方法110 核估计的核心问题是核函数和带宽的选择。常用的核函核估计的核心问题是核函数和带宽的选择。常用的核函数参见本章数参见本章4.7.2节的表节的表4.4,有均匀核、高斯核和,有均匀核、高斯核和Epanechnikov核等。通常带宽设置为核等。通常带宽设置为 (4.8.13)其中:其中:XL,XU 是是 X 的取值范围。的取值范围。 在进行局部多项式核估计时,通常指定一个点数在进行局部多项式核估计时,通常指定一个点数 M,假,假设序列设序列 X 的样本值范围是的样本值范围是 XL,XU,则在如下点进行多项,则在如下点进行多项式回归估计:式回归估计: (4.8.14)俐妥急烤猛河相卷菜崭丰跃裸驳烃渡崔干窍秦谗釉骨顺皋蛀殃朵橙蹿疮切第04章其他回归方法第04章其他回归方法111 2 2Nadaraya-WatsonNadaraya-Watson核估计核估计核估计核估计 Nadaraya-Watson核估计问题等价于在式核估计问题等价于在式(4.8.12)中中k =0时的情况,即下式所表示的加权残差平方和的最小化问题:时的情况,即下式所表示的加权残差平方和的最小化问题: (4.8.15)可以看出,可以看出,Nadaraya-Watson核估计是局部多项式核估计的核估计是局部多项式核估计的特殊形式,仅包含常数项,即对于每个特殊形式,仅包含常数项,即对于每个 x,只需要估计,只需要估计 0。碱喇瞒刚衣泛下肠榜哀贝抢梦桨奎迈脚骨籽图僚澄囚真涧枪笛漏俯数铅孵第04章其他回归方法第04章其他回归方法112 3 3邻近点加权拟合邻近点加权拟合邻近点加权拟合邻近点加权拟合 这是一种带宽基于最邻近点的局部回归。对样本中的每这是一种带宽基于最邻近点的局部回归。对样本中的每一数据点一数据点x,它拟合出一条局部的并经加权的回归线。局部是,它拟合出一条局部的并经加权的回归线。局部是说只用邻近点也就是样本的子集来一步步回归,并且邻近点说只用邻近点也就是样本的子集来一步步回归,并且邻近点越远给越小的权数。非参数回归模型(越远给越小的权数。非参数回归模型(4.8.6)的邻近点拟合)的邻近点拟合估计为:估计为: (4.8.16)其中三次方权数(其中三次方权数(Tricube):): (4.8.17)其中:其中:di = | Xi x|,选取在,选取在(0,1)之间的一个分数之间的一个分数 做为带宽,做为带宽,控制拟合线的平滑程度,分数控制拟合线的平滑程度,分数 越大拟合线越平滑。越大拟合线越平滑。 蛹掌脆餐典奢传唾咆丫看雾辕孵隅嗣覆燃沼赊转瞪翌肢渐窿跪泥努满冒悄第04章其他回归方法第04章其他回归方法113 N是总样本个数的是总样本个数的100 %, N表示对表示对 N 取整。式取整。式(4.8.16)在给定点在给定点 x 使用使用 N个观测值做局部回归,最邻近个观测值做局部回归,最邻近定义意味着被估计点周围点的个数不必是对称的。定义意味着被估计点周围点的个数不必是对称的。d( N)是是距离距离x 最近的最近的 N个样本点中的最大距离。这样,距离个样本点中的最大距离。这样,距离 x 最最近的近的 N个样本在进行局部回归时将按照距离个样本在进行局部回归时将按照距离 x 远近而被赋远近而被赋予不同的权重。而其他样本点将不予考虑,即权重为予不同的权重。而其他样本点将不予考虑,即权重为0。对于。对于给定点给定点 x,可得,可得 (4.8.18) 盎柳乃省直蓟部摘法起尖盗锁晤侧额蔫镭郡囚可饱哦鹊纺稳孺部旦鹤田栈第04章其他回归方法第04章其他回归方法114 在在在在EViewsEViews中进行非参数估计中进行非参数估计中进行非参数估计中进行非参数估计 1 1一元密度函数的核估计一元密度函数的核估计一元密度函数的核估计一元密度函数的核估计 在已知随机变量的密度函数形式时,在序列对象菜单中选在已知随机变量的密度函数形式时,在序列对象菜单中选择择“View/Graph”,出现,出现“Graph Option”对话框,选择对话框,选择“Graph Type中的中的“Distribution”,然后在对话框的右边选,然后在对话框的右边选择择“Theore- tical Distribution”,点击右边的,点击右边的“Option”,出,出现现“Distribution Plot Customize”对话框,可以按表对话框,可以按表4.5选择选择相应的分布函数形式计算给定变量的密度函数,用户可以给出相应的分布函数形式计算给定变量的密度函数,用户可以给出相应的未知参数值,如果没有给出,相应的未知参数值,如果没有给出,EViews将自动近似计算未将自动近似计算未知参数。知参数。 对于密度函数形式未知的情况下可以选择对于密度函数形式未知的情况下可以选择“Kernel Density”,也出现,也出现“Distribution Plot Customize”对话框,可对话框,可以按表以按表4.4选择相应的核函数形式。选择相应的核函数形式。 臻莉葡知拣碰喧软技何肖箔融掀罪岳亢瓣恨缠养谎款募废被淑鹏撕胡陶瓷第04章其他回归方法第04章其他回归方法115图图4.16 4.16 一元密度函数的核估计对话框一元密度函数的核估计对话框绰搀滓矛扼盘泼农柱脉氦植还是芬扰贷哥呛饵租彼超委俱鸯沉学矿清缨哲第04章其他回归方法第04章其他回归方法116例例例例4.11 4.11 一元密度函数的核估计一元密度函数的核估计一元密度函数的核估计一元密度函数的核估计 利用一元密度函数的核密度估计方法计算例利用一元密度函数的核密度估计方法计算例4.1的人均家的人均家庭交通及通讯支出庭交通及通讯支出(cum),人均可支配收入,人均可支配收入(in)的密度函数,的密度函数,核函数的形式选为核函数的形式选为Biweight核形式。结果如下:核形式。结果如下:图图图图4.6 4.6 cumcum的密度函数的密度函数的密度函数的密度函数图图图图4.7 4.7 inin的密度函数的密度函数的密度函数的密度函数 煤嫂吵巡海忻贮产趾疼幽沦瞪胁套沸栖净谗帐劲秩髓飞摊外秋但校诌哭眠第04章其他回归方法第04章其他回归方法117例例例例4.12 4.12 非参数核估计和邻近点加权拟合非参数核估计和邻近点加权拟合非参数核估计和邻近点加权拟合非参数核估计和邻近点加权拟合 本例中将用核估计和邻近点加权拟合来描述变量本例中将用核估计和邻近点加权拟合来描述变量Y和和X之间之间的关系,其中,的关系,其中,X是从是从0至至1之间的均匀分布随机抽取的之间的均匀分布随机抽取的1000个个数,数,Y由下式生成:由下式生成:, (4.8.19)图图4.8描绘了描绘了Y与与X样本散点图和这两个变量间的真实函数关系样本散点图和这两个变量间的真实函数关系m(x)。图图图图4.8 4.8 散点图和变量间真实的函数关系散点图和变量间真实的函数关系散点图和变量间真实的函数关系散点图和变量间真实的函数关系mm( (x x) ) 跋尉粤坍绵麦施兴接赦枣戈栓录息吩描宝录碱售狰徊圣混拱犯亢狐蕊尤咎第04章其他回归方法第04章其他回归方法118 分别利用核估计和邻近点加权拟合描述这两个变量的函数估计。对分别利用核估计和邻近点加权拟合描述这两个变量的函数估计。对于核估计,如果设定带宽于核估计,如果设定带宽h=0.15、二次多项式即、二次多项式即k=2,并且核函数选为,并且核函数选为Epanechnikov形式,将可以得到核估计如图形式,将可以得到核估计如图4.9所示;如果设定所示;如果设定p=300、二次多项式即二次多项式即k=2,将可以得到邻近点加权拟合如图,将可以得到邻近点加权拟合如图4.10所示。所示。 图图图图4.9 4.9 核估计的结果核估计的结果核估计的结果核估计的结果 图图图图4.10 4.10 邻近点加权拟合的估计结果邻近点加权拟合的估计结果邻近点加权拟合的估计结果邻近点加权拟合的估计结果 可见,通过合适的设定,核估计和近邻估计都可以得到与真实的函可见,通过合适的设定,核估计和近邻估计都可以得到与真实的函数关系很相近的估计结果,但核估计的结果与真实的关系更加符合。数关系很相近的估计结果,但核估计的结果与真实的关系更加符合。 悯旷茬驻鬼被谢眯廊包微靖胯舷释辗何僚需籽写漳釜慢矛劳琅送怒慕治胯第04章其他回归方法第04章其他回归方法119 2 2一元非参数计量经济模型估计一元非参数计量经济模型估计一元非参数计量经济模型估计一元非参数计量经济模型估计 以例以例4.12的变量来说明在的变量来说明在EViews中如何一元非参数中如何一元非参数计量经济模型的估计。首先,建立包含计量经济模型的估计。首先,建立包含X和和Y的组对象,的组对象,这里要注意必须按照解释变量和被解释变量这样的顺序依这里要注意必须按照解释变量和被解释变量这样的顺序依次选择,如本例的组中包含的第一个成员是次选择,如本例的组中包含的第一个成员是X,第二个成,第二个成员是序列员是序列Y。雨笨血诉撂吨除被浑霸蔡羊消燕灌抢寻蒙伯的羚柄宫空撤氨妙糖织鹏骸黎第04章其他回归方法第04章其他回归方法120 (1 1)核估计)核估计)核估计)核估计 如果想要进行核估计,在组对象中选择:如果想要进行核估计,在组对象中选择:“View/Graph”,然后,在,然后,在图形选项的图形类别中选择图形选项的图形类别中选择“Scatter”,右侧的详细描述将相应发生变,右侧的详细描述将相应发生变化,在化,在“fit lines”的下拉列表中选择的下拉列表中选择“kernel fit”,然后,单击其右侧的,然后,单击其右侧的“Option”,将出现图,将出现图4.17所示的所示的“Scatterplot Customize”对话框。对话框。 图图图图4.17 4.17 核估计对话框核估计对话框核估计对话框核估计对话框 在这个对话框中,需要确定局部回归的多项式形式、核函数形式、带在这个对话框中,需要确定局部回归的多项式形式、核函数形式、带宽和其它选项。宽和其它选项。 禹枉觅腑售唇硫舌苹渠汕隐漏脉裙慈胶踩客澄濒鸟唐专篷箭郎次宙缕到钠第04章其他回归方法第04章其他回归方法121 (2 2)邻近点加权拟合估计)邻近点加权拟合估计)邻近点加权拟合估计)邻近点加权拟合估计 如果想要进行邻近点加权拟合估计,要在组对象中选择如果想要进行邻近点加权拟合估计,要在组对象中选择view/Graph/ Scatter/Scatter with nearest neighbor fit,将出现,将出现图图4.18所示的对话框。所示的对话框。 在在“Bandwidth”中要输入中要输入01之间的小数之间的小数 ,它将控制局,它将控制局部回归中用到的样本个数,若样本总数为部回归中用到的样本个数,若样本总数为N,则局部回归中将,则局部回归中将包括包括 N个样本数。如例个样本数。如例4.12中的样本总数为中的样本总数为1000,若想在,若想在每次回归时包含每次回归时包含300个样本,则应在带宽中输入个样本,则应在带宽中输入0.3。拟桩洗华釜骤印互磁胯窄尊敦螺搬惧精健令痪拼峡侣蛆燎荤早履台按洼逞第04章其他回归方法第04章其他回归方法122 EViews在近邻估计中没有提供多种核函数的选择用来进在近邻估计中没有提供多种核函数的选择用来进行局部加权估计,仅提供一种局部加权方式,即选择行局部加权估计,仅提供一种局部加权方式,即选择“Local Weighting(Tricube)”,将按照式,将按照式 (4.8.10) 确定的权重进确定的权重进行加权。行加权。图图图图4.184.18邻近点加权拟合估计邻近点加权拟合估计邻近点加权拟合估计邻近点加权拟合估计对话框对话框对话框对话框投块驶珊厂锋距领耙焚抠汹庶剂楔趋垂嵌猪话息署沏埃纱复滦诞狸粹只垄第04章其他回归方法第04章其他回归方法123
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号