资源预览内容
第1页 / 共51页
第2页 / 共51页
第3页 / 共51页
第4页 / 共51页
第5页 / 共51页
第6页 / 共51页
第7页 / 共51页
第8页 / 共51页
第9页 / 共51页
第10页 / 共51页
亲,该文档总共51页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2020/8/5,1,第八章 虚拟解释变量模型 单一方程模型的专门问题(1),Econometrics,2020/8/5,2,问题的提出,建国后中国城镇居民家庭的储蓄函数研究 数据来源: 根据19522002年人均收入和人均储蓄的数据资料(以1952年的物价水平为100),建立储蓄模型:,该模型是否合理?,怎么比较?,2020/8/5,3,在回归模型中,目前所遇的所有变量均为定量变量(可直接测度、数值性),例如GDP,工资,收入、受教育年数,销售额等。 在实际建模中,一些定性变量的影响也是不可忽视的。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等也是值得考虑的影响因素,但这些因素共同的特征是定性描述的。 问题是,依据现有的回归分析知识,如何对非定量因素进行回归分析?以及为什么对定性因素要采用回归分析?,一般性的描述,2020/8/5,5,一、虚拟变量的基本概念 前面讨论的数量因素(变量)可以直接度量,但质的因素(如:性别、职业、文化程度、所有制形式等定性因素)不能直接度量。 为了在模型中反映这些属性因素的影响,人们采取了构造人工变量的方法当某种属性存在时人工变量的取值为1,当某种属性不存在时人工变量的取值为0。 虚拟变量:取值为0和1的人工变量。(哑变量、双值变量、定性变量、二元型变量等,D or Dum),第一节 虚拟变量,2020/8/5,6,二、虚拟变量的设置原则,1、在含有截矩项的模型中,定性因素有m个相互排斥的类型或特征,模型中只能引入( m-1)个虚拟变量,否则会陷入“虚拟变量陷阱”,产生完全共线; 例1:居民住房消费支出Y、居民可支配收入X的模型: 为了将“城镇居民“、”农村居民“对Y的影响反映模型中,设,2020/8/5,7,则模型(1)为,若引入m=2个虚拟变量,则模型(2)为:,任一家庭都有:D1i+D2i=1,即D1i=1-D2i(完全共线)。,2020/8/5,8,例2:虚拟变量,2020/8/5,9,2、虚拟变量取“0”或“1”应从分析问题的目的出发予以界定(多以“0”代表基础类); 讨论:虚拟变量的取值可否为“1”或“2”,甚至“3”、“4”、“5”?,二、虚拟变量的设置原则(续),2020/8/5,10,3、虚拟变量在单一方程中,可以作为解释变量,也可以作为被解释变量。 虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如MacFadden、Heckmen等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。 本课程只是讨论虚拟解释变量的问题,包括如何在回归模型引入虚拟解释变量(包括加法形式和乘法形式)、以及不同方式引入虚拟解释变量后的作用。,2020/8/5,11,The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000 for his development of theory and methods for analyzing selective samples”,James J Heckman USA,2020/8/5,12,The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000 for his development of theory and methods for analyzing discrete choice,Daniel L McFadden USA,2020/8/5,13,与麦克法登教授在林岛欢迎宴会上合影,2020/8/5,14,三、引入虚拟变量的作用,1、分离异常因素的影响 如观察我国社会总产值的时间趋势,须考虑三年自然灾害这一特殊因素的影响 2、检验不同属性类型对因变量的作用 3、提高模型的精度 引入虚拟变量后,相当于把不同属性类型的样本合并,即相当于扩大了样本容量,从而可提高模型的精度,2020/8/5,15,第二节 虚拟解释变量回归,加法类型 一个定性解释变量 一个定量和一个两种属性定性解释变量 一个定量和一个多种属性定性解释变量 一个定量和多个定性变量解释变量 乘法类型 结构变化的检验 交互效应分析 分段线性回归,2020/8/5,16,一、加法类型,设定的虚拟变量以相加的形式出现(四类),作用是改变了截距项。(截距变动模型) 1、一个定性解释变量 以居民收入为例:,2020/8/5,17,2、一个定量和一个两种属性定性解释变量,X,Y,whos who?,2020/8/5,18,3、一个定量和一个多种属性定性解释变量,2020/8/5,19,季节的颜色?,X,Y,2020/8/5,20,Eviews的实现,需要建立虚拟变量!,2020/8/5,21,4、一个定量和多个定性变量解释变量 例:不同人群组的衣着消费函数模型 Xi 收入水平;Yi 年服装消费支出,请同学们自己写出不同人群组具体的消费函数模型?,2020/8/5,22,二、乘法类型,将虚拟变量与其他解释变量相乘作为新的解释变量引入模型。 作用: 关于两个回归模型的比较; 因素间的交互影响的分析; 提高模型对现实经济现象的描述精度。,2020/8/5,23,1、回归模型的比较 通过对模型的参数检验,可以检验模型是否有不同的结构。即定性变量D的引入,是否影响不同类型(属性)模型的平均水平(截距项)?定性变量D的引入,是否影响不同类型(属性)模型的相对变化(斜率系数)? 例如:城镇居民家庭与农村居民家庭的消费函数不仅在截距上有差异,边际消费倾向可能也会有所不同。模型可以记为,2020/8/5,24,其中: Yi为消费水平;Xi为收入水平。,则D=1: 则D=0:,城镇、农村居民家庭的消费行为完全一样(截距和斜率系数相等) 城镇、农村居民家庭的消费函数是截距变动模型(截距不相等) 城镇、农村居民家庭的消费函数是斜率变动模型(斜率系数不相等) 城镇、农村居民家庭的消费函数是截距和斜率变动模型(截距、斜率不等),通过对上述两个模型的截距、斜率系数检验(比较),可以判断我们讨论的模型属于以下几种类型:,2020/8/5,25,一般:,分别回归,有以下四种情况:,2020/8/5,26,例:改革开放前、后(平均)“储蓄收入”模型:,加法方式引入D:为了区别改革开放前、后储蓄起点的情况(即 两模型的截距变化),乘法方式引入D:为了区别改革开放前、后“储蓄“关于”收入”的 相对变化情况(即两模型的斜率系数变化),2020/8/5,27,2、交互效应的分析 前面仅讨论了解释变量X对被解释变量Y的影响作用;没有分析解释变量间的相互作用对被解释变量Y的影响作用。,例如,不同人群组的衣着消费函数,2020/8/5,28,(1)式以加法形式引入,暗含假设: 性别虚拟变量D2的截距差异效应对于两种教育水平而言是常数. (如女性年均服装支出高于男性,性别差异在年均服装支出上产生了效应。但该效应的大小与女性的文化教育水平无关,因为没有表示大专以上学历女性的变量)。 同理: 教育水平虚拟变量D3的截距差异效应对于性别而言也是常数。 为了反映交互效应,将(1)变为:,2020/8/5,29,大专以上的女性:,其他女性:,大专以上的男性:,其他男性:,如何检验交互效应是否存在?,若拒绝原假设,即交互效应对Y产生了影响(应该引入模型),2020/8/5,30,3、分段回归分析 例: 设Y表示奖金、X表示销售额。当销售额低于X*时,奖金与销售额呈线性关系;当销售额高于X*时,奖金与销售额呈更加陡峭的线性关系。如图:,Y,X* X,.,2020/8/5,31,2020/8/5,32,中国城镇居民家庭的储蓄函数,根据我国城镇居民家庭19552002年人均收入 和人均储蓄 的数据资料(以1955年的物价水平为100),建立储蓄模型:,用最小二乘法得估计结果为:,模型隐含着一个重要假定,我国城镇居民家庭的储蓄行为在1955年至2002年期间是不变的。假定未必能够成立,因为,与居民储蓄有关的许多重要因素在1979年以后发生了明显变化,主要表现为:,2020/8/5,33,1)在经济体制改革之前,我国居民的收入一直在低水平上徘徊,大多数居民家庭的收入仅能维持温饱,因而平均储蓄倾向很低,积蓄很少;1979年之后,我国居民的收入水平迅速提高,与此同时,居民储蓄也在大幅增长。前后两个时期,我国居民的储蓄行为有显著差异;,2)在改革开放前的大多数年份,我国的消费品市场存在严重短缺的现象。消费者既使有钱也难以买到所需的商品,而不得不把钱暂时存起来。因此,这一时期储蓄带有“非自愿”的性质;而在1979年之后,消费品市场日趋丰富,消费者储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有“被迫”性质。,2020/8/5,34,为了验证城镇居民储蓄行为的变化,建立如下截距和斜率同时变动模型:,用最小二乘法得:,t (2.18) (8.1) (3.9) (-9.2),2020/8/5,35,1979年以前: 1979年以后:,估计结果表明:1979年之前,我国城镇居民的边际储蓄倾向仅为0.004,即收入增加一元储蓄平均增加4厘;而在19791985年期间,城镇居民边际储蓄倾向高达0.256。,2020/8/5,36,第三节 案例分析,为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄( ),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系,并建立相应的计量经济学模型 。,2020/8/5,37,表8.1 国民总收入与居民储蓄存款 单位:亿元,数据来源:中国统计年鉴2004,中国统计出版社。表中“城乡居民人民币储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。,2020/8/5,38,表8.1 国民总收入与居民储蓄存款 (续) 单位:亿元,2020/8/5,39,为了研究19782003年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城乡居民储蓄存款、国民总收入随时间的变化情况,如下图所示:,2020/8/5,40,从上图中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量( ),并作时序图(见左下图):,2020/8/5,41,从居民储蓄增量图(上页左图)可以看出,城乡居民的储蓄行为表现出了明显的阶段特征:在1996年和2000年有两个明显的转折点。再从城乡居民储蓄存款增量与国民总收入之间关系的散布图看(见上页右图),也呈现出了相同的阶段性特征。,2020/8/5,42,为了分析居民储蓄行为在1996年前后和2000年前后三个阶段的数量关系,引入虚拟变量 和 。 和 的选择,是以1996、2000年两个转折点作为依据,并设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型: 其中:,2020/8/5,43,对上式进行回归后,有:,2020/8/5,44,即有: 由于各个系数的t检验均大于2,表明各解释变量的 系数显著地不等于0,居民人民币储蓄存款年增加 额的回归模型分别为:,2020/8/5,45,这表明三个时期居民储蓄增加额的回归方程在统计意义上确实是不相同的。1996年以前收入每增加1亿元,居民储蓄存款的平均增加0.1445亿元;在2000年以后,则为0.4133亿元,已发生了很大变化。,2020/8/5,46,上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用虚拟变量法则,没有考虑通货 膨胀因素。而在
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号