资源预览内容
第1页 / 共123页
第2页 / 共123页
第3页 / 共123页
第4页 / 共123页
第5页 / 共123页
第6页 / 共123页
第7页 / 共123页
第8页 / 共123页
第9页 / 共123页
第10页 / 共123页
亲,该文档总共123页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计量经济学,第 二 章 简单线性回归模型,2,从2004中国国际旅游交易会上获悉,到2020年,中国旅游业总收入将超过3000亿美元,相当于国内生产总值的8%至11%。(资料来源:国际金融报2004年11月25日第二版) 是什么决定性的因素能使中国旅游业总收入到2020年达到3000亿美元? 旅游业的发展与这种决定性因素的数量关系究竟是什么? 怎样具体测定旅游业发展与这种决定性因素的数量关系?,引子: 中国旅游业总收入将超过3000亿美元吗?,3,第二章 简单线性回归模型,本章主要讨论: 回归分析与回归函数 简单线性回归模型参数的估计 拟合优度的度量 回归系数的区间估计和假设检验 回归模型预测,4,第一节 回归分析与回归方程,本节基本内容: 回归与相关 总体回归函数 随机扰动项 样本回归函数,5,1. 经济变量间的相互关系 确定性的函数关系 不确定性的统计关系相关关系 (为随机变量) 没有关系,一、回归与相关 (对统计学的回顾),6,函数关系,指某一经济变量可直接表示为其他经济变量的确定的函数, 函数表达式中没有未知参数,不存在参数估计的问题。,1) 某一商品的销售收入Y与单价P、销售数量Q之间的关系Y = PQ 2) 某一农作物的产量Q与单位面积产量q 、种植面积S之间的关系Q = q S,例如:,7,相关关系,指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。,居民消费C与可支配收入Y之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一确定,但有一定的取值范围,0 C Y ,遵循边际消费倾向递减的规律。居民消费C与可支配收入Y之间的关系可表示为C = + Y, 、为待估参数。,例如:,相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。,8,9,相关关系的类型 从涉及的变量数量看 简单相关 多重相关(复相关) 从变量相关关系的表现形式看 线性相关散布图接近一条直线 非线性相关散布图接近一条曲线 从变量相关关系变化的方向看 正相关变量同方向变化,同增同减 负相关变量反方向变化,一增一减 不相关 完全相关、完全不相关,10,11,相关系数的取值介于11之间, 取值为负表示两变量之间存在负相关关系; 取值为正表示两变量之间存在正相关关系; 取值为1表示两变量之间存在完全负相关关系; 取值为0表示两变量不相关; 取值为1表示两变量之间存在完全正相关关系。,12, 和 都是相互对称的随机变量 线性相关系数只反映变量间的线性相关程度,不 能说明非 线性相关关系 样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量,其统 计显著性有待检验 相关系数只能反映线性相关程度,不能确定因果 关系,不能说明相关关系具体接近哪条直线 计量经济学关心:变量间的因果关系及隐藏在随机性后面的统计规律性,这有赖于回归分析方法,使用相关系数时应注意,13,函数关系与相关关系的区别,确定的函数关系可以直接用于经济活动,无需分析。,不确定的相关关系,隐含着某种经济规律,是有关研究的重点,14,4. 回归分析,回归的古典意义: 高尔顿遗传学的回归概念 ( 父母身高与子女身高的关系) 回归的现代意义: 一个应变量对若干解释变量 依存关系 的研究 回归的目的(实质): 由固定的解释变量去 估计应变量的平均值,15,3. 回归分析,研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础,,主要内容,1)设定理论模型,描述变量之间的因果关系;,2)根据样本观察数据利用适当方法对模型参数进行估计, 得到回归方程;,3)对回归方程中的变量、方程进行显著性检验,推求参数的置信区间、模型的预测置信区间;,4)利用回归模型解决实际经济问题。,16,例如:,居民消费C与可支配收入Y之间不仅存在相关关系而且存在因果关系,不仅可以利用相关分析研究两者之间的相关程度,还可以利用回归分析研究两者之间的具体依存关系。可以将C作为被解释变量、Y作为解释变量,根据相关经济理论,设定含有待估参数 、 的理论模型C = + Y,估计模型中的参数 、 ,得到回归方程,进行相关统计检验和推断,利用回归模型进行结构分析、经济预测、政策评价等。,17, 的条件分布 当解释变量 取某固定值时(条件), 的值不确定, 的不同取值形成一定的分布,即 的条件分布。 的条件期望 对于 的每一个取值, 对 所形成的分布确 定其期望或均值,称 为 的条件期望或条 件均值,注意几个概念,18,19,回归函数:应变量 的条件期望 随解释变量 的变化而有规律的变化,如果把 的条件期望 表现为 的某种函数 这个函数称为回归函数。 回归函数分为:总体回归函数和样本回归函数,举例:假如已知100个家庭构成的总体。,回归线与回归函数,20,例:100个家庭构成的总体 (单位:元),21,22,总体回归曲线与总体回归函数,给定解释变量条件下被解释变量的期望轨迹称为总体回归曲线(population regression curve),或总体回归线(population regression line)。,描述总体回归曲线的函数称为总体回归函数(population regression function)。,23,24,实际的经济研究中总体回归函数通常是未知的,只能根据经济理论和实践经验去设定。“计量”的目的就是寻求PRF。 总体回归函数中 与 的关系可是线性的,也可是非线性的。 对线性回归模型的“线性”有两种解释 就变量而言是线性的 的条件均值是 的线性函数 就参数而言是线性的 的条件均值是参数 的线性函数,3.如何理解总体回归函数,25,例2-1,假设一个由100个家庭构成的总体,并假设这100个家庭的 月可支配收入水平只限于1300元、1800元、2300元、2800 元、3300元、3800元、4300元、4800元、5300元、5800元10 种情况,每个家庭的月可支配收入与消费数据如表2-1所示, 要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之 间的关系,以便根据已知的家庭月可支配收入水平测算该总 体的家庭月消费支出平均水平。,26,表2-1 100个家庭的月可支配收入与消费数据 单位:元,27,家庭消费支出主要取决于家庭可支配收入,但不是唯一取决于家庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配收入相同的不同家庭的消费支出各不相同。,由此可求得对应于家庭可支配收入X的各个水平的家庭消费支出Y的条件 均值(conditional mean)或称为条件期望(conditional expectation), 如表2-2所示。,析:,28,表2-2 100个家庭的月可支配收入与消费数据 单位:元,由表2-1、表2-2中的数据绘制不同可支配收入家庭的消费支出散 点图、家庭消费支出与可支配收入关系的总体回归曲线,如图2-1所示。,29,从散点图可以清晰地看出,不同家庭的消费支出虽然存在差异,但总体趋势随可支配收入的增加而增加,总体回归曲线反映了这一趋势。,30,事实上,经济活动中的总体包含的个体的数量往往非常多,一般不大可能像例2-1假设的那样得到总体中所有个体的观察数据,因此也就不大可能依据总体的所有观察数据计算得到被解释变量Y的条件期望,无法画出精确的总体回归曲线,相应地,总体回归函数的具体形式也无法精确确定。所以,对于总体回归函数,通常只能根据经济理论或实践经 验进行设定,也就是说,通常需要对总体回归函数作出合理的假设。,31,32,三、随机扰动项,概念: 各个 值与条件均值 的偏差 代表 排除在模型以外的所有 因素对 的影响。 性质: 是期望为0有一定分布的随机变量 重要性:随机扰动项的性质决定着计量经济方 法的选择,33, 未知影响因素的代表 无法取得数据的已知影响因素的代表 众多细小影响因素的综合代表 模型的设定误差 变量的观测误差 变量内在随机性,引入随机扰动项的原因,34,四、样本回归函数(SRF),35,SRF 的特点,每次抽样都能获得一个样本,就可以拟合一条样本回 归线,所以样本回归线随抽样波动而变化,可以有许多条(SRF不唯一)。,SRF2,36,样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。 样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。,37,38,对样本回归的理解,如果能够获得 和 的数值,显然: 和 是对总体回归函数参数 和 的估计 是对总体条件期望 的估计 在概念上类似总体回归函数中的 ,可 视为对 的估计。,39,40,41,第二节 简单线性回归模型的最小二乘估计,本节基本内容: 简单线性回归的基本假定 普通最小二乘法 OLS回归线的性质 参数估计式的统计性质,42,一、简单线性回归的基本假定,1. 为什么要作基本假定? 模型中有随机扰动,估计的参数是随机变量, 只有对随机扰动的分布作出假定,才能确定 所估计参数的分布性质,也才可能进行假设 检验和区间估计 只有具备一定的假定条件,所作出的估计才 具有较好的统计性质。,43,(1)对模型和变量的假定 如 假定解释变量 是非随机的,或者虽然是随机的,但与扰动 项 是不相关的 假定解释变量 在重复抽样中为固定值 假定变量和模型无设定误差 假定变量没有测量误差,2、基本假定的内容,44,又称高斯假定、古典假定 假定1:零均值假定 在给定 的条件下 , 的条件期望为零 假定2:同方差假定 在给定 的条件下, 的条件方差为某个常数,(2)对随机扰动项 的假定,45,假定3:无自相关假定 随机扰动项 的逐次值互不相关 假定4:随机扰动 与解释变量 不相关,46,假定5:对随机扰动项分布的正态性假定 即假定 服从均值为零、方差为 的正态分布 (说明:正态性假定不影响对参数的点估计,但对确定所估计参数的分布性质是需要的。且根据中心极限定理,当样本容量趋于无穷大时, 的分布会趋近于正态分布。所以正态性假定是合理的),47,的分布性质,由于 的分布性质决定了 的分布性质。 对 的一些假定可以等价地表示为对 的假定: 假定1:零均值假定 假定2:同方差假定 假定3:无自相关假定 假定5:正态性假定,48,OLS的基本思想 不同的估计方法可得到不同的样本回归参数 和 ,所估计的 也不同。 理想的估计方法应使 与 的差即剩余 越小越好 因 可正可负,所以可以取 最小 即,二、普通最小二乘法 (rdinary Least Squares ),49,正规方程和估计式,用克莱姆法则求解得观测值形式的OLS估计式:,取偏导数为0,得正规方程,50,为表达得更简洁,或者用离差形式OLS估计式: 注意其中: 而且样本回归函数可写为,用离差表现的OLS估计式,51,三、OLS回归线的性质,可以证明: 回归线通过样本均值 估计值 的均值等于实 际观测值 的均值,52,剩余项 的均值为零 应变量估计值 与剩余项 不相关,解释变量 与剩余项 不相关,53,四、参数估计式的统计性质,(一)参数估计式的评价标准 1. 无偏性 前提:重复抽样中估计方法固定、样本数不变、经 重复抽样的观测值,可得一系列参数估计值 参数估计值 的分布称为 的抽样分布,密度函 数记为 如果
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号