资源预览内容
第1页 / 共44页
第2页 / 共44页
第3页 / 共44页
第4页 / 共44页
第5页 / 共44页
第6页 / 共44页
第7页 / 共44页
第8页 / 共44页
第9页 / 共44页
第10页 / 共44页
亲,该文档总共44页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第五章 多元线性回归模型 第二部分-模型的检验,模型统计检验的实质 一、拟合优度检验 二、方程显著性检验(F检验) 三、变量显著性检验(t检验) 四、实例 五、置信区间,2,模型统计检验的实质,根据样本提供的信息,承担给定的风险下,对未知总体分布的某些方面作出合理的判断,称为统计假设检验,简称假设检验 模型统计检验不涉及模型的经济内涵 旨在检验模型是否满足数学理论与方法上的要求统计差异显著性 拟合优度检验(R2)、方程差异显著性检验(F)和变量差异显著性检验(t)通称称为模型的统计检验。 统计检验的结果表明模型是否能代表数据,或者说观察到的事实是否支持模型。 返回,3,一、拟合优度检验,检验模型对样本的拟合程度称为拟合优度。 LS的优良性指的是不同方法对同一问题的判断。 拟合优度检验指的是对不同问题之间的比较。 方法:构造一个表征拟合程度的指标,根据一定准则进行判断。 例如左边两个问题,它们都满足LS,但拟合程度明显不同。,4,1总平方和=解释平方和+残差平方和,5,为什么ESS是 由解释变量引起的变动?,6,为什么ESS是由解释变量引起的变动?,ESS是一个变动 ESS是由解释变量的变动决定的 ESS是被解释变量变动的一部分,7,平方和分解图示,(yi,xi),8,名词对照,Total Square Sum Explain Square Sum Residual Square Sum Total Square Sum Error Square Sum Regression Square Sum,总平方和 解释平方和 残差平方和 总平方和 误差平方和 (残差平方和) 回归平方和 (解释平方和),9,2、拟合优度R2和调整了的R2,r2 拟合优度(判定系数、决定系数) R2调整了的拟合优度,10,可决系数(拟合优度)R2,解释变量引起的变动占总变动的百分比 取值在01之间,越大拟合越好,11,调整了的R2,用残差平方和与总平方和各自的自由度进行调整。以防止企图通过增加解释变量个数来提高拟合优度的错误倾向。,12,引入调整可决系数的作用,返回,13,二、方程显著性检验(F检验),依据假设检验的原理和步骤,把模型作为一个整体进行假设检验,检验模型中被解释变量与解释变量之间的线性关系是否显著的成立。,14,F检验统计量的构造,15,F检验的逻辑意义,16,拟合优度与方程显著性检验的关系,拟合优度检验模型对样本的拟合程度。 F显著性性检验检验模型总体线性关系的显著性。 两者有如上的关系。 拟合优度是感性的,不宜苛求,应以F检验为准。但F检验它只是把模型作为一个整体进行了检验,还应对模型中的各个变量进行检验,决定它们是否应当保留在模型之中。,17,F检验的步骤,假定随机扰动项u服从正态分布。检验目标是联合检验, (1)提出假设H0: b1 = b2 =b3 =bk=0 (2)适合的检验统计量 (3)根据冒险率,确定临界值F (4)将计算出的F与临界值F比较 (5)下结论:若F临界值F,则拒绝H0;若F=临界值F,则不拒绝H0 (6)结合经济学理论与经验,下经济学的结论或进行经济学分析,18,1-,F,F,f(F),F检验的拒绝域,返回,19,三、变量显著性检验,目的:剔除模型中回归系数与0差异不显著的解释变量,使模型更简洁实用。 步骤:对模型进行整体检验之后,一次只能提出一个最不显著的 注意:变量取舍的关键在于变量的经济意义和在运用中的作用。,1、构造t检验统计量 2、进行t检验的步骤 3、运用实例,20,1、构造t检验统计量,21,2、t检验的步骤,1、提出假设H0和HA 2、收集数据估计出系数b 3、计算出2的估计量s2 4、计算检验统计量t(代入假设H0) 5、根据显著水平,查出临界值t 6、作出统计推断:如果tt ,拒绝H0;否则不拒绝H0。t的绝对值越大,自变量对因变量的作用越显著。,22,不拒绝H0区域,拒绝域,t检验的拒绝域,23,回归模型假设检验的步骤,(1)查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行下一步;否则进行下一步 (2)查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。 (3)但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。,返回,24,四、运用实例,数据:(见下页) 资料来源:易丹辉统计预测 被解释变量: y蔬菜销售量 解释变量:x1、x2、x3、x4、x5、x6包括人口、价格、粮食、副食等因素 要求:建立简洁的(最优的)蔬菜供应模型,25,资料,26,应剔除最不显著的x5,27,设置新的估计模型,28,应剔除不显著的X6,29,应剔除不显著的X3,30,得到最简洁的蔬菜供应模型,31,最简洁的蔬菜供应模型,Estimation Command: LS Y X1 X2 X4 C Estimation Equation: Y = C(1)*X1 + C(2)*X2 + C(3)*X4 + C(4) Substituted Coefficients: Y = 0.015753046*X1 - 0.46540629*X2 + 0.16284733*X4 + 1.8427109 最后保留的解释变量:人口、价格和收入,返回,32,五、参数估计的置信区间,用样本提供的信息,根据估计量(统计量)公式,可以给出未知参数的估计值或被解释变量的预测值的估计值,这种估计称为点估计。显然点估计没有给出做出进行这类判断的可靠程度和误差范围。 区间估计则是以一定的可靠程度(精确度),给出估计值存在的误差范围(区间)。 因为估计量是一个随机变量,所以区间估计的实质,是为被估计的参数或预测值构造一个以点估计为中心的区间(置信区间),该区间以一定的概率(置信度=1-)包含该参数或预测值。,33,参数估计的置信区间,34,可靠性和估计精度是相互制约,1、提高可靠性(减少风险),区间增大,反之,则反。因为信息量只有这么多。 2、增加样本容量t临界值减小和系数标注误减小(它的分子不增它,分母增大)误差半径减小 3、提高拟合优度(减少RSS) 4、提高样本观察值的分散度。 5、置信区域是一个以为中心的超椭球,大量观察 深入观察 全面观察,35,预测时间轴的分段,36,参数的区间估计,37,假设检验与区间估计是一个问题的两个方面,38,返回,39,预测假定,40,均值预测(E(YF)),41,个值预测(YF),置信区域是一个以YF为中心的超椭球。,42,预测能力检验,43,影响预测值精度的因素,1、预测精度提高(半径减少)和可靠程度提高(风险减少)是相互制约的 2、增加观察值个数 3、提高拟合优度 4、扩大解释变量的分散程度 5、在解释变量均值向量处,有最小的预测误差,44,均值预测和个值预测的比较,返回,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号