资源预览内容
第1页 / 共101页
第2页 / 共101页
第3页 / 共101页
第4页 / 共101页
第5页 / 共101页
第6页 / 共101页
第7页 / 共101页
第8页 / 共101页
第9页 / 共101页
第10页 / 共101页
亲,该文档总共101页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第5章 双变量回归:区间估计与假设检验,暨南大学经济学院统计学系 陈文静,暨南大学经济学院统计系 陈文静,2,5.2 区间估计一些基本概念,暨南大学经济学院统计系 陈文静,3,置信区间,暨南大学经济学院统计系 陈文静,4,注释,暨南大学经济学院统计系 陈文静,5,进一步解释,暨南大学经济学院统计系 陈文静,11,5.5 假设检验,尽管研究者总是热衷于了解由现实观测样本所得到的估计结果是否支持被质疑的理论,但证明一个给定的假设是否正确几乎是不可能的,唯一能做的只是声称一个特定的样本证实了一个特定的假设。尽管我们不能使用假设检验来证明某一给定理论是“正确的”,但是我们通常可以在某一合理的显著性水平上拒绝一个给定的假设。,我们考察假设检验用于回归分析中的三个核心问题:1 待检验假设的设定2 用于决定是否拒绝假设的判定规则3 将这一判定规则应用于恰当的统计量,在产生不正确推断时所面对的两类错误。,暨南大学经济学院统计系 陈文静,12,暨南大学经济学院统计系 陈文静,13,暨南大学经济学院统计系 陈文静,15,暨南大学经济学院统计系 陈文静,16,第一类错误和第二类错误 在计量经济学中,典型的检验技术是对每个回归系数(常数项除外)假设一个预期的符号(或取值),然后决定是否拒绝虚拟假设。由于回归系数仅仅是总体参数真值的估计值,那么认为回归分析产生的结论总是正确是不现实的。在假设检验中我们有可能犯两类错误:第一类:我们拒绝了一个为真的虚拟假设(去真)。第二类:我们没有拒绝一个不真的虚拟假设(取伪),暨南大学经济学院统计系 陈文静,17,暨南大学经济学院统计系 陈文静,18,暨南大学经济学院统计系 陈文静,19,暨南大学经济学院统计系 陈文静,20,暨南大学经济学院统计系 陈文静,21,暨南大学经济学院统计系 陈文静,22,假设检验步骤,根据研究目的建立原假设和备择假设确定一个适当的检验统计量,并利用样本数据计算出检验统计量的具体数值。确定一个适当的显著性水平,并查出其临界值,指定拒绝域。将检验统计量的实际值与临界值进行比较,作出拒绝或不拒绝原假设的决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策:,暨南大学经济学院统计系 陈文静,23,暨南大学经济学院统计系 陈文静,24,暨南大学经济学院统计系 陈文静,25,暨南大学经济学院统计系 陈文静,27,1. 检验回归系数的显著性:t检验 显著性检验最基本的问题是构造一个合适的统计量(作为估计量),以及在原假设之下的抽样分布(本课程基于经典的统计量,其分布已知),通过计算这一统计量的样本值,进而与临界值比较,如落入接受域,则不拒绝原假设,而不落入接受域即落入拒绝域,则拒绝原假设。几乎所有假设检验,均按这一原理而实现。这一思想的核心是,设定原假设和备选假设,构造统计量以及推导它在原假设下的分布,利用这一分布检验假设,所以这种思想实质上是先行假定原假设为真,从而有统计量在原假设下的分布,基于此检验假设。,暨南大学经济学院统计系 陈文静,34,显著性检验说明,显著性检验的实质为,建立真值或总体的某一特定值的原假设和备选假设,在原假设下构造统计量和它的分布, 并在原假设建立有关估计量的置信区间,最后考察估计的值是否落入置信区间之内还是之外,若落入之内,不能拒绝原假设,否则拒绝原假设。这一问题可转化为,如计算的t值较大,即可成为拒绝原假设的证据。,暨南大学经济学院统计系 陈文静,35,t检验注释,如果一个统计量的值落在拒绝域内,则拒绝原假设,这个统计量是统计上显著的。如果一个统计量的值落在接受域内,则不能拒绝原假设,这个统计量是统计上不显著的。,暨南大学经济学院统计系 陈文静,38,用这一统计量进行显著性检验,其决策机制列入表5.2.,暨南大学经济学院统计系 陈文静,41,接受与拒绝的含义,对于显著性检验(如检验),当计算的统计量值落入接受域中,因此我们接受原假设,其含意为,根据样本证据,我们没有理由拒绝原假设;而并非是指,原假设一定为真。为什么? 对于已决定接受的原假设,若与之类似的另一原假设(我们只是没有设定),通过相同的步骤,有可能结果为接受这一新的原假设,若如此,哪一个原假设为真?通过假设检验还无法决定。,暨南大学经济学院统计系 陈文静,43,“零”原假设与“2t”法则,暨南大学经济学院统计系 陈文静,44,暨南大学经济学院统计系 陈文静,45,建立原假设与备选假设,一般而言,建立原和备假设没有一个统一的规则,通常是基于我们所研究的问题而定,或者是基于检验目的,如在模型中应检验某些或某个变量的显著性,则建立对应的系数为零作为原假设。另一方面, 有些假设通常是根据所研究的问题所隐含的意义而建立,这样的假设往往具有较为丰富的经济学意义。或者是由经济学金融学理论或实际经济行为而建立假设。通过检验假设来证实经济学理论或实际行为的正确与否。,暨南大学经济学院统计系 陈文静,46,显著性水平,通常选定的显著性水平,其实质含义为犯第I类错误的概率,所谓第I类错误是指,在原假设为真时,拒绝这一正确的原假设,即去真。而对应的取伪的概率即为犯第II类错误的概率,即接受了错误的假设的概率。一般而言,计量经济学中的假设检验将犯第I类错误的概率定在0.05,或0.01,或0.10。所谓检验势(power of the test)定义为1Pr.(犯第II类错误),这是目前在仿真实验中所使用的概念,它主要用在计量经济学的理论研究中,以此评价所构造的统计量的检验能力,一般而言,检验势高,表明这一统计量的检验能力就强。,暨南大学经济学院统计系 陈文静,47,精确的显著性水平p值,P 值的进一步阐述,我们用Z统计量来进行假设检验,暨南大学经济学院统计系 陈文静,49,P 值的计算,暨南大学经济学院统计系 陈文静,50,P 值应用的归纳小结,暨南大学经济学院统计系 陈文静,51,双侧检验的P 值,暨南大学经济学院统计系 陈文静,52,统计显著性解释,暨南大学经济学院统计系 陈文静,56,5.9 回归分析与方差分析,暨南大学经济学院统计系 陈文静,58,样本方差中的自由度(degree of freedom),暨南大学经济学院统计系 陈文静,59,样本方差中的自由度(degree of freedom),1、自由度:指数据个数减去附加给独立观测值的约束或限制的个数,即一组数据中可以自由取值的数据的个数2、当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值。按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。,暨南大学经济学院统计系 陈文静,60,自由度 (degree of freedom),样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值为什么样本方差的自由度是n-1呢?因为在计算离差平方和时,必须先求出样本均值x ,而x则是附加给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个 自由度(n-1)保证了样本方差是总体方差的无偏估计,暨南大学经济学院统计系 陈文静,61,暨南大学经济学院统计系 陈文静,66,第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,函数名的菜单下选择字符正态分布:“NORMSINV”:已知概率水平,求x的值或z值“NORMSDIST”:已知X或Z值,求相应的概率t分布:“TINV”:知道概率值和自由度,求t临界值“TDIST”:知道t值,自由度和单侧或双侧检验,求概率值,Excel求相关值的命令,暨南大学经济学院统计系 陈文静,67,Excel求F值的命令,第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,函数名的菜单下选择字符“FINV”就可以求出相应的F临界值求概率值:“FDIST”卡方分布:“CHIINV”:知道概率值和自由度,求临界值求概率值:“CHIDIST”,暨南大学经济学院统计系 陈文静,70,F检验和t检验 一个注释,在一元线性回归中,自变量x只有一个,则此时F检验和t检验是等价的,即若原假设被t检验拒绝,则也将被F检验拒绝。在多元回归分析中,自变量x有多个,则此时F检验和t检验的意义是不同的。F检验: 检验总体回归关系的显著性t检验: 检验各个回归系数的显著性,暨南大学经济学院统计系 陈文静,71,暨南大学经济学院统计系 陈文静,78,暨南大学经济学院统计系 陈文静,80,暨南大学经济学院统计系 陈文静,81,暨南大学经济学院统计系 陈文静,82,暨南大学经济学院统计系 陈文静,83,暨南大学经济学院统计系 陈文静,84,报告回归结果,暨南大学经济学院统计系 陈文静,85,24.4545,1,样本均值点(170,111),暨南大学经济学院统计系 陈文静,88,暨南大学经济学院统计系 陈文静,89,回归分析结果的评价,(1)所估计的回归系数 的符号是否与理论或事先预期相一致。(2)如果理论上认为y与x之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此。(3)回归模型在多大程度上解释了因变量y取值的差异?用R2来进行解释(4)考察关于误差项 的正态性假定是否成立 这是因为F检验和t检验都要求误差项要服从正态分 布,否则检验将是无效的。 可以用图示法考察误差项的分布,暨南大学经济学院统计系 陈文静,90,残差的正态性检验:,1 残差直方图2 正态概率图3 JB检验,残差图,暨南大学经济学院统计系 陈文静,94,Equation工具栏中view/residual test/Histogram-Normality test:,暨南大学经济学院统计系 陈文静,96,偏度与峰度分布的形状,偏度,峰度,数据分布特征的测度,偏态及其测度 (skewness),统计学家K. Pearson于1895年首次提出 偏态:对数据分布对称性的测度,测度偏态的统计量是偏态系数,记作SK,计算公式为: 未分组数据 分组数据,偏态系数判断 (skewness coefficient),偏态系数SK=0 对称分布偏态系数SK0 右偏或正偏分布偏态系数SK1或SK-1 高度偏态分布0.5SK1-1SK-0.5SK越接近0 偏态程度就越低SK值越大 偏态程度就越大,中等偏态分布,峰态(kurtosis),统计学家Pearson于1905年首次提出峰态:对数据分布平峰或尖峰程度的测度,记作K 。3 根据峰态系数判断分布: 峰态系数K=0 正态分布 数据分布适中 峰态系数K0 尖峰分布 数据分布集中,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号