多元线性回归检验课件-

3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验一、拟合优度检验一、拟合优度检验二、方程的显著性检验二、方程的显著性检验(F(F检验检验) ) 三、变量的显著性检验（三、变量的显著性检验（t t检验）检验）四、参数的置信区间四、参数的置信区间多元线性回归检验一、拟合优度检验一、拟合优度检验 1、可决系数与调整的可决系数、可决系数与调整的可决系数则总离差平方和的分解总离差平方和的分解多元线性回归检验由于 =0所以有：注意：注意：一个有趣的现象一个有趣的现象多元线性回归检验可决系数可决系数该统计量越接近于1，模型的拟合优度越高。问题：问题：在应用过程中发现，如果在模型中增加一个解释变量， R2往往增大（Why?) 这就给人一个错觉一个错觉：要使得模型拟合得好，只要使得模型拟合得好，只要增加解释变量即可要增加解释变量即可。但是，现实情况往往是，由增加解释变量个数引起的R2的增大与拟合好坏无关，R2需调整需调整。多元线性回归检验调整的可决系数调整的可决系数（adjusted coefficient of determination）在样本容量一定的情况下，增加解释变量必定使得自由度减少，所以调整的思路是:将残差平方将残差平方和与总离差平方和分别除以各自的自由度，以剔和与总离差平方和分别除以各自的自由度，以剔除变量个数对拟合优度的影响除变量个数对拟合优度的影响:其中：n-k-1为残差平方和的自由度，n-1为总体平方和的自由度。多元线性回归检验11)1 (122-=knnRR多元线性回归检验 *2、赤池信息准则和施瓦茨准则、赤池信息准则和施瓦茨准则为了比较所含解释变量个数不同的多元回归模型的拟合优度，常用的标准还有: 赤池信息准则赤池信息准则（Akaike information criterion, AIC）施瓦茨准则施瓦茨准则（Schwarz criterion，SC）这两准则均要求这两准则均要求仅当所增加的解释变量能够减少仅当所增加的解释变量能够减少AICAIC值或值或ACAC值时才在原模型中增加该解释变量值时才在原模型中增加该解释变量。多元线性回归检验 Eviews的估计结果显示：中国居民消费一元例中： AIC=6.68 AC=6.83 中国居民消费二元例中： AIC=7.09 AC=7.19从这点看，可以说前期人均居民消费CONSP(-1)应包括在模型中。多元线性回归检验二、方程的显著性检验二、方程的显著性检验(F检验检验) 方程的显著性检验，旨在对模型中被解释变方程的显著性检验，旨在对模型中被解释变量与解释变量之间的线性关系量与解释变量之间的线性关系在总体上在总体上是否显著是否显著成立作出推断。成立作出推断。 1、方程显著性的、方程显著性的F检验检验即检验模型 Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n中的参数j是否显著不为0。可提出如下原假设与备择假设： H0： 0=1=2= =k=0 H1： j不全为0多元线性回归检验 F F检验的思想检验的思想来自于总离差平方和的分解式： TSS=ESS+RSS 如果这个比值较大，则X的联合体对Y的解释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。因此因此, ,可通过该比值的大小对总体线性关系进行推可通过该比值的大小对总体线性关系进行推断断。多元线性回归检验根据数理统计学中的知识，在原假设H0成立的条件下，统计量服从自由度为(k , n-k-1)的F分布给定显著性水平，可得到临界值F(k,n-k-1)，由样本求出统计量F的数值，通过 F F(k,n-k-1) 或 FF(k,n-k-1)来拒绝或接受原假设H0，以判定原方程总体上总体上的线性关系是否显著成立。多元线性回归检验对于中国居民人均消费支出的例子：一元模型：F=285.92 二元模型：F=2057.3给定显著性水平 =0.05，查分布表，得到临界值：一元例：F(1,21)=4.32 二元例： F(2,19)=3.52显然有 F F(k,n-k-1) 即二个模型的线性关系在95%的水平下显著成立。多元线性回归检验 2、关于拟合优度检验与方程显著性检关于拟合优度检验与方程显著性检验关系的讨论验关系的讨论由可推出：与或多元线性回归检验在在中国居民人均收入中国居民人均收入-消费消费一元模型一元模型中，中，在在中国居民人均收入中国居民人均收入-消费消费二元模型二元模型中中，多元线性回归检验三、变量的显著性检验（三、变量的显著性检验（t检验）检验）方程的总体线性总体线性关系显著每个解释变量每个解释变量对被解释变量的影响都是显著的因此，必须对每个解释变量进行显著性检验，以决定是否作为解释变量被保留在模型中。这一检验是由对变量的这一检验是由对变量的 t t 检验完成的。检验完成的。多元线性回归检验 1、t统计量统计量由于以cii表示矩阵(XX)-1 主对角线上的第i个元素，于是参数估计量的方差为：其中2为随机误差项的方差，在实际计算时，用它的估计量代替: 多元线性回归检验因此，可构造如下t统计量多元线性回归检验 2、t检验检验设计原假设与备择假设： H1：i0 给定显著性水平，可得到临界值t/2(n-k-1)，由样本求出统计量t的数值，通过 |t| t/2(n-k-1) 或 |t|t/2(n-k-1)来拒绝或接受原假设H0，从而判定对应的解释变判定对应的解释变量是否应包括在模型中。量是否应包括在模型中。 H0：i=0 （i=1,2k）多元线性回归检验注意：注意：一元线性回归中，一元线性回归中，t t检验与检验与F F检验一致检验一致一方面一方面，t检验与F检验都是对相同的原假设H0： 1=0=0 进行检验; 另一方面另一方面，两个统计量之间有如下关系：多元线性回归检验在中中国国居居民民人人均均收收入入-消消费费支支出出二二元元模模型型例中，由应用软件计算出参数的t值：给定显著性水平=0.05，查得相应临界值： t0.025(19) =2.093。可见，计计算算的的所所有有t值值都都大大于于该该临临界界值值，所以拒绝原假设。即:包包括括常常数数项项在在内内的的3个个解解释释变变量量都都在在95%的的水水平下显著，都通过了变量显著性检验。平下显著，都通过了变量显著性检验。多元线性回归检验四、参数的置信区间四、参数的置信区间参参数数的的置置信信区区间间用来考察：在在一一次次抽抽样样中中所所估估计的参数值离参数的真实值有多计的参数值离参数的真实值有多“近近”。在变量的显著性检验中已经知道：在变量的显著性检验中已经知道：容易推出容易推出：在(1-)的置信水平下i的置信区间是其中，t/2为显著性水平为、自由度为n-k-1的临界值。多元线性回归检验在中国居民人均收入中国居民人均收入-消费支出消费支出二元模型二元模型例中,给定=0.05，查表得临界值：t0.025(19)=2.093计算得参数的置信区间： 0 ：(44.284, 197.116) 1 ： (0.0937, 0.3489 ) 2 ：(0.0951, 0.8080) 从回归计算中已得到：多元线性回归检验如何才能缩小置信区间？如何才能缩小置信区间？增大样本容量增大样本容量n n，因为在同样的样本容量下，因为在同样的样本容量下，n n越越大，大，t t分布表中的临界值越小，同时，增大样本容分布表中的临界值越小，同时，增大样本容量，还可使样本参数估计量的标准差减小；量，还可使样本参数估计量的标准差减小；提高模型的拟合优度提高模型的拟合优度，因为样本参数估计量的标，因为样本参数估计量的标准差与残差平方和呈正比，模型优度越高，残差准差与残差平方和呈正比，模型优度越高，残差平方和应越小。平方和应越小。提高样本观测值的分散度提高样本观测值的分散度, ,一般情况下，样本观测一般情况下，样本观测值越分散值越分散，(XX)-1的分母的的分母的|XX|的值越大，致使的值越大，致使区间缩小。区间缩小。多元线性回归检验