资源预览内容
第1页 / 共47页
第2页 / 共47页
第3页 / 共47页
第4页 / 共47页
第5页 / 共47页
第6页 / 共47页
第7页 / 共47页
第8页 / 共47页
第9页 / 共47页
第10页 / 共47页
亲,该文档总共47页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
9 回归分析1回归分析 现实世界中大多数现象表现为相关 关系,人们通过大量观察,将现象 之间的相关关系抽象概括为函数关 系,并用函数形式或模型来描述与 推断现象间的具体变动关系,用一 个或一组变量的变化来估计与推算 另一个变量的变化。这种分析方法 称为回归分析。29.1 一元线性回归一 、一元正态线性回归模型设随机变量Y,对于x的每一个值 ,Y都有它的分布。Y的均值是x的 函数,设E(Y)=(x),(x)叫做Y关 于x的回归。(x)可以通过样本进行 估计。3一元线性回归模型对于x的一组值x1, x2, , xn作 独立试验,对Y 得出n个观察结果 y1, y2, yn,得到容量为n的样本 (x1, y1), (x2, y2), (xn, yn)。利用样 本估计(x) 。首先从散点图看出y与 x的关系, 从而推测出(x)的形式。 若(x) 为线性函数,设(x) =a+bx ,估计(x) 的问题称为一元线性回 归问题。4一元线性回归模型假设对于x的某个区间内的每一 个值有YN(a+bx,2)Y= a+bx+ , N(0,2)称为一元正态线性回归模型。5由样本到a、b的估计 ,对给定的x,取 作为 (x) =a+bx的估计,称 为Y关 于x的线性回归方程,其图形称为 回归直线。一元线性回归模型6最小二乘估计二 、最小二乘估计 对样本(x1, y1), (x2, y2), (xn, yn),有考虑a、b的函数7最小二乘估计用最小二乘法估计a、b,使分别取Q关于a、b的偏导数,并令 其为0,有8最小二乘估计得正规方程组由于9最小二乘估计正规方程组为由于方程组系数行列式10最小二乘估计方程组有唯一解11最小二乘估计记则12最小二乘估计所求线性回归方程为由 知所以 对于一组样本观察值,回归直线通过 散点图的几何中心13三、2的点估计对每一个xi,由回归方程有 xi处的残差为 ,残差平方和可以证明则142的点估计是2的无偏估计Qe的简单计算公式:15162的点估计由于 ,所以四、线性假设的显著性检验(T检验法 )对线性假设y=a+bx+进行检验 ,线性系数b不应当为0 原假设 H0:b=0 备择假设 H1:b0 17线性假设的显著性检验可以证明 从而18线性假设的显著性检验在H0成立时,取统计量为给定显著性水平,H0的拒绝域为计算出|t|的值,查出19线性假设的显著性检验若 ,则拒绝H0;否则就 接受H0 。拒绝H0,意味着回归效果 是显著的。在回归效果显著的情况 下,对回归系数作区间估计,可得 出b的置信度为1-的置信区间为20五、线性回归的方差分析(F检验法)21线性回归的方差分析回归平方和残差平方和Syy自由度为n-1,Qe自由度为n-2, S回自由度为122线性回归的方差分析23线性回归的方差分析原假设H0:b=0,备择假设 H1:b0选统计量24方差分析表方差来源平方和自由度均方F比回归归S回1S回/1残差Qen-2Se/(n-1)总总和Qyyn-125线性回归的方差分析对检验水平,查表得F(1,n-2), 计算出F值。 若FF(1,n-2) ,则拒绝H0 ,说明 回归效果显著; 若F2.306,即|t|值在H0的拒绝域内 ,故拒绝H0 ,说明回归效果是显著的。 b的置信度为0.95(=0.05)的置信区间为32(4)已求出 ,所以已求出Syy=1932.1,Qe=7.4667.5 Syy的自由度为9,Qe的自由度为8列方差分析表:方差来源平方和自由度均方F比回归归1924.611924.62047.4残差7.580.94总总和1932.1933对=0.01,查出F0.01(1,8)=11.26 因为2047.3 11.26,所以回归效果是非常显著的。 六、利用回归方程进行预报(预测)回归问题中Y是随机变量,x是普 通变量。回归方程 是Y对 x的依赖关系的一个估计。对给定的 x值,用回归方程确定Y的值,叫预 报。34利用回归方程进行预报1.点预报回归方程为 ,对任给 x=x0,用 作Y的预报值,记 为 ,这就是点预报。35利用回归方程进行预报2.区间预报给定x=x0,Y的取值有一个置信 度为1-的范围,即置信区间,称 为预报区间。设在x=x0点对随机变量Y的观察 结果为y0 。36利用回归方程进行预报在x=x0点, 的预报值 为 可以证明3738利用回归方程进行预报对于给定的置信度1-,有其中由此得出y0的置信度为(1-)的预报区 间为39对任意的x,回归直线 y的下限: y的上限:40当样本容量n较大时,若取x0在x附近 , 则 y0的置信度为1-的预报区间为41七、控制问题要求y 以置信度1-在 内取值 , x控制在 内,使其中的x所对 应的观察值y满足42控制问题43对给出的 ,以置信度1-,有由此解出x即为x1由此解出x即为x2 当样本容量n较大时, 若取x0在x附近,则这时44解出对45八、全相关系数R46全相关系数RR2反映了原始数据yi(I=1,2,n)与其拟合值 之间的相关系数的平方。当回归效果特 别好时,R应接近1,表示yi与几乎重合 。当回归效果特别不好时,R应接近于0 ,表示yi与完全不相关。R是回归效果的 一个很好的度量。47
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号