资源预览内容
第1页 / 共30页
第2页 / 共30页
第3页 / 共30页
第4页 / 共30页
第5页 / 共30页
第6页 / 共30页
第7页 / 共30页
第8页 / 共30页
第9页 / 共30页
第10页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
8.2.2 8.2.2 一元线性回归模型参数一元线性回归模型参数的最小二乘估计的最小二乘估计(1)(1)8.2 8.2 一元线性回归模型及其应用一元线性回归模型及其应用2.2.建立一元线性回归模型的步骤建立一元线性回归模型的步骤1.1.一元线性回归模型一元线性回归模型(1)与函数模型的区别 (2)随机误差产生的原因及分布 定性分析定量分析函数关系 or 相关关系 or 没有关系?(1)整理数据)整理数据复习回顾复习回顾四、估计一元线性回归模型的参数四、估计一元线性回归模型的参数设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),(xn,yn),由yi=bxi+a+ei(i=1,2,n),得说明:说明:参数a和b刻画了变量Y与变量x的线性关系,因此通过样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.显然|ei|越小,从整体上看,各点与此直线的距离最小,即样本数据点离直线y=bx+a的竖直距离越小,特别地,当ei=0时,表示点(xi,yi)在这条直线上.方便计算刻画“整体接近程度”随机误差平方和随机误差平方和要使要使Q达到最小值时,达到最小值时,a和和b的估算值应该是多少?的估算值应该是多少?四、估计一元线性回归模型的参数四、估计一元线性回归模型的参数 以上公式的推导的原理较为简单:各点到各点到该直直线的距离的平方和最的距离的平方和最小小,这一方法叫最小二乘法最小二乘法。五、利用一元线性回归方程进行预测五、利用一元线性回归方程进行预测编编号号1234567891011121314父父亲亲身高身高/cm174170173169182172180172168166182173164180儿子身高儿子身高/cm176176170170185176178174170168178172165182参考数据:利用公式(2)可以计算出b=0.839,a=28.957,得到儿子身高Y关于父亲身高x的经验回归方程为:由经验回归方程可以预测儿子的身高。答:答:儿子的身高不一定不一定会是177cm,这是因为还有其他影响儿子身高的因素,回归模型中的随机误差清楚地表达了这种影响,父亲的身高不能完全决定儿子的身高,不过,我们可以作出推测,当父亲的身高为176cm时,儿子身高一般在177cm左右.如果把父亲身高为176cm的所有儿子身高作为一个子总体,那么177cm是这个子总体均值的估计值总体均值的估计值.思考:根据经验回归方程 中斜率的具体含义,高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?根据经验回归方程 中斜率0.839可以解释为父亲身高每增加1cm,其儿子的身高平均增加0.839cm.分析模型可以发现,高个子父亲有生高个子儿子的趋势,但一群高个子父亲的儿子们的平均身高要低于父亲们的平均身高,例如x=185(cm),则 矮个子父亲有生矮个子儿子的趋势,但一群矮个子父亲的儿子们的平均身高要高于父亲们的平均身高,例如x=170(cm),则 英国著名统计学家高尔顿把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.x681012y2356解解:(1 1)作出散点图如图所示.导学案P121导学案P121解:解:(2 2)x681012y2356(1)作出散点图作出散点图,从直观上分析数据间是否存在线性相关关系;(4)写出经验回归方程并对实际问题作出估计.求经验回归方程的基本步骤求经验回归方程的基本步骤六、刻画回归效果的方式六、刻画回归效果的方式(1 1)残差图法残差图法 通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析残差分析.(1)列残差表)列残差表编编号号父父亲亲身高身高/cm儿子身高儿子身高观测值观测值/cm儿子身高儿子身高预测值预测值/cm残差残差/cm1174176174.9431.0572170176171.5874.4133173170174.1044.104编编号号父父亲亲身高身高/cm儿子身高儿子身高观测值观测值/cm儿子身高儿子身高预测值预测值/cm残差残差/cm1174176174.9431.0572170176171.5874.4133173170174.1044.1044169170170.7480.7485182185181.6553.3456172176173.2652.7357180178179.9771.9778172174173.2650.7359168170169.9090.09110166168168.2310.23111182178181.6553.65512173172174.1042.1041316416566.5531.55314180182179.9772.023残差表:残差表:(2)残差)残差图残差残差图:作图时纵坐标 为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图 好的回归方程对应的残差散点图应是均匀地分布在横轴两侧的带状区域内.且带状区域越窄,说明模型拟合效果越好越越窄窄越越好好六、刻画回归效果的方式六、刻画回归效果的方式残差图法残差图法(1)(2)(3)(4)观察以下四幅残差察以下四幅残差图,你,你认为哪一个残差哪一个残差满足一元足一元线性回性回归模型中模型中对随机随机误差的假定?差的假定?(1)(2)图(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;(3)(4)图(3)说明残差的方差不是一个常数,随观测时间变大而变大图(4)的残差比较均匀地集中在以横轴为对称轴的水平带状区域内.满足一元线性回归模型对随机误差的假设。一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.在使用经验回归方程进行预测时,需要注意下列问题:(1)经验回归方程只适用于所研究的样本的总体.(2)经验回归方程一般都有时效性.(3)解释变量的取值不能离样本数据的范围太远.(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.事实上,它是响应变量的可能取值的平均值.决定系数R2公式:1.R2的范围:0,1;2.R2越大,表示残差平方和越小,模型的拟合效果越好;反之,模型的拟合效果越差;3.决定系数是总偏差平方和中回归平方和所占的比重,R2越接近于1,表示回归的效果越好.还可以证明,在一元线性回归模型中R2=r2,即决定系数R2等于响应变量与解释变量的样本相关系数r的平方.六、刻画回归效果的方式六、刻画回归效果的方式决定系数决定系数R R2 2法法例题 经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表,试根据这些数据建立树高关于胸径的经验回归方程.编号编号123456789101112胸径胸径/cm18.120.122.224.426.028.329.6 32.4 33.7 35.7 38.3 40.2树高树高/m18.819.221.021.022.122.122.4 22.6 23.0 24.3 23.9 24.7 分析:分析:求一元线性回归方程的步骤:(1)以成对样本数据描出散点图,通过散点图观察成对样本数据是否线性相关。(2)计算样本相关系数r,判断两个变量之间的线性相关关系。(可省可省)(4)残差分析:残差表、残差图及决定系数R2对回归模型的拟合效果进行评估。例题 经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表,试根据这些数据建立树高关于胸径的经验回归方程.编号编号123456789101112胸径胸径/cm18.120.122.224.426.028.329.6 32.4 33.7 35.7 38.3 40.2树高树高/m18.819.221.021.022.122.122.4 22.6 23.0 24.3 23.9 24.7 解:解:以胸径为横坐标,树高为纵坐标作散点图 在右图中,散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系.例题 经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表,试根据这些数据建立树高关于胸径的经验回归方程.编号编号123456789101112胸径胸径/cm18.120.122.224.426.028.329.6 32.4 33.7 35.7 38.3 40.2树高树高/m18.819.221.021.022.122.122.4 22.6 23.0 24.3 23.9 24.7 解:解:用d表示胸径,h表示树高,根据据最小二乘法,计算可得经验回归方程为:相应的经验回归直线如图所示.编号编号胸径胸径/cm树高观测值树高观测值/m树高预测值树高预测值/m残差残差/m118.1 18.8 19.4-0.6 220.1 19.2 19.9-0.7 322.2 21.0 20.4 0.6 424.4 21.0 20.9 0.1 526.0 22.1 21.3 0.8 628.3 22.1 21.9 0.2 729.6 22.4 22.2 0.2 832.4 22.6 22.9-0.3 933.7 23.0 23.2-0.2 1035.7 24.3 23.7 0.6 1138.3 23.9 24.4-0.5 1240.2 24.7 24.9-0.2 残差分析:残差分析:根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,如下表所示.以胸径为横坐标,残差为纵坐标,作残差图,得到下图.观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高.计算决定系数R2:R20.9326故回归模型的拟合效果很好.建立树的胸径和树高的关系是有实际意义的实际上,在采伐设计、资源评估、森林规划调查等林业工作中常需测算森林蓄积量可以从森林中抽取部分树木,通过树的胸径与树高估计抽到的每棵树的体积,进而推断整片森林的蓄积量由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高因此,建模时将胸径作为解释变量,树高作为响应变量,即树高作为响应变量是解决实际问题的需要回归分析的实际意义导学案P122例2(1)D巩固巩固练习练习2 已知某种商品的单价x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的经验回归方程,并说明回归模型拟合效果的好坏.解:解:巩固巩固练习练习2 已知某种商品的单价x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的经验回归方程,并说明回归模型拟合效果的好坏.解:解:列残差表如下:列残差表如下:y1210753129.77.45.12.800.30.40.10.24.62.60.42.44.4故回故回归归模型的模型的拟拟合效果很好合效果很好.利用残差图直观判断模型是否满足一元线性回归模型的假设。残差散点图应均匀地分布在横轴两侧,呈带状,宽度越窄,说明模型拟合精度越高。也可以利用决定系数决定系数R2判断回归模型的拟合效果。1.经验回归方程
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号