资源预览内容
第1页 / 共91页
第2页 / 共91页
第3页 / 共91页
第4页 / 共91页
第5页 / 共91页
第6页 / 共91页
第7页 / 共91页
第8页 / 共91页
第9页 / 共91页
第10页 / 共91页
亲,该文档总共91页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第七章 试验数据的回归分析 回归分析适合研究哪类问题? 回归方程的显著性检验适合什么情况? 回归系数的显著性检验适合什么情况? 第七章 试验数据的回归分析回归分析:广义上的回归分析,同时包括狭义的相关分 析与回归分析的全部内容,亦即本章既研究现象间相 互依存关系的密切程度,又研究现象之间数量相关的 具体形式。重点:明确相关关系,函数关系,因果关系,掌握基本 的回归分析方法,能应用实际资料构建一元线性回归 模型。 难点:多元线性回归分析。第七章 试验数据的回归分析7.1 回归分析的基本概念 7.1.1 因变量(Y)与自变量(X)之间的关系根据因变量与自变量之间的关系不同,可以分为两种类型:函数关系 统计关系 第七章 试验数据的回归分析7.1.1 因变量(Y)与自变量(X)之间的关系1.函数关系 即对两个变量X,Y来说,当X值确定后,Y值按照 一定的规律唯一确定,即形成一种精确的关系。 (1)欧姆定律:I = U/R; (2)气体体积、压强与绝对温度的关系:PV =RT; (3)速度与距离、时间的关系:v = s/t。 第七章 试验数据的回归分析7.1.1 因变量(Y)与自变量(X)之间的关系2.统计关系 即当X值确定后,Y值不是唯一确定的, 但大量统计资料表明,这些变量之间还 是存在着某种客观的联系。 例如:图7.1在直角坐标平面上,标出了10 个观测点的坐标位置,他们表示以家庭为单 位,某种商品年需求量与该商品价格之间 的10对调查数据。 第七章 试验数据的回归分析7.1.2 回归分析图7-1第七章 试验数据的回归分析7.1.2 回归分析 例如,炼钢厂在冶炼当中,成品含碳量和冶炼时间这两个 变量之间,就不存在确定性的关系,对于含碳量相同的钢 ,冶炼时间却不相同 再如,人的年龄与血压之间,要找出一个确定性的关系也 是很困难的 然而,这些变量之间还是有着密切的关系的,虽然各组数 据不是准确地服从f(x)关系,但y值总还是随着x值的增加 而变化这种关系称为统计关系 .第七章 试验数据的回归分析变量与变量的关系: 确定性关系函数关系 U=IR v=gt 变量与变量的关系: 非确定性关系统计相关 (具有统计规律) Y=f(x1, x2, , xn)+回归分析方法第七章 试验数据的回归分析7.1.2 回归分析研究因素(自变量)的多少,一元回归分析多元回归分析;以其变量之间呈线性或非线性的关系又可分为线性回归分析非线性回归分析。第七章 试验数据的回归分析7.1.2 回归分析 回归分析主要解决以下几个方面的问题: (1)确定几个特定的变量之间是否存在相关关系,如 果存在的话,找出它们之间的数学表达式; (2)根据一个或几个变量(试验因素)的值,预测或 控制另外几个变量(试验因素)的取值,并给出其精 确度; (3)对共同影响一个变量的多个因素,找出其中主要 影响因素、次要影响因素,并判定这些因素之间的相 关程度。第七章 试验数据的回归分析7.1.2 回归分析回归分析(Regression Analysis) 就是应用统计方法,对大量的观测数据进行整 理、分析和研究,从而得出反映事物内部规律 性的一些结论。 第七章 试验数据的回归分析7.2 一元线性回归模型 7.2.1 统计关系的特征统计关系 特征 观测点散布在统计关系直线的周围,此 种情况说明Y的变化除了受自变量X 影响以外,还受其他因素的影响。因此试图建立这样一个回归模型,通过对此模型 所作的一些假设,可以体现出上述统计关系所刻划的特征。因变量Y随自变量X有规律的变化,而统 计关系直线描述了这一变化的趋势 。第七章 试验数据的回归分析7.2.2 一元线性回归模型假设u根据统计关系特征,可以进行下述假设:假设(2)这些Y的概率分布的均值,有规律的随X变化而变化(1)对于自变量的每一水平X,存在着Y的一个概率分布;第七章 试验数据的回归分析7.2.3 一元线性回归模型Y与X具有统计 关系而且是线性 建立 回归模型Yi=0+1Xi+i (i=1,2,n) 其中,(X i,Yi)表示(X,Y)的第i个观测值,0 , 1 为参数,0+1Xi为反映统计关系直线的分量, i为反映在统计关系直线周围散布的随机误差 iN (0,2)。第七章 试验数据的回归分析对于误差项,在回归分析中有如下假设:1)误差项是随机变量,它的期望值为0。 2)对于所有的 x值,误差项的方差 为常数。 3)误差项之间相互独立,即与一个值相联系的误差 对与另一个值相联系的误差没有影响。 4)随机误差项服从正态分布。第七章 试验数据的回归分析7.2.4一元线性回归方程描述y的均值E(y)与 x的关系的方程叫做回归方程。 不难看出,简单线性回归方程的图形是一条直线。这条直 线被称为总体回归直线。 各实际观测点与总体回归线垂直方向的间隔,就是随机误 差项,即截距斜率期望值第七章 试验数据的回归分析7.2.5估计一元线性回归方程 在实践中,参数往往是未知的,需要用样本数据进行估计。 根据样本数据拟合的直线,称为样本回归直线。 分别为 的估计值,是样本回归直线的截距和 斜率。 实际观测到的因变量y值,并不完全等于估计值 ,如果用 e表示二者之差,则样本回归模型为: 截距斜率第七章 试验数据的回归分析:第一,总体回归线是未知的,它只有一条;而样 本回归线则是根据样本数据拟合的,可以有若干条样 本回归线。第二,总体回归模型中的0和1是未知的参数, 表现为常数;而样本回归模型中的b0和b1是随机变量, 其数值随样本观测值不同而变动。第三,总体回归模型中的,是y与未知的总体回 归线之间的纵向距离,它是不可直接观测的;而样本 回归模型中的e,是y与样本回归线之间的纵向距离, 可以根据样本观测值计算得出。样本回归模型与总体回归模型的区别第七章 试验数据的回归分析7.2.5估计一元线性回归方程最小二乘法 Y与X之间 为线性关系 选出一条最能反 映Y与X之间关系 规律的直线 第七章 试验数据的回归分析7.2.5估计一元线性回归方程 一般而言,所求的b0和b1应能使每个样本观测点(X i,Y i) 与回归直线之间的偏差尽可能小,即使观察值与拟 合值的误差平方和Q达到最小。 图7-3 回归方程原理图第七章 试验数据的回归分析7.2.5估计一元线性回归方程令 Q达到最小值 b0和b1称为最小二乘估计量 微积分中极值 的必要条件 令偏导数为0解方程第七章 试验数据的回归分析7.2.5估计一元线性回归方程第七章 试验数据的回归分析 令第七章 试验数据的回归分析回归系数就可写成:第七章 试验数据的回归分析11第七章 试验数据的回归分析直线回归分析步骤 1、绘制散点图 2、计算回归系数(最小二乘法) 3、作回归直线(在自变量的实测范围内任取两个相距 较远的数值 、 ,根据 两点作图。第七章 试验数据的回归分析例7-1:某乡为了提高小麦产量,经过多次试验,总结出 一种小麦基本苗数推算成熟期有效穗数的方法。在5块田 上进行对比试验,取得数据如下:试验号基本苗数有效穗数1 2 3 4 51525.8 3036.644.439.4 42.9 41.0 43.1 49.2第七章 试验数据的回归分析解:回归直线方程计算表(1)编号xyxy1 2 3 4 515.0 25.8 30.0 36.6 44.439.4 42.9 41.0 43.1 49.2225.00 665.64 900.00 1339.56 1971.361552.36 1840.41 1681.00 1857.61 2420.64591.00 1106.82 1230.00 1577.46 2184.48合计151.8215.65101.569352.026689.76第七章 试验数据的回归分析回归直线方程计算表(2)第七章 试验数据的回归分析练习1:某企业上半年产品产量与单位成本数据如表所示。 试根据表中数据: (1)绘制散点图; (2)建立回归方程,说明产量每增加1000件,单位成本平 均变动如何? (3)作回归直线。产量(千件)单位成本(元/件)2 3 4 3 4 573 72 71 73 69 68第七章 试验数据的回归分析练习2: 根据Pizza连锁店的学生人数和季度销售收入数据 ,建立回归直线方程,并预测学生人数为25人时的销售收入 。连锁 店学生人数x销售收入yxy1 2 3 4 5 6 7 8 9 102 6 8 8 12 16 20 20 22 2658 105 88 118 117 137 157 169 149 202116 630 704 944 1404 2192 3140 3380 3278 52524 36 64 64 144 256 400 400 484 676合计1401300210402528第七章 试验数据的回归分析练习3:以下是采集到的有关女子游泳运动员的身高(英寸) 和体重(磅)的数据: a、用身高作自变量,画出散点图 b、根据散点图表明两变量之间存在什么关系? c、试着画一条穿过这些数据的直线,来近似身高和体重之间 的关系 d、求出估计的回归方程 e、如果一名运动员的身高是63英寸,你估计她的体重是多少 ?身高 68 64 62 65 66 体重132 108 102 115 128第七章 试验数据的回归分析研究腐蚀时间与腐蚀深度两个量之间的关系,可把腐蚀 时间作为自变量x,把腐蚀深度作为因变量y,将试验数 据记录在表7-1中,求出x,y之间的线性关系。 练习4第七章 试验数据的回归分析表7-1 试验数据第七章 试验数据的回归分析第七章 试验数据的回归分析表7-21b01第七章 试验数据的回归分析 得到回归直线方程: 第七章 试验数据的回归分析7.2.6可线性化的一元回归问题 常见的非线性函数及其转化为线性函数的方法:1、双曲线令第七章 试验数据的回归分析2、幂函数曲线令第七章 试验数据的回归分析3、数函数曲线 令第七章 试验数据的回归分析4、负指数函数曲线令第七章 试验数据的回归分析5、对数曲线令 第七章 试验数据的回归分析7.3 一元线性回归方程的检验 从上述回归方法可以看出,一组在散点图上杂乱 无章的观测值,也能利用最小二乘法给它们配一个方 程,但显然该方程将是毫无意义的,只有在观测点的 分布接近于一条直线时才能进行回归计算然而究竟在 什么情况下所配回归方程才有意义,或者说,两个变 量才服从线性关系呢?第七章 试验数据的回归分析7.3一元线性回归方程的检验 显著性检验,它是利用统计学中的抽样理论来检 验样本回归方程的可靠性,具体又可分为相关系数检验法F检验法第七章 试验数据的回归分析7.3.1.相关系数检验法相关系数注:r与b1的分母均为正,分子相同,故r与b1有相同的符号。 第七章 试验数据的回归分析图7-4不同相关系数散点意义图第七章 试验数据的回归分析相关系数具有如下性质: 1)r0称为正相关,r0称为负相关。 2)当r=1时,此时所有观察点全部在同一条直 线上; 3)当r=0时,称y与x统计不相关,这有两种情况 :一种是y与x间的确不存在任何统计规律性;另 一种情况是y与x的变化大致上有二次曲线关系, 但他们的相关系数为零。第七章 试验数据的回归分析 4)具有相关关系的两个变量之间最一般的情 况是0r1,当r较大时,表明变量 之
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号