资源预览内容
第1页 / 共53页
第2页 / 共53页
第3页 / 共53页
第4页 / 共53页
第5页 / 共53页
第6页 / 共53页
第7页 / 共53页
第8页 / 共53页
第9页 / 共53页
第10页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2 2页页8.1 方差分析8.1.1 问题的提出 实际工作中我们经常碰到: 多个正态总体均值的比较问题 处理这类问题采用所谓的方差分析方法。注:1、方差分析是一种特别的假设检验 2、计算过程繁琐但机上实现很容易俐矿暂俩雾线售萍筛痢峨浆镰败姆百负牲种刨盟剩罩瑟媳赎衰乌驶灵身埔课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3 3页页例8.1.1 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示: 铣屡渍涧填你到敷明伊聘辕模监佃总赢瑰锤床奄拆钮寐痴汇值衷痪寅贿怔课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4 4页页表8.1.1 鸡饲料试验数据 饲料A鸡 重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048茵妖菜戏羞狞阀韧披侵煤剔封码刊员诗邹感卉悉越厅敬似揽裁仑当夏褒逸课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第5 5页页 本例中,我们要比较的是三种饲料对鸡的增肥作用是否相同。为此,把饲料称为因子,记为A,三种不同的配方称为因子A的三个水平,记为A1, A2, A3,使用配方Ai下第 j 只鸡60天后的重量用yij表示,i=1, 2, 3, j=1, 2, 8。我们的目的是比较三种饲料配方下鸡的平均重量是否相等,为此,需要做一些基本假定,把所研究的问题归结为一个统计问题,然后用方差分析的方法进行解决。 瘟绩谗氦他鲜厩值礁除妥臣汕匹迢呻饭怕驶甸的色疲瑰缸辫域圆耿赁敬介课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第6 6页页8.1.2 单因子方差分析的统计模型 在例8.1.1中我们只考察了一个因子,称其为单因子试验。 通常,在单因子试验中,1个因子为 A, 设其有r个水平,记为A1, A2, Ar,在每一水平下考察的指标可以看成一个总体 ,现有 r 个水平,故有 r 个总体,每一水平下的总体抽取m个样本,假定:健憨邑匹纯崖正挖奉循因泳玖摧盐励掺现苇臆剥手痹汗活略砍犹殆鸵明粉课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第7 7页页1)每一总体均为正态总体,记为 N(i , i 2), i1, 2, r ;2)各总体的方差相同: 1 2= 22= r2 = 2 ;3)从每一总体中抽取的样本是相互独立的, 即所有的试验结果 yij 都相互独立。4)我们要比较各水平下的均值是否相同睁讥赴靴殖大咐豁绸剑榜岂捉骂览丢希涩沟箔灼遣常归树鳞瓢颧臼掺耍邵课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第8 8页页 即原假设 H0 :1 =2 =r 备择假设为 H1 :1, 2, , r 不全相等 如果 H0 成立,称因子A的 r 个水平间没有显著差异,简称因子A不显著; 反之,当 H0 不成立时,因子 A 的 r 个水平均值不全相同,这时称因子 A 的不同水平间有显著差异,简称因子 A 显著。 雹巢税球械藏好消斥段右袍乐坞栋龙销掸枝蚕街蚜矗淆湿小爷鸵盟维狸誊课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第9 9页页样本数据 每一水平下的总体抽取m个样本,共得如下n=rm个试验结果:yij, i1, 2, r , j1, 2, , m总均值与效应: 称诸 i 的平均 为总均值. 称第 i 水平下的均值 i 与总均值 的差: ai=i - 为 Ai 的效应。 即 i = +ai溪芯逛阿冗悼瞬钠侮单救驰岗切基痴页脾肝旺畴砍扒屑漳聚蔬好安驰葱袜课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1010页页表8.1.28.1.2 单因子方差分析试验数据单因子方差分析试验数据 因子水平 试 验 数 据 和 平均 A1y11 y12 y1m T1A2y21 y22 y2mT2Aryr1 yr2 yrmTrT钦刻靡潮峭辕爱俄嘱篡看优规村挪倔澈镣桨椭喜剂蝴应普河根雅省哥滥善课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1111页页 模型可以改写为 单因子方差分析的统计模型如下:假设H0 :1 =2 =r 可改写为 H0 :a1 =a2 =ar =0若记随机误差ij = yiji,而 i = +ai秦滦上芳北种濒软霞器翘映圆埃凯沿蹭惹站仕阀峭蹄浆腔杨枕超撕撬茂吁课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1212页页一、组内偏差与组间偏差8.1.3 平方和分解(理论分析) 1、组内偏差 仅反映组内数据与组内平均的随机误差;2、组间偏差 除反映随机误差外还反映了第i个水平的效应ai3、总偏差久目怀彝涩桃胰玫殷莲肌矢上锑痛证垛盗发雅缆奉吃购厦芹屉橇坦岁貌腿课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1313页页二、总平方和分解公式组内偏差平方和,也称为误差偏差平方和组间偏差平方和,也称为因子A的偏差平方和总偏差平方和表示各 yij 间总的差异大小夺颈划帮宝塌酗定菏用壤侥搓渗姬苑辱势阀踪借寝摧朋弛扭荒蓄君逞末柠课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1414页页1、选择检验统计量8.1.4 检验方法(具体分析流程)2、明确拒绝域:W=FF1 (r-1 ,n-r)3、列出方差分析表。来源 平方和 自由度均方和F比因子SAr1SA/(r-1)F误差SenrSe/(n-r)总和STn14、推断:F F1 ,则认为因子A显著;凳渐惰硬潞榜袜惶圭唁朋址诛贝资锤管霓幌汤塘洽晋翅疼昏轨篮锚忱锑服课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1515页页各偏差平方和的简化计算公式注:1、简化计算公式也是为了编程,而非 为了手工计算,方差分析软件很多 2、重在掌握思想方法,掌握如何用堕全钝剁毙妆基印温拿仿吧阜冻烂去敦易禁浓掠替卸籽辅锹额徐尾憎蔓结课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1616页页例8.1.2 采用例8.1.1的数据,将原始数据减去1000, 列表给出计算过程: 表8.1.4 例8.1.2的计算表水平数据(原始数据-1000)TiTi2A173 96012129281943763610024A210792-101099074122158534222560355A393 2980212232294835412531620984113350517791363愈便尘穗焉赞珊三痕捉虾永惜挟糙认罚因饭迈离逆援断器曙郑在测铡糜投课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1717页页 利用(8.1.19),可算得各偏差平方和为: 把上述诸平方和及其自由度填入方差分析表腥纶犁晓胆轧苇淋钥钱株陌捣舷教莉布瘴嗽稠缔唆傣淫患窗重孩蛹冒只梳课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1818页页表8.1.5 例8.1.2的方差分析表 来源平方和自由度均方和F比因子9660.083324830.04173.5948 误差28215.9584211343.6171总和37876.041723若取=0.05,则F0.95 (2 ,21)=3.47 ,由于F=3.59483.47,故认为因子A(饲料)是显著的,即三种饲料对鸡的增肥作用有明显的差别。 圣仗幅致归谆耻驳狂弗靖晕镑桥谗疡住抚啄屠界猿驱院构溪槽饺邓梁街豢课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第1919页页8.4 一元线性回归 8.4.1 变量间的两类关系 十九世纪,英国生物学家兼统计学家高尔顿研究发现: 其中x表示父亲身高, y 表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。 援华俐过大粟间婴翱奠垫夏孰沼滞祖沦皇祟曳膘妆糟橙魄孩牢繁仅累测败课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2020页页 回归分析便是研究变量间相关关系的一门学科。它通过对客观事物中变量的大量观察或试验获得的数据,去寻找隐藏在数据背后的相关关系,给出它们的表达形式回归函数的估计。 变量间的相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式,寻找这种定量关系表达式就是回归分析的主要任务。 回归分析处理的是变量与变量间的关系。变量间常见的关系有两类:确定性关系与相关关系。喻朵了讲脉卫挖蔓搜滓更钧廓抽慷防下件颇转波判恬梨撂赵烫瘤瞥祭局戏课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2121页页 8.4.2 一元线性回归模型 设y与x间有相关关系,称x为自变量(预报变量),y为因变量(响应变量),在知道x取值后,y有一个分布p(yx),我们关心的是y的均值E(Yx): (8.4.1) 这便是y关于x的理论回归函数条件期望,也就是我们要寻找的相关关系的表达式。 通常,相关关系可用下式表示 y =f (x)+ 其中是随机误差,一般假设 N(0, 2)。 淌排纪谰朋铆琉怪寺靳架染张谅齿挝唤匣激笼糙梆旨勉斟漱柜诈讯瞒饱刽课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2222页页 例8.4.1 合金的强度y (107Pa) 与合金中碳的含量x (%) 有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi),i=1,2,n。本例中,我们收集到12组数据,列于表8.4.1中 进行回归分析首先是回归函数形式的选择。当只有一个自变量时,通常可采用画散点图 的方法进行选择。储熏颤狠樟俞辱据凿懒卒故锯璃茄铡楷旺旅牲隆蝉指搂禹熬婶勇掀兔懦睬课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2323页页表8.4.1 8.4.1 合金钢强度合金钢强度y y与碳含量与碳含量x x的数据的数据 序号x(%)y (107Pa)序号x(%)y (107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.0吏枷逼酚呈育死卢改疯能鞠鼓鼎然梁辙猫正蔽赏钩蚌适折弹敖蚤念恨弓针课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2424页页 为找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见图8.4.1 鬃堡雅贩姐丹勘镁体叠导很五偏棠剐攀放役扔刘薪厄苛晋招傍殊厩滑楔披课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2525页页 从散点图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为 y =0+ 1x+ (8.4.2) 这便是y关于x的一元线性回归的数据结构式。通常假定 E() =0, Var() = 2 (8.4.3) 在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即 y N(0+ 1x, 2 ) (8.4.4) 显然,假定(8.4.4) 比 (8.4.3) 要强。 萝名蜘俩簇贫名麦蕉祥伶泌涡碧轿搪筐延咳痉民咳旧钙涨钨艰佩刁吠猖洼课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2626页页 由于 0, 1均未知,需要我们从收集到的数据(xi,yi),i=1,2,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行, 即假定y1, y2, yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型: (8.4.5) 掖逸戴螟乙鹤鲸估卉镍太槽极老辊沸寸虐侵海燥烷铭睛绅啡庙澡抖饥摹他课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2727页页 由数据(xi,yi),i=1,2,n,可以获得0, 1的估计 ,称 (8.4.6) 为y关于x的经验回归函数,简称为回归方程,其图形称为回归直线。给定x=x0后, 称 为回归值(在不同场合也称其为拟合值、预测值)。 借沦脓五鞠绑炕得吐遗惕奔嘘奥构啮甸厘瞄闹乘昌膝框雏化稻关桶翔睬毛课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2828页页8.4.3 回归系数的最小二乘估计 一般采用最小二乘方法估计模型(8.4.5)中的0, 1 :令: 应该满足 称这样得到的 称为0, 1的最小二乘估计,记为LSE。 撰唾仪饮鸦缓踏拈喇夯至物棚捉卒尼助班缄搬尘捡包俞省决冻弟觉并涝专课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第2929页页 最小二乘估计可以通过求偏导数并命其为0而得到: (8.4.7) 这组方程称为正规方程组,经过整理,可得 (8.4.8) 乌昏鳖论抵忿滨性纸庶磊砰心角烃河椒称爽署棋巫姿撬骋铂印石骋辙磨原课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3030页页解(8.4.8)可得 (8.4.9)这就是参数的最小二乘估计,其中 贿茧腥绎身类漾卫象讲寨衫迄集服叫休焕鹅蛇傻篓渠棘钨盂体樊饼柜充瘦课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3131页页表8.4.2 例8.4.2的计算表 xi=1.90n=12yi=590.5xi2=0.3194xi yi =95.9250yi2=29392.75lxx=0.0186lxy=2.4292lyy=335.2292由此给出回归方程为: 例8.4.2 使用例8.4.1种合金钢强度和碳含量 数据,我们可求得回归方程,见下表. 瞒页适伏灌配嗽沃沙孔翠熄廉急顷器祁冗但戮瘤郡肺峦惯辊建溺搓窝怠克课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3232页页 定理8.4.1 在模型(8.4.5)下,有 (1) (2) (3)对给定的x0,关于最小二乘估计的一些性质罗列在如下定理之中 蹿雕诈烈通档借欲祟征七窍捡怕菌度镍肇节怒广陡战缆噪丫餐允稗屁屁蛾课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3333页页定理8.4.1 说明 分别是0, 1的无偏估计; 是E(y0)=0+ 1 x0的无偏估计; 除 外, 与 是相关的; 要提高 的估计精度(即降低它们的方 差)就要求n大,lxx大(即要求x1, x2, xn较 分散)。 藻唐鸭骚混损牧掐帘轮瘩兢蔽凄蔡钳拍匠娶刨惰惫夕者吃擅荣圣窟坷旺邦课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3434页页8.4.4 回归方程的显著性检验 在使用回归方程作进一步的分析以前,首先应对回归方程是否有意义进行判断。 如果1=0,那么不管x如何变化,E(y)不随x的变化作线性变化,那么这时求得的一元线性回归方程就没有意义,称回归方程不显著。如果10,E(y)随x的变化作线性变化,称回归方程是显著的。 综上,对回归方程是否有意义作判断就是要作如下的显著性检验:H0:1=0 vs H1: 10 拒绝H0表示回归方程是显著的。敢棘懊咳绅缆雪狐碰切写砒碳轩沙哟痛惫皖叔兜涕肪讣榔项啃住酌楞盘嗡课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3535页页一、F 检验 采用方差分析的思想,我们从数据出发研究各yi不同的原因。 数据总的波动用总偏差平方和 表示。引起各yi不同的原因主要有两个因素:其一是H0可能不真,E(y)随x的变化而变化,从而在每一个x的观测值处的回归值不同,其波动用回归平方和 表示;其二是其它一切因素,包括随机误差、x对E(y)的非线性影响等,这可用残差平方和 表示。 且有如下平方和分解式: ST= SR + Se (8.4.13) 在一元线性回归中有三种等价的检验方法,下面分别加以介绍。殖熔猖瑰桂举描推骋欧捆逊福郝历封梁玄藤谷鼎埔镀姆散散沼馋久溃腕技课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3636页页定理8.4.2 设yi=i+ 1 xi + i,其中i n相互独立, 且Ei=0,Var(yi)= 2,i=1,n,沿用上面的记号,有 (8.4.14) (8.4.15) 这说明 是 2的无偏估计。 关于SR 和 Se所含有的成分可由如下定理说明。 兽兜宙送华怖媒稠模膛及析隔壤返思突倚菇祸蒋皖落璃回拟而淄臃哀绰户课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3737页页进一步,有关SR 和 Se的分布,有如下定理。 定理8.4.3 设 y1, y2, yn 相互独立,且 yiN(i + 1 xi , 2), i=1, , n, 则在上述记号下,有 (1)Se / 2 2(n2), (2)若H0成立,则有SR / 2 2(1) (3) SR与Se , 独立(或 与Se , 独立)。 篱谴林拼坞舶六列略壁塔淀宦叁淮悬舆棱吹射熬彰翼锄闲日监救申冤肿栽课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3838页页 如同方差分析那样,我们可以考虑采用F比作为检验统计量: 在1 =0时,FF(1, n2),其中fR =1, fe =n2. 对于给定的显著性水平,拒绝域为 F F1-(1, n2) 整个检验也可列成一张方差分析表。 专婚喷糠钥桥辫治贿冯确蚀箕怖荚问狼块沤昆疵升除矿猩谢楷甄困糜衰漳课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第3939页页来源平方和自由度均方和F比回归 SR =317.2589fA=1MSA=317.2589176.55残差Se =17.9703fe=10MSe= 1.79703总和 ST =335.2292fT=11例8.4.3 在合金钢强度的例8.4.2中,我们已求出了回归方程,这里我们考虑关于回归方程的显著性检验。经计算有 若取=0.01,则F0.99(1,10) =103.1698,因此,在显著性水平0.01下回归方程是显著的。 睬哥例堰店硝最误陶涟泌背皇行池抉削榷鹏殷瀑潮绦装绅奉乾率劲蔓防怯课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4242页页 三、相关系数检验 一元线性回归方程是反映两个随机变量x与y间的线性相关关系,它的显著性检验还可通过对二维总体相关系数的检验进行。它的一对假设是 H0:=0 vs H1: 0 (8.4.18) 所用的检验统计量为样本相关系数 (8.4.19) 拒绝域为W=rc,其中临界值c应是H0: =0成立下r的分布的1 分位数,故记为c=r1- (n2). 流揣阂斤淘求篷藐鳞曳酪晦卤已吏谭霸坞盔袁牧担抛匝裴恼吕歹商迁暑理课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4343页页 由样本相关系数的定义可以得到 r与F统计量之间的关系 这表明, r是F的严格单调增函数,故可以从F分布的1 分位数 F1-(1, n2) 得到 r 的1 分位数为崖妖粹垦嚏艇扛掉毫揍井吾琉跌斤拎站繁枉鲤箕忆钎钠姐锌裔零前乒盘夫课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4444页页 譬如,对 =0.01,n=12, F0.99(1,10)=10.04 ,于是 。 为实际使用方便,人们已对r1- (n-2)编制了专门的表,见附表9。 以例8.4.2中数据为例,可以计算得到 若取 =0.01,查附表9知 r0.99(10)=0.708, 由于0.97280.708,因此,在显著性水平0.01下回归方程是显著的。 沪旦产堵窄撩互撑界芹艾蟹彝侵警伙旋烙匀侥盘冷酣涝脖造艺巡辊肛矩族课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4545页页 在在一一元元线线性性回回归归场场合合,三三种种检检验验方方法法是是等等价价的的:在在相相同同的的显显著著性性水水平平下下,要要么么都都拒拒绝绝原原假假设设,要么都接受原假设,不会产生矛盾。要么都接受原假设,不会产生矛盾。 F F 检检验验可可以以很很容容易易推推广广到到多多元元回回归归分分析析场场合合,而而其其他他二二个个则则否否,所所以以,F F检检验验是是最最常常用用的的关关于于回归方程显著性检验的检验方法。回归方程显著性检验的检验方法。奄萍仍明赖痴酞诅播貌瓜指捣弧锋苞萝愚沫匝塔枯眉颅陨啪稠爬山赌和锑课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4646页页 8.4.5 估计与预测 当回归方程经过检验是显著的后,可用来做估计和预测。这是二个不同的问题: (1)当x=x0时,寻求均值E(y0)=0+ 1 x0的点估计与区间 估计(注意这里E(y0)是常量)是估计问题; (2)当x=x0时,y0的观察值在什么范围内?由于y0是随机 变量,为此只能求一个区间,使y0落在这一区间的概 率为1- ,即要求,使 称区间 为y0的概率为1- 的预测区间, 这是预测问题。 脯畅咐瑚袋酶纯勿席撮糕肄吃暗钟憾衡谅纺灾囤番交附啪泉菌眯荷总鸡肿课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4747页页一、 E(y0)的估计 在x=x0时,其对应的因变量y0是一个随机变量,有一个分布,我们经常需要对该分布的均值给出估计。由于E(y0)=0+ 1 x0,一个直观的估计应为 我们习惯上将上述估计记为 (注意这里 表示的是E(y0)的估计,而不表示y0的估计,因为y0是随机变量,它是没有估计的)。由于 分别是0, 1的无偏估计,因此, 也是E(y0)的无偏估计。 坦灼忧善褂蓉腻巾戒诉瞻揖根宠抗公授困茧拉蚀绎爵仔床劫考稍窟根剪褒课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4848页页 为得到E(y0)的区间估计,我们需要知道 的分布。由定理8.4.1, 又由定理8.4.3知, Se / 2 2(n-2),且与 相互独立,故幌蒸几脑辉板唬挚照食蛰兔烛塑峭嘘肤篷肢柜岁硷祸鼓腆拌诡草握允球诸课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第4949页页于是E(y0)的1 的置信区间(CI)是 (8.4.20)其中 (8.4.21)偷徘毛撅诫漠锦钵山糟娄琶氧称逢豁盐揣撅淤陌辽荐简灭泻辗具时秦胞稍课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第5050页页 二、 y0的预测区间 实用中往往更关心x=x0时对应的因变量y0的取值范围。 y0的最可能取值为 ,于是,我们可以使用以 为中心的一个区间 作为y0的取值范围。经推导, 的表达式为 (8.4.23) 上述预测区间(PI)与E(y0)的置信区间的差别就在于根号里多个1。 拟捡稀屉揽方涩谗堑粤帧邑凳坎航窃聂在忍参耽役饱闭崔办奔菩唁吐妊奴课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第5151页页 预测区间的长度2与样本量n、x的偏差平方和lxx、 x0 到 的距离 有关。 当 时,预测精度可能变得很差,在这种情况下的预测称作外推,需要特别小心。另外,若x1, x2, xn较为集中时,那么lxx就较小,也会导致预测精度的降低。因此,在收集数据时要使x1, x2, xn尽量分散,这对提高精度有利。 当n较大时(如n 30), t分布可以用正态分布近似,进一步,若x0与 相差不大时, 可以近似取为 。 洼乡杆棘渡氟蹈浓里藏缄亩记萧弯臆苗悠夯具襟哨驰咀遁臻龙宣翟岭适渴课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第5252页页 例8.4.4 在例8.4.2中,如果x0=0.16,则得预测值为 若取 =0.05,则t0.975(10)=2.2281, 又 ,应用(8.4.21), 故x0=0.16对应因变量y0的均值E(y0)的0.95置信区间为(49.4328-1.0480, 49.4328+1.0480) =(48.3488, 50.5168)浦缕警鞋闷喝掉滇背泰为芬征恒艺尊么灿尔涪蓄互伺迅梨屯徒仕岿了垣壶课程释疑7第七章假设检验课程释疑7第七章假设检验第八章第八章 方差分析与回归分析方差分析与回归分析 宁波工程学院宁波工程学院 理学理学院院9/2/20249/2/2024第第5353页页 应用(8.4.23), 从而y0的概率为0.95的预测区间为 E(y0)的0.95置信区间比y0的概率为0.95的预测区间窄很多,这是因为随机变量的均值相对于随机变量本身而言要更容易估计出来。 烂征奄浓走葫协颜楚猾醒冻刨洞蔫翠坡删脉李高茫卞筛臭决邪歹锋慷量贫课程释疑7第七章假设检验课程释疑7第七章假设检验
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号