资源预览内容
第1页 / 共84页
第2页 / 共84页
第3页 / 共84页
第4页 / 共84页
第5页 / 共84页
第6页 / 共84页
第7页 / 共84页
第8页 / 共84页
第9页 / 共84页
第10页 / 共84页
亲,该文档总共84页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
协方差分析(fnx)第一页,共八十四页。 协方差分析协方差分析实例:比较三种猪饲料 A1,A3,A3对猪催肥的效果,测得每头猪增加的重量(y)与初始重量(x)与数据如表。试测定三种饲料(slio)对猪的催肥有无显著的不同?初始重量与猪的增加重量之间有无明显的关系?猪的初始重量(x)与增加重量(y)水平 观察值 处理和 处理平均 A1 x 15 13 11 12 12 16 14 17 y 85 83 65 76 80 91 84 90 110 654 13.75 81.75 A2 x 17 16 18 18 21 22 19 18 y 97 90 100 95 103 106 99 94 149 784 18.625 98 A3 x 22 24 20 23 25 27 30 32 y 89 91 83 95 100 102 105 110 203 775 25.375 96.875 第二页,共八十四页。第五节 协方差分析(fnx) 一、协方差分析(fnx)的意义和功用 二、单向分组资料的协方差分析 三、两向分组资料的协方差分析第三页,共八十四页。 一、协方差分析的意义和功用 (一) 协方差分析的意义 协方差(covariance)是两个变数的互变异(biny)数。对于一个具有N 对(X,Y )的有限总体,其定义为: (945)第四页,共八十四页。 对于由n 对(x,y )组成的样本,则可定义: 样本协方差是乘积和与自由度的商,即平均的乘积和。一般又称为(chn wi)均积(mean products)或协方,记作MP,它是总体协方差 cov 的估值。 协方差分析(analysis of covariance)是将回归分析和方差分析综合起来的一种统计方法。 (946)第五页,共八十四页。(二) 协方差分析的功用 1. 当(x,y)为因果关系时,可利用 y 依 x 的回归系数矫正y变数的处理平均数,提高精确度。 2. 当(x,y)为相关关系时,可通过(tnggu)估计不同变异来源的总体方差和协方差,作出相应的相关分析。二、单向分组资料的协方差分析 (一) 资料模式与线性组成第六页,共八十四页。设有k 组回归样本,每组各有n 对观察值,则该资料共有(n yu)kn 对数据,其模式如表9.8。组组 别别观观察值值总总和平均1x11x12x13x1ny11y12y13y1n2x21x22x23x2ny21y22y23y2nk第七页,共八十四页。 单向分组资料协方差分析的样本线性组成(z chn)为: (947A)将(947A)移项项得: (947B) 和 (947C)第八页,共八十四页。 (二) 乘积(chngj)和和自由度的分解 上式中和的 i=1,2,3,k。其中: (949)(948)第九页,共八十四页。 如果(rgu)各组的n不等,分别为n1、n2、nk,其和为,则 其相应自由度为 、 、 。(950)第十页,共八十四页。 (三) 回归关系的协方差分析 协方差分析解决问题的步骤如下: (1)列出处理间、处理内和总变异的DF、SSx、SSy和SP。 (2)测验x 和y 是否存在直线回归关系。 (3)测验矫正平均数间的差异显著性。 (4) 如果所得F 为不显著,表明间无显著差异;如果F 为显著,则必须(bx)算出各个,进行多重比较,作出相应推断。 第十一页,共八十四页。 (四) 相关关系资料的协方差分析 相关关系资料的协方差分析主要讨论两个互有联系的总体的相关问题。 例9.16 为研究小麦品种经济性状的数量遗传,随机抽取90个品种,在田间每品种皆种成4个小区(每小区1行),共904=360个小区,完全随机排列。得到(d do)小穗数(x )和百粒重(y )的方差和协方差分析结果于表9.13。 第十二页,共八十四页。表9.13 90个小麦品种(pnzhng)的小穗数(x)和百粒重(y)的方差分析与协方差分析 +4变变异来源DFx的方差分析y的方差分析(x,y)的协协方差分析SSMSEMSSS MSEMSSPMPEMP品种间间 89597.996.719087.82510.9868-127.426-1.4322品种内270108.810.4030 8.31610.03089.9610.0369总变总变异359706.8096.1412-117.501第十三页,共八十四页。 表9.13中,x和y两者的方差分析按第六章第三节的方法作出;(x,y )的SP 则由(949)求出。将各SP除以相应的DF,即得平均的乘积和,即MP。期望协方EMP的分量和随机模型的EMS 相同,仅是以协方差符号cov代替 。这是处理(品种)效应 为随机型的资料,目的不是(b shi)研究特定的品种,而是研究抽出这些品种的小麦总体,因而需估计有关总体参数。 由表9.13中的MS 和EMS 的关系可得:第十四页,共八十四页。 由表9.13中MP 和EMP 的关系(gun x)得:因此(ync),小穗数和百粒重的环境相关系数re为:第十五页,共八十四页。 品种(pnzhng)(基因型)相关系数rg为: 以上re所对应的自由度是k(n-1)-1=269,为极显 著;rg的假设(jish)测验比较复杂,其简单近似是具自由 度k-2=88,亦为极显著。 根据以上方差和协方差分量,还能估计出小穗数和 百粒重的表型相关rp可估计为:第十六页,共八十四页。 第十七页,共八十四页。 三、两向分组资料的协方差分析 (一) 资料模式与线性组成 若资料有m类k组,则mk对观察值按两向分类,其模式如表9.14。表9.14 两向分组的两个变数(binsh)的符号第十八页,共八十四页。 样本(yngbn)线性组成为: (954A) 移项后可得: (954B) 和 (954C) 第十九页,共八十四页。 (二) 乘积(chngj)和和自由度的分解 表9.14的总SP 可分解为类间、组间和误差三部分,其值为: (955)第二十页,共八十四页。(三)协方差分析两向分组资料的协方差分析和单向分组资料并无原则上的不同,只是多了一个方向的变异来源。 例9.17 表9.15是研究施肥期和施肥量对杂交水稻南优3号结实率影响的部分结果,共14个处理,2个区组,随机区组设计。由于在试验过程中发现单位面积上的颖花数对结实率似有明显的回归关系,因此将颖花数(x,万/m2)和结实率(y,%)一起测定。该试验的处理效应为固定型,故按因果关系资料回归模型(mxng)作协方差分析。 第二十一页,共八十四页。表9.15 南优3号的颖花数(x)和结实率(y)资料(zlio) 处处理区 组组TiIIIxyxyxy12345678910111213144.594.093.943.903.453.483.393.143.344.124.123.843.963.0358656466717171726961636764754.324.114.113.573.793.383.033.243.044.764.753.604.503.01 61 62 64 69 67 72 74 69 69 54 56 62 60 718.918.208.057.477.246.866.426.386.388.888.877.448.466.041191271281351381431451411381151191291241464.4554.1004.0253.7353.6203.4303.2103.1903.1904.4404.4353.7204.2303.02059.563.564.067.569.071.572.570.569.057.559.564.562.073.064.7666.0365.9567.2267.8468.8768.1866.0264.5362.6464.6064.1065.5367.22Tr52.3993753.21910105.60 1847第二十二页,共八十四页。本例的协方差分析(fnx)的SAS程序如下:datafd;inputfeed$xy;cards;A11585A11383A11165A11276A11280A11691A11484A11790A21797A21690A218100A21895A221103A222106A21999A21894A32289A32491A32083A32395A325100A327102A330105A332110;procglm;classfeed;modely=feedx/solution;lsmeansfeed/stderrpdiff;run;第二十三页,共八十四页。 首先用两向分组资料的通常方法(fngf)算得表9.15资料的各项平方和于表9.16,乘积和则由以下各式算出:SPT=(4.5958)+(4.0965)+(3.0171) = - 73.60SPR=SPt=第二十四页,共八十四页。 SPe= - 73.60 - (- 0.79) - (- 66.37)= - 6.44表9.16 表9.15资料(zlio)的平方和和乘积和 变变 异 来 源SSxSSySP总总 变变 异7.7344802.96-73.60区 组组 间间0.024026.03-0.79处处 理 间间6.8732694.46-66.37误误 差0.837282.47-6.44 有了上述结果,就可先对x 和y 变数(binsh)各作一方差分 析,见表9.17。第二十五页,共八十四页。 表9.17 表9.15资料(zlio)的方差分析 变变 异 来 源DFx 变变 数y 变变 数F0.01SSMSFSSMSF区 组组 间间 10.02400.0240126.0326.03 4.10处处 理 间间136.87320.52888.20*694.4653.42 8.42*3.90误误 差130.83720.064582.476.34 表9.17的F 测验说明:不同处理的颖花数和结实率都有极显著的差异(chy)。所以更需要进行协方差分析,以明了各处理结实率的不同到底是处理的直接效应,还是通过颖花数的变化而产生的间接效应。第二十六页,共八十四页。 由表9.16和9.17结果,可作成(zuchng)协方差分析表于表9.18。表9.18 表9.15资料(zlio)的协方差分析 变变异来源DFSSxSSySPb离回归归的分析DFQMSFF0.05处处理+误误差267.7104776.93-72.812589.38处处 理136.8732694.46-66.37误误 差130.8372 82.47 -6.44-7.69231232.932.74矫矫 正 平 均 数 间间 的 差 异1356.454.34 1.58 2.66第二十七页,共八十四页。在表9.18的变异来源栏中,没有写上区组和总变异这是由于在田间试验中,区组只是(zhsh)局部控制的一种手段,在分析结果时只需剔除它的影响,而不需研究其效应。又由于总变异中是包括区组变异的,所以也予剔除,而以“处理+误差”代替。这里的“处理+误差”和单向分组资料的总变异同义,参见表9.11。表9.18中误差项的回归为极显著,F=(82.47-32.93)/2.74=18.08。由于误差项的回归系数和各处理的特点无关,故b=-7.6923对各处理的进行矫正。-7.6923的意义为:颖花数x每增加1(万/m2),第二十八页,共八十四页。 结实率y 将下降7.6923。 本试验的=105.60/28=3.7714(万/m2),一并(ybng)代入(951),即有方程: +7.6923( - 3.7714)上式可用来将各处理(chl)的结实率都矫正到颖花数为每 平方米3.7714万个时的结实率。如处理1为: =59.5+7.6923(4.455-3.7714)=64.76(%)处理(chl)2为: =63.5+7.6923(4.100-3.7714)=66.03(%)第二十九页,共八十四页。 处理(chl)14为: =73.0+7.6923(3.020-3.7714)=67.22(%) 这
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号