资源预览内容
第1页 / 共89页
第2页 / 共89页
第3页 / 共89页
第4页 / 共89页
第5页 / 共89页
第6页 / 共89页
第7页 / 共89页
第8页 / 共89页
第9页 / 共89页
第10页 / 共89页
亲,该文档总共89页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第三章第三章 方差分析方差分析2011-09-27教学目的与要求l了解方差分析的概念和作用;l掌握方差分析的基本原理和步骤;l掌握单项分组资料的方差分析;l掌握两向分组资料的方差分析。教学内容第一节 方差分析的基本原理第二节 单向分组资料方差分 析第三节 两向分组资料方差分 析方差分析的概念方差分析( AnalysisOfVariance, ANOVA)又称变异数分 析或F检验,比较组间方差是否可以用组内方差来进行解释,从而判断若干组 样本是否来自同一总体。优:可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。缺:只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。方差分析优缺点多重比 较方差分析的意义其目的是推断两组或多组资 料的总体均数是否相同,检验 两个或多个样本均数的差异是 否有统计学意义。 教学内容第一节 方差分析的基本原理 一、方差分析的基本原理 二、平方和与自由度的分解 三、多重比较计算观察值的组间方差和组内 方差,并计算两者的比值,如果该 比值比较小,说明组间方差与组内 方差比较接近,组间方差可以用组 内方差来解释,从而说明组间差异 不存在。 一、方差分析的基本原理二、平方和与自由度的分解假设某单因素试验有k个 处理,每个处理有n个观察值,共 有nk 个观测值。这类试验资料的 数据模式如表3-2所示。处理1 2 i k观察值x11x21xi1xk1x12x22xi2xk2 x1jx2jxijxkj x1nx2nxinxkn总和Ti.T1.T2. Ti. Tk. T= xij平均表3-2 k个处理每个处理有n个观测值的数据模式二、平方和与自由度的分解方差分析的基本思想, 就是将总变差分解为各构成 部分之和,然后对它们作统 计检验。即: 二、平方和与自由度的分解方差与标准差都可以用来度量样本 的变异程度。在方差分析中是用样本方 差即均方(mean squares)来度量资料的变异程度的。表3-2中全部观察值的总变异可以用总均方来度量,处理间变异和处理内 变异分别用处理间均方和处理内均方来 度量。 总平方和的分解在表3-2中,反映全部观察值总变异的总平方和是各观察值与总平均数的离均差 平方和,记为SST。即因为平方和与自由度的分解平方和与自由度的分解由于平方和与自由度的分解 其中称为处理间平方和,记为SSt,即而称为处理内平方和或误差平方和,记为SSe,即三种平方和的简便计算公式如下:其中C=T2/kn 称为矫正数。(二)总自由度的分解在计算总平方和时,资料中的各个观察值要受 这一条件约束,总自由度等 于资料中观察值的总个数减一,即nk-1。 总自由度记为dfT,则 dfT =nk-1 。在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减一,即k-1。 处理间自由度记为dft ,则dft=k-1。 在计算处理内平方和时,要受k个条件的约束,即 ,i=1,2,.k。故处理内自由度为资料中观察值的总个数减a,即nk-k。 处理内自由度记为dfe,则dfe=nk-k=k(n-1)。 因为 nk-1=(k-1)+(nk-k)=(k-1)+k(n-1) 所以 dfT= dft+ dfe综合以上各式得:平方和与自由度的分解它们的自由度分别为nk 1, k1和k(n1),即自由度也 作了相应分解:nk 1 = k 1 + k(n 1) dfTdftdfe各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为:MST(或ST2 )、 MSt(或St2 )和MSe(或Se2 ),即MST= ST2 =SST/dfT;MSt= St2 =SSt/dft;MSe= Se2 =SSe/dfe建立假设H0:各组平均数相等HA:各组平均数不全相等 计算统计量“F组间均方组内均方” 在计算组间均方时,使用自由度为(k-1),计算 组内均方时,使用自由度为 k(n-1)。 查表、推断F满足第一自由度为(k-1),第二自由度为k(n -1) 的F分布。查表。若F值大于0.05临界值,则拒 绝原假设,认为各组平均数存在显著差异。 结论方差检验的步骤【例3.1】 设有A、B、C、D、E 5个大豆品种(k 5),其中E为对照,进行大区比较试验,成熟后分别在5 块地测产量,每块地随机抽取4个样点(n4),每点产 量(kg)列于表3-3,试做方差分析。 表3-3 大豆品种比较试验结果 单位:kg/小区品种取样样点总和Ti.平均1234A232124218922.25B211918187619.00 C222322208721.75 D192019187619.00E151616176416.00T=392 =19.6这是一个单因素试验,处理数k =5,重 复数n=4。各项平方和与自由度计算如下:矫正数 C=T2/nk=3922/(54)=7683.2 总平方和处理间平方和 =1/4(892+762+872762+642)-C=101.3 处理内平方和 SS e=SST -SSt=122.8-101.3=21.5 总自由度 dfT =nk-1=54-1=19 处理间自由度 dft=k-1=5-1=4 处理内自由度 dfe =dfTdft=19-4=15方差计算如下: St2=MSt=SSt /dft=101.3/4=25.32Se2= MSe=SSe /dfe=21.5/15=1.43表3-4 表3-3资料方差分析表变差 来源SSdfs2FF0.05F0.01品种间101.3425.3217.71*3.064.89品种内21.5151.43总 和122.819F检验是整体检验。F 值显著或极显著,否定了无效假设H0 ,只能表明试验的总变异主要来源于处理间的变异或因素水平变化引起的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。 因而,有必要进行两两处理平均数间的比较,以 具体判断两两处理平均数间的差异显著性。三、多重比较三、多重比较统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。 最小显著差数法(LSD法) 最小显著极差法(LSR法)此法的基本作法是: 在F检验(极)显著的前提下,先计算出显著水平为的最小显著差数 ,然后将任意两个处理平均数之差的绝对值 与其比较。( (LSDLSD法,法,least significant differenceleast significant difference) )(一)最小显著差数法LSD LSD 法实质是法实质是t t 检验法检验法LSD法所有比较仅需计算一个LSD,应用很方 便。但由于又回到了多次重复使用t检验的方 法,会大大增加犯第一类错误的概率。为了 克服这一缺点,人们提出了多重范围检验的 思想:即把平均数按大小排列后,对离得远 的平均数采用较大的临界值LSR。这一类的方 法主要有q法和Duncan法。现介绍如下:LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)p的不同而采用不同的检验尺度,以克服LSD法的不足。在显著水平上依秩次距p的不同而采用的不同的检验尺度叫做 最小显著极差LSR。( (LSRLSR法法 ,Least significant ranges)Least significant ranges)(二)最小显著极差法LSR法克服了LSD法的不足,但检验的工作量有所增加。新复极差法(SSR法,Duncan法)q检验法(q-test,即spss中的SNK法)Duncan检验1把需比较的k个平均数从大到小排 好: 2求出各对差值,并列成表:3求临界值:4对差值表采用适当的LSR进行比 较。 表 k个均值间的差值表 p2多重比较临界值表 pSSR0.05LSR0.05SSR0.01LSR0.012SSR0.05(2,df)LSR2,0.05SSR0.01(2,df)LSR2,0.013SSR0.05(3,df)LSR3,0.05SSR0.01(3,df)LSR3,0.01kSSR0.05(k,df)LSRk,0.05SSR0.01(k,df)LSRk,0.01查表3查表3Duncan检验差值表中每条对角线上的k 值是相同的,可使用同一个临 界值R。 差值大于LSR0.05,标以“*” ; 大于 LSR0.01则标“*”。 Duncan检验品系号ACBDE平均数22.2521.7519.0019.0016.00顺序号12345例3.1表3-5 表3-3资料多重比较结果EDBCA6.25 *3.25 *3.25 *0.5C5.75 *2.75 *2.75 *B3 *0D3*p2多重比较临界值表 dfpSSR0.05LSR0.05SSR0.01LSR0.011523.011.814.172.5033.161.904.372.6243.251.954.502.7053.311.994.582.75查表3查表3对于【例3.1】,多重比较结果用字母标记 见表3-6。表3-6 大豆品种比较试验的多重比较(SSR法 )品种差异显著性 0.050.01 A22.25aA C21.75aA B19.00bB D19.00bB E16.00cC教学内容第一节 方差分析的基本原理第二节 单向分组资料方差分 析第三节 两向分组资料方差分 析第二节 单向分组资料方差分析 一、组内观测次数相等的方差分析 二、组内观测次数不相等的方差分析第二节 单向分组资料方差分析方差分析,根据所研究试验因素的多少 ,可分为单因素、两因素和多因素试验资料 的方差分析。 单因素试验资料的方差分析是其中最简 单的一种,目的在于正确判断试验因素各处 理的优劣。 根据组内观测次数是否相等,单因素 试验资料的方差分析,又分为组内观测次 数相等和组内观测次数不等两种情况。一、组内观测次数相等的方差分析【例】 测定东北、内蒙古、 河北、安徽、贵州5个地区黄鼬冬 季针毛的长度(mm),每个地区随 机抽取4个样本,测定结果见表3-7。试比较各地区黄鼬针毛长度差 异显著性。表3-7 不同地区黄鼬冬季针毛长度(mm)地 区东东北内蒙古河北安徽贵贵州合计132.029.225.523.322.3232.827.426.125.122.5331.226.325.825.122.9 430.426.726.725.523.7 x126.4109.6104.199.091.4530.5 n4444420 31.6027.4026.0324.7522.8526.53 x23997.443007.982709.992453.162089.64 14258.21 1. 计算各项平方和与自由度C=T2/kn=530.52/(54)=14071.51SSe=SST SSt=186.7-173.71=12.99dfT=kn-1=54-1=19dft=k-1=5-1=4dfe=dfT-dft=19-4=152. 列出方差分析表,进行F检验,见表3-8。表3-8 不同地区黄鼬冬季针毛长度方差分析表 变变异来源平方和自由度均 方F 值值F0.05F0.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号