资源预览内容
第1页 / 共42页
第2页 / 共42页
第3页 / 共42页
第4页 / 共42页
第5页 / 共42页
第6页 / 共42页
第7页 / 共42页
第8页 / 共42页
第9页 / 共42页
第10页 / 共42页
亲,该文档总共42页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2016年5月生物统计学生物统计学第八章 单因素方差分析2016/5/242/428.1 方差分析的基本原理8.2 固定效应模型8.3 随机效应模型8.5 方差分析应具备的条件第八章第八章 单单单单因素方差分析因素方差分析2016/5/243/428.1 8.1 方差分析的基本原理方差分析的基本原理例 有5组数据要比较,若一对一对的比较,则共需比对 。假设每一对接受H0正确的概率为 =0.95,而且这些检验都是独立的,那么10对都接受的概率 ,因此 ,即全部比较中至少犯一次第I类错误的概率为0.40,这显然是不能接受的。方差分析(analysis of variance, ANOVA)是一种特殊情况下 的统计假设检验,是多组数据之间平均数差异的显著性检验。t 检验可以判断两组数据平均数间的差异显著性,而方差分析则可以同 时判断多组数据间的差异显著性。对多组数据若仍用前面介绍的t 检验进 行一对对的比较,会大大增加犯第I类错误的概率。8.1.1 方差分析的一般概念 方差分析是将各组数据放在一起,一次比较就对所有各组间是否有 差异作出判断。如果没有显著差异,则认为它们都是相同的;如发 现有差异,再进一步比较是哪组数据与其他数据不同。2016/5/244/428.1 8.1 方差分析的基本原理方差分析的基本原理方差分析中常用到的术语 1. 因素(factor) 可能影响试验结果,且在试验中被考查的原因或原因组合。有时也可称为因子。2. 水平(level) 因素在试验或观测中所处的状态。3. 主效应 反映一个因素各水平的平均响应之差异的一种度量。一个因子第i水平上所有数据的平均与全部数据的平均之差,称为该因子第i水平的主效应。4. 交互效应 由两个或多因素之间水平搭配而产生的差异的一种度量。5. 处理 实验中实施的因子水平的一个组合。2016/5/245/428.1 8.1 方差分析的基本原理方差分析的基本原理6. 固定因素该因素的水平可准确控制,且水平固定后,其效应也固定。7. 随机因素该因素的水平不能严格控制,或虽水平能控制,但其效应仍为随机变量。如动物的窝别(遗传因素的组合),农家肥的效果,等等。8. 误差 除了实验中所考虑的因素之外,其他原因所引起的实验结果的变化。它可分为系统误差和随机误差。系统误差:误差的组成部分,在对同一被测量的多次测试中,它保持不变或按某种规律变化。它的原因可为已知,也可为未知,但均应尽量消除。随机误差:误差的组成部分,在对同一被测量的多次测试中,它受偶然因素的影响而以不可预知的方式变化。它无法消除或修正。 方差分析中常用到的术语 2016/5/246/428.1 8.1 方差分析的基本原理方差分析的基本原理例8.1 调查5个不同小麦品系的株高,结果如下: 株 号品 系 IIIIIIIVV 164.664.567.871.869.2 265.365.366.372.168.2 364.864.467.170.069.8 466.063.766.869.168.3 565.863.968.571.067.5 和326.5322.0336.5354.0343.0 平均数65.364.467.370.868.6其中仅出现“品系”这样一个因素,故称为单因素。共有5个不同的 品系,称品系这一因素共有5个水平。5个品系可以认为是5个总体 ,表中数据是从5个总体中抽出的5个样本,通过比较来判断这5 个总体是否存在差异。 2016/5/247/42上述试验中只有一个因素,该因素有a个处理(treatment),这样的实验称 为单因素实验。从单因素实验的每一个处理所得到的结果都是一随机变量 。对于a个处理,各重复 次(或做 次观测)的单因素方差分析的一般表 示法见下表 单因素方差分析的典型数据 8.1 8.1 方差分析的基本原理方差分析的基本原理2016/5/248/428.1 8.1 方差分析的基本原理方差分析的基本原理表中数据的固定表示法和符号所表示的意义如下:因素的水平数:每一水平的重复数:第i水平的第j次观察值。1ia, 1jn, 第i水平所有观察值的和,第i水平均值,全部观察值的和,总平均值,第i水平上的子样方差。 2016/5/249/428.1 8.1 方差分析的基本原理方差分析的基本原理8.1.2 方差分析的直观理解方差分析是一种对对平均数所做的检验检验一种是检验两个平均数的差是否可以用随机误差解释,如果平均数的差是由随机误差造成的,那么平均数之间的差异不显著,抽出样本的两个总体具有相同的总体平均数。另一种检验方式是检验几个样本平均数的方差是否足够大。如果样本方差足够大,远远大于由随机误差所产生的方差,说明这几个样本平均数之间的离散程度很高,抽出的这几个样本的总体属于不同的总体,总体平均数不同。组间方差(不同样本平均数的方差)与随机误差的方差(组内方差)用F检验做比较,若拒绝零假设,则样本平均数的方差是显著的,它们可能抽自平均数不同的总体(样本间存在不同的处理效应)。2016/5/2410/428.1 8.1 方差分析的基本原理方差分析的基本原理8.1.3 不同处理效应与不同模型单因素方差分析(one-factor analysis of variance):指需要研究的因素 仅一个(或只有一组分组),该因素可有几个不同水平,分析的目标是看这 些水平的影响是否相同。在有随机误差的情况下,各水平应有重复。方差分析中常用线性统计模型(linear statistical model)描述观察值:, 其中 是在第 水平(处理)下的第 次观测值。 是对所有观测值的一个参数,称为总平均数(overall mean)。 是仅限于对 次处理的一个参数,称为第 次处理效应(treatment effect)(或称为 i 水平主效应)。是随机误差成分。要求模型中的 ,且是互相独立随机变量。注意这里要求各水平有共同的方差 。 方差分析的目的就是要检验各 的大小和有无2016/5/2411/428.1 8.1 方差分析的基本原理方差分析的基本原理8.1.3 不同处理效应与不同模型每种饲料的营养成份是固定 的,其效果也应是固定的。固定效应(fixed effect):由固定因素所引起的效应。固定因素(fixed factor):若因素的 个水平是经过特意选定的,则该因素称为固定因素。如温度、浓度、品种和方案等,因素的水平是人为的,所检验的是关于 的假设。 固定效应模型(fixed effect model): 处理固定因素所用的模型,简称固定模型(fixed model)。 例 用4种配合饲料饲养30日龄 的小鸡,10天后计算平均日增 重,得表中数据,问4种饲料的 效果是否相同?方差分析所得到的结论仅 适合于选定的那几个水平 ,并不能将结论扩展到未 加考虑的其它水平上。2016/5/2412/428.2 8.2 固定效固定效应应应应模型模型8.2.1 线性统计模型反映到线性模型中,就是 是处理平均数与总平均数的离差,它是个常量,可要求要检验 个处理效应的相等性,就要判断各 是否都等于0。若各 都等于 0,则各处理效应之间无差异。因此,零假设和备择假设分别为: : (至少有一个i)若接受 ,则不存在处理效应,每个观测值都是由总平均数加上随机误 差所构成。若拒绝 ,则存在处理效应,每个观测值是由总平均数、处理 效应和误差三个部分构成。 2016/5/2413/428.2 8.2 固定效固定效应应应应模型模型8.2.2 平方和与自由度的分解 方差分析的基本思想:将总的变差分解为构成总变差的各个部分之 和,然后对它们作统计检验。对于单因素实验,可以将总平方和(total sum of squares)做如下分解: 2016/5/2414/42对于每个固定的 ,8.2 8.2 固定效固定效应应应应模型模型8.2.2 平方和与自由度的分解因此上式表示度量全部数据变差的总平方和,可以分解为处理平均数与总平均数 之间离差的平方和(度量了处理之间的差异)及处理内部观测值与处理平均 数之间离差的平方和(度量了随机误差)两个部分。用符号表示为:2016/5/2415/428.2 8.2 固定效固定效应应应应模型模型8.2.2 平方和与自由度的分解:总平方和(total sum of squares),:处理平方和(treatment sum of squares),或处理间平方和(sum of squares between treatment),:误差平方和(error sum of squares),或处理内平方和(sum of squares within treatment),2016/5/2416/428.2 8.2 固定效固定效应应应应模型模型8.2.2 平方和与自由度的分解自由度可分解为:总自由度 ;A因素 ;误差项 。估计 :用 除以相应的自由度, 称为误差均方(error mean square);称为处理(间)均方:2016/5/2417/428.2 8.2 固定效固定效应应应应模型模型8.2.3 均方期望与统计量F是 的无偏估计量。误差均方反映了随机因素所造 成的方差的大小, 的期望是 ,即随机误差的方差,它是 随机误差的一个估计量。 2016/5/2418/428.2 8.2 固定效固定效应应应应模型模型用类似的方法,求 的数学期望 : ,所以有 乘积项的数学期望均为0。于是8.2.3 均方期望与统计量F2016/5/2419/42对于处理项来说,只有当零假设 : 成立时, 项等于0,这时 ,因此,用 与 比较,就可以反映出 的大小。 8.2 8.2 固定效固定效应应应应模型模型为常数,且 可知 =的期望除了有代表 随机误差的 外,还有 一项是各水平主效应的 平方和,即它代表了各 处理间差异的大小。 8.2.3 均方期望与统计量F2016/5/2420/42当时 ,则可以认为 与 相差不大,产生的变差是由随机误差造成的, 项接近于0,接受 假设,处理平均数之间的差异不显著。当 时, 显著高于 , 项不再为0,拒绝 假设,处理平均数之间的差异
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号