资源预览内容
第1页 / 共101页
第2页 / 共101页
第3页 / 共101页
第4页 / 共101页
第5页 / 共101页
第6页 / 共101页
第7页 / 共101页
第8页 / 共101页
第9页 / 共101页
第10页 / 共101页
亲,该文档总共101页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
用A、B、C、D4种不同N、P配比的营养液浇灌种植的小麦幼苗,30天后计算平均日增重,得到下表的数据,问4种营养液的效果是否相同?,第六章 方差分析,方差分析(Analysis of variance,ANOVA),又叫变量分析,是英国著名统计学家R . A . Fisher于20世纪提出的。它是用以检验两个或多个均数间差异的假设检验方法。,方差分析的 基本功能,t 检验可以判断两组数据平均数间的差异显著性,而方差分析既可以判断两组又可以判断多组数据平均数之间的差异显著性。,有人说,我们可以把多组数据化成n个两组数据(化整为零),用n次t检验来完成这个多组数据差异显著性的判断。,到底这种方法行不行,?,对多个处理进行平均数差异显著性检验时,采用t检验法的缺点:,1.检验过程烦琐。,试验包含个处理,t 检验: C42 6次,缺 点,缺 点,2.无统一的试验误差,误差估计的精确性和检验的灵敏性低。,t检验:C42 6次,需计算 6个标准误,误差估计不统一,误差估计精确性降低,缺 点,3.推断的可靠性低,检验时犯错误概率大。,t检验: C42 6次,H0的概率: 1-0.95,6次检验 相互独立,6次都接受的概率(0.95)60.735,犯错误的概率1-0.7350.265,犯错误的概率明显增加,例如我们用t检验的方法检验4个样本平均数之间的差异显著性,试验指标(experimental index): 为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。,试验因素( experimental factor): 试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。,因素水平(level of factor): 试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究5个温度对酶活力的影响,5个温度就是温度这个试验因素的5个水平。,试验处理(treatment): 事先设计好的实施在实验单位上的具体项目就叫试验处理。,试验单位( experimental unit ): 在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。,重复(repetition): 在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。,第一节 方差分析的基本原理,二、数学模型,一、方差分析的基本思想、目的和用途,三、平方和与df的分解,四、统计假设的显著性检验,五、多重比较,观 测 值 不 同 的 原 因,处理效应(treatment effect): 处理不同引起,试验误差:试验过程中偶然性 因素的干扰和测量误差所致。,方差:又叫均方,是标准差的平方,是表示变异的量。,在一个多处理试验中,可以得出一系列不同的观测值。,方差分析的基本思想,总 变 异,处 理 效 应,试 验 误 差,方差分析的目的,确定各种原因在总变异中所占的重要程度。,处理效应,试验误差,相差不大,说明试验处理对指标影响不大。,相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。,方差分析的用途,1. 用于多个样本平均数的比较,2. 分析多个因素间的交互作用,3. 回归方程的假设检验,4. 方差的同质性检验,1. 用于多个样本平均数的比较,2. 分析多个因素间的交互作用,二、数学模型,假定有k组观测数据,每组有n个观测值,则共有nk个观测值,用线性模型(linear model)来描述每一观测值:,xij = + i +ij,(i=1,2,3,k j=1,2,3,n), 总体平均数,i 处理效应,ij 试验误差,xij 是在第 i 次处理下的第 j 次观测值,要求ij 是相互独立的,且服从标准正态分布 N(0,2 ),二、数学模型,对于由样本估计的线性模型为:,xij =x + ti +eij,x 样本平均数,ti 样本处理效应,eij 试验误差,二、数学模型,根据的i不同假定,可将数学模型分为以下三种:,固定模型,随机模型,混合模型,二、数学模型,(一)固定模型(fixed model),指各个处理的效应值i 是固定值,各个的平均效应i i 是一个常量,且i 0。就是说除去随机误差以后每个处理所产生的效应是固定的。,二、数学模型,实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。,不同离子对木聚糖酶活性的影响(mg/ml),0.00 0.25 0.50 0.75 1.00 1.25,0.00 0.06 0.12 0.18 0.24 0.30,0.00 0.40 0.80 1.20 1.60 2.00,0.00 0.40 0.60 0.80 1.00 1.20,固定模型,Na+,K+,Cu2+,Mn2+,二、数学模型,在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相同的结果,方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平上。,固定模型,二、数学模型,(二)随机模型(random model),指各处理的效应值i 不是固定的数值,而是由随机因素所引起的效应。,这里i 是一个随机变量,是从期望均值为 0,方差为2 的标准正态总体中得到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。,二、数学模型,随机模型,美国的黑核桃品种对不同地理条件的适应情况,气候、水肥、土壤,无法人为控制,河南,北京,广州,江苏,新疆,二、数学模型,如果实验条件不能人为控制,那么这个样本对所属总体作出推断就属于随机模型。,随机模型,在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验重复时也很难得到相同的结果,方差分析所得到的结论,可以推广到这个因素的所有水平上,二、数学模型,固定模型与随机模型的比较,1. 两者在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。其平方和与df的分解公式没有区别,但在进行统计推断时假设检验构成的统计数是不同的。,2. 模型分析的侧重点也不完全相同,方差期望值也不一样,固定模型主要侧重于效应值的估计和比较,而随机模型则侧重效应方差的估计和检验,3. 对于单因素方差分析来说,两者并无多大区别,二、数学模型,(三)混合模型(mixed model),指多因素试验中既有固定因素又有随机因素时所用的模型,在实际应用中,固定模型应用最多,随机模型和混合模型相对较少,二、数学模型,三、平方和与df的分解,方差是离均差平方和除以自由度的商,要把一个试验的总变异依据变异来源分为相应的变异,首先要将总平方和和总df分解为各个变异来源的的相应部分。,方差分析的基本思想引起观测值出现变异分解为处理效应的变异和试验误差的变异。,三、平方和与df的分解,处理间平均数的差异是由处理效应引起的:,处理内的变异是由随机误差引起:,平 方 和,三、平方和与df的分解,根据线性可加模型,则有:,平 方 和,每一个处理n 个观测值离均差平方和累加:,0,?,三、平方和与df的分解,总平方和 SST,处理内或组内平方和 SSe,处理间或组间平方和 SSt,平 方 和,把k 个处理的离均差平方在累加,得,三、平方和与df的分解,平 方 和,总平方和处理间平方和 + 处理内平方和,SST SSt + SSe,SST , (x - x )2,1,n,1,k,SST x2 -C,令矫正数C ,则:,平 方 和,三、平方和与df的分解,三、平方和与df的分解,总平方和:SST x2 -C,处理内平方和:SSe = SST - SSt,平 方 和,自 由 度,三、平方和与df的分解,总自由度也可分解为处理间自由度和处理内自由度:,dfT = dft + dfe,总 df,处理间df,处理内df,三、平方和与df的分解,自由度,dfT = nk-1,dft = k-1,dfe = dfT - dft,= nk-1-(k-1) =nk-k = k(n-1),三、平方和与df的分解,根据各变异部分的平方和和自由度,可求得处理间方差( st2 )和处理内方差( se2 ):,用A、B、C、D4种不同N、P配比的营养液浇灌种植的小麦幼苗,30天后计算平均日增重,得到下表的数据,问4种营养液的效果是否相同?,k=4,n=4,nk=16,例,(1)平方和的计算:,11793.96,SST x2 -C, 31.92 + 24.02 + 24.62 - C,213.3,1/4(123.62 + 103.22 + + 111.42 ) - C,103.94,SSe SST - SSt,=213.3 - 103.94 =109.36,例,(2)自由度的计算:,dfT nk-1 =16-1=15,dft =k-1 = 4-1=3,dfe =k(n-1) =43=12,(3)方差计算:,四、统计假设的显著性检验,F 检验,确定各种原因(处理效应、试验误差)在总变异中所占的重要程度。,处理间的方差(st2 )可以作为处理效应方差的估计量 处理内的方差(se2 )可以作为试验误差差异的估计量,方差分析的目的:,二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影响不大。,如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处理对结果的影响很大,不可忽视。,处理效应,试验误差,F检验,从第三章我们已经知道,从一正态总体( ,2 )中随机抽取两个样本,其样本方差s12 与s22 的比值为F :,其F 分布曲线随着df1 和df2 的变化而变化。由于F 值表是一尾的( F值的区间0,+) ),一般将大方差作分子,小方差作分母,使F 值大于1,因此,表上df1 的代表大方差自由度, df2 代表小方差自由度。,用处理效应的方差(st2 )和实验误差的方差(se2 )比较时,我们所做的无效假设是假设处理效应的变量和实验误差的变量是来自同一正态总体的两个样本,因此处理效应的方差(st2 )和实验误差的方差(se2 )的比值就是F 值,即,=,方差分析,F检验,在进行不同处理差异显著性的F 检验时,一般是把处理间方差作为分子,称为大方差,误差方差作为分母,称为小方差。,无效假设是把各个处理的变量假设来自同一总体,即处理间方差不存在处理效应,只有误差的影响,因而处理间的样本方差t2 与误差的样本方差e2 相等:,Ho :t2 e2,HA :t2 e2,F检验,与t 检验相类似,F 检验是把计算所得的F 值与临界F值比较,判断由误差造成的概率大小,最后作出统计推断。,无效假设是否成立,要看计算的F 值在F 分布中出现的概率。,F F0.05 P0.05,处理间差异不显著,F F0.05 P0.05,处理间差异显著,F F0.01 P0.01,处理间差异极显著,否定Ho,否定Ho,接受Ho,我们确定显著标准水平后,从F 值表中查出在dft和dfe下的F值,F检验,上例中,4个不同营养液处理小麦的增重的F值为:,dft 3 dfe 12, 查F值表得F0.05 3.49, F0.015.95,不同营养液处理的小麦的增重量差异是显著的,例,不同营养液处理的小麦的增重量的方差分析表,例,如果处理间差异显著,在计算出的F 值右上角标上“*”号;如果处理间差异极显著,在F 值的右上角标上“*”号。,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号