资源预览内容
第1页 / 共119页
第2页 / 共119页
第3页 / 共119页
第4页 / 共119页
第5页 / 共119页
第6页 / 共119页
第7页 / 共119页
第8页 / 共119页
第9页 / 共119页
第10页 / 共119页
亲,该文档总共119页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第六章 方差分析*1主要内容 第一节 方差分析简介 第二节 单因素方差分析 第三节 多因素方差分析 第四节 协方差分析Date2第一节 方差分析简介方差分析是英国统计学家R. A. Fisher( 1890-1962)在进行试验设计时为解释试验数 据而首先引入的。方差分析是一种通过分析 样本资料各项差异的来源以检验三个以上总 体平均数是否相等的统计方法。目前,方差 分析方法在各个领域都得到了广泛应用。方差分析的核心就是方差可分解。即将 总变异分解为由随机误差造成的变异(组内 SS)与由均数差异造成的变异(组间SS)两 个部分。如果后者大于前者,且具有统计学 意义,我们将拒绝零假设,即认为总体中均 数间存在差异。 Date3一、方差分析的作用 在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素 是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本 下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些 因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、 气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们 能够掌握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、 关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还 要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪 个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最 优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的 成本和收益,并选择最合理的种植方案,主动的在农作物种植过程中对各 种影响因素加以准确控制,进而获得最理想的效果。Date4二、相关概念 1、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为 两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品种 的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机因素 或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的是实验 过程中的抽样误差。2、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不 同水平。如甲品种、乙品种;10公斤化肥、20公斤化肥、30公斤化肥等。3、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物 的产量等。方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是 对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其 不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。Date5三、方差分析的原理方差分析认为,如果控制变量的不同水平对观测变量产生了显著 影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反 之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观 测变量值的变动就不明显,其变动可以归结为随机变量影响造成的。建立在观测变量各总体服从正态分布和同方差的假设之上,方差 分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在 显著差异的推断问题了。综上所述,方差分析从对观测变量的方差分解入手,通过推断控 制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量 是否给观测变量带来了显著影响,进而再对控制变量各个水平对观测 变量影响的程度进行剖析。根据控制变量的个数可将方差分析分为单因素方差分析、多因素 方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单 因变量方差分析)和多元方差分析(多因变量方差分析)。Date6四、方差分析过程w1、One-Way过程:单因素简单方差分析 过程。在Compare Means菜单项中,可 以进行单因素方差分析、均值多重比较和 相对比较。 w2、General Linear Model(简称GLM) 过程:GLM过程由Analyze菜单直接调用 。这些过程可以完成简单的多因素方差分 析和协方差分析,不但可以分析各因素的 主效应,还可以分析各因素间的交互效应 。Date7n在General Linear Model菜单项下有 四项:nUnivariate:提供一个因变量与一个或多个因 素变量的方差分析。nMultivariate:可进行多因变量的多因素分析nRepeated Measure:可进行重复测量方差分析nVariance Component:可进行方差成分分析。 通过计算方差估计值,可以帮助我们分析如何 减小方差。Date8第二节 单因素方差分析一、简介单因素方差分析是检验由 单一因素影响的多组样本某因 变量的均值是否有显著差异的 问题。如果各组之间有显著差 异,说明这个因素(分类变量 )对因变量是有显著影响的, 因素的不同水平会影响到因变 量的取值。 二、完全窗口分析按AnalyzeCompared Means One-Way Anova顺序 单击。打开 One-Way Anova主 对话框,如图6-1。Date9选入因变 量,可有 多个变量选入分组变量, 必须满足只取有 限个水平的条件 。图6-1 One-Way Anova主对话框见图 6-2见图 6-3见图 6-4Date10(1)Contrasts选项Contrasts选项用来实现先验对比检验和趋势检验。如果进行趋势检验,则应选择Polynomial选项,然后 在后面的下拉框中选择趋势检验的方法。其中Linear表示 线性趋势检验;Quadratic表示进行二次多项式检验; Cubic表示进行三次多项式检验,4th和5th表示进行四次 和五次多项式检验。如果进行先验对比检验,则应在Coefficients后依次 输入系数ci,并确保ci0。应注意系数输入的顺序,它 将分别与控制变量的水平值相对应。Date11图62 Contrasts对话框对组间平方和进行 多项式分解,并在 其后的参数框中选 定阶数。 如一阶: Linear,二阶: Quadratic,三阶: Cubic.最高可达 五阶输入多项式各组均值的系数,输入一个系数单击Add按钮,系 数进入下面方框,依次输入各组均值的系数。 如果多项式中只包括第一与第四组的均值的系数,必须把第二 、第三个系数输入为0。 如果只包括第一与第二组的均值,则第三、第四个可不输入。 可同时建多个多项式,输入一组后按Next按钮;如果要修改则 按Previous按钮,修改后按Change按钮,删除按Remove按钮。显示每组系 数的总和。Date12(2)Post Hoc选项Post Hoc选项用来实现多重比较检验。提供了18种多重比较检验的方法。其中Equal Variances Assumed框中的方法适用于各水平方差齐性 的情况。在方差分析中,由于其前提所限,应用中多采用 Equal Variances Assumed框中的方法。多重比较检验 中,SPSS默认的显著性水平为0.05,可以根据实际情况 修改Significance level后面的数值以进行调整。Date13图63 Post Hoc对话框在此对话框中选择进行多重比较的方法1.用t检验完成组间成对均值的比较,对多重比较错误率不进行调整 2.同上,但通过设置每个检验的误差率来控制整个误差率 3.用t检验完成多重配对比较,为多重比较调整显著值,但比2的界限要小 4.对所有可能的组合进行同步进入的均值配对比较 5.用F检验进行多重比较 6.在Studentized Range分布下进行多重比较 7.用Studentized Range分布进行所有各组均值间的配对比 较 8.用Studentized Range统计量进行所有组间均值的配对比 较, 用所有配对比较集合的误差率作为试验误差率 9.同8,但其临界值是TUKEY和S-N-K的相应值的平均值 10.进行配对比较时,使用的逐步顺序与Student-Newman-Keuls检验的顺序一样,但并不是给每个检验设定一个误 差率,而是给所有检验的误差率设定一个临界值 11.用Studentized最大系数进行比较检验和范围检验 12.用Studentized最大系数进行配对比较检验 13.用Studentized最大系数进行比较检验,使用贝叶斯逼近 14.用t检验进行配对比较1.用t检验进行配对比较, 2.用Studentized 最大系数进行配对比较检验 3.同上,这种方法有时比较自由 4.用Studentized Range统计量进行配对比较检验规定显著性水平,默认为0.05Date14(3)Option选项Option选项用来对方差分析的前提条件进行检 验,并可输出其他相关统计量和对缺失数据进行处理 。Homogeneity of variance test选项实现方差 齐性检验;Descriptive选项输出观测变量的基本描述 统计量;Brown-Forsythe、Welch选项可计算其统 计量以检验各组均值的相等性,当方差齐性不成立时 应选择使用这两个统计量而不是F统计量。Means Plot选项输出各水平下观测变量均值的折线图; Missing Values框中提供了两种缺失数据的处理方式 。Date15图 64 Options对话框 选择缺失值的处置方式: 在检验变量中含有缺失值的观测将不被计算 在任何一个变量中含有缺失值的观测都将不被计算规定输出的统计量: 输出描述统计量,包括观测量数 目,均值,最小值,最大值,标准差,标 准误差,各组中每个因变量均值的 95%的置信区间 用Levene检验进行方差一致性 检验输 出 均 数 分 布 图三、例题分析例1 06-1某灯泡厂用四种不同配料方案制成的灯丝, 生产了四批灯泡。每批灯泡中随机抽取若干个灯泡测其 使用寿命(单位:小时),数据如表6-1,求四种灯丝的灯 泡的使用寿命有无显著差异。Date16表6-1 灯泡使用寿命在该例中,设灯泡的使用寿命为因变量, 灯丝的配料为因子,四种配料方案为四水平 ,为单因子四水平的实验。(数据文件:06-1 灯泡寿命.sav)灯泡 灯丝丝12345678甲1600161016501680170017001780乙15001640140017001750 丙16401550160016201640160017401800 丁151015201530157016401680Date171、不使用选择项操作步骤1)定义两个变量:Filament变量,取值1、2、3、4分别代表甲、乙、丙、丁 ,标签为“灯丝”Hours变量其值为灯泡的使用寿命,标签为“灯泡使用寿 命”2)按AnalyzeCompared Means One-Way Anova顺序打 开“单因素分析”主对话框。3)从源变量框中选取hours进入Dependent List框中;选取 filament变量进入Factor框中,单击“OK”运行。4)输出结果及分析Date18表6-2 灯泡使用寿命的单因素方差分析结果表6-2说明: 第一列:方差来源;第二列:离差平方和; 第三列:自由度; 第四列:均方; 第五列:F值; 第六列:F统计量的P值。2、使用选择项操作步骤1)定义变量和选取变量同1(第1-3步)的操作步骤Date192)在主对话框中单击“Contrast”,在Contrast对话框中选择 多项式比较,选择一次多项式比较各组均值,共指定两组 多项式系数:系数依次为1、-1、-1、1,这是检验灯丝对灯泡使用寿命 的影响及甲、丁效应和与乙、丙效应和是否有显著差异系数依次为1、-1、1、-1,这是检验灯丝对灯泡使用寿命 的影响及甲、丙效应和与乙、丁效应和是否有显著差异3)打开Post Hoc Multiple Comparisons 对话框,选择多重比 较:在Equal Variance Assumed栏中选择 LSD和 Dunca
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号