资源预览内容
第1页 / 共56页
第2页 / 共56页
第3页 / 共56页
第4页 / 共56页
第5页 / 共56页
第6页 / 共56页
第7页 / 共56页
第8页 / 共56页
第9页 / 共56页
第10页 / 共56页
亲,该文档总共56页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第8章 均数比较,蔡德利 黑龙江八一农垦大学资源与环境系 TsaiDelisohu.com 2004.10.20,本章主要内容,概述 单组资料的均数比较 Ttest过程 两组资料的均数比较 成组数据 成对数据 非参数检验 两独立样本差别的秩和检验 成对数据的秩和检验,概述,统计回顾: t检验是判断两个样本均数或样本均数和总体均数的差别有无统计学意义的假设检验方法。 使用范围 一般来自正态总体 方差齐 分类: 单样本t检验 两样本t检验(配对t检验、成组t检验),单组资料的均数比较,样本均数和总体均数比较的t检验 形式(单变量分析): 样本均数和总体均数差别的比较可以直接进行比较; 也可以看成每个测量值与总体均数差值的均数和0的比较。 可用前面介绍的三个(univariate、means、summary)执行描述性统计分析功能的过程来完成。,单组资料的均数比较,Means过程实现单变量分布位置t检验,只需在proc means语句后添加t和probt两个选项; SAS给出样本均数与0比较的t检验值和t分布曲线下该t值对应的双侧尾部面积。 univariate过程在默认状态下即可给出单变量分布位置的t检验结果。,单组资料的均数比较,示例08001(李春喜,王文林等编著生物统计学48页): 某鱼塘水中含氧量,多年平均为4.5ml/L,现在该鱼塘设10个点采集水样,测定水的含氧量分别为:4.33, 4.62, 3.89, 4.14, 4.78, 4.64, 4.52, 4.55, 4.48, 4.26ml/L,试检验该次抽样测定水中含氧量与多年平均值有无显著性差异。 分析: 样本容量n30(小样本),总体方差 未知时,要检验样本平均数 与总体平均数 的差异显著性,必须使用t检验法。 假设 ,即本次测定的水中含氧量与多年平均值没有显著性差异。,单组资料的均数比较,/* SasProg08001.SAS */ data D08001; input x; d=x-4.5; cards; 4.33 4.62 3.89 4.14 4.78 4.64 4.52 4.55 4.48 4.26 ; proc means n mean std stderr t probt; var d; run;,Means过程只能对样本均数和0的差别进行比较,因此必须先在数据步对数据作适当的处理,也就是先将数据转化为原始数值与某已知数值(总体均数)的差,再对此差值进行统计分析。,单组资料的均数比较,运算结果: Mean = -0.0790000 Std Dev = 0.2669769 Std Error = 0.0844255 t Value = 0.94 Pr |t| = 0.3738 p值:该t值对应的双侧尾部面积。 推断: 由于p值远大于0.05,所以无法拒绝H0,认为此次抽样测定的鱼塘水中含氧量与多年平均含氧量没有显著差别,样本均值与总体均值相差-0.079ml/L属于随机误差。,单组资料的均数比较,示例08002: 通过以往大规模调查,已知某地婴儿出生体重均数为3.30kg,今测得35名难产儿出生体重如下,请问该地难产儿出生体重与一般婴儿出生体重是否不同? 3.83 3.28 4.05 3.62 3.49 2.86 3.91 4.24 3.20 4.30 3.39 3.54 4.16 2.79 3.25 3.14 3.44 3.11 3.14 3.16 3.80 3.87 3.29 3.23 3.18 3.63 3.48 3.48 3.87 3.50 3.53 2.95 3.72 3.52 3.36,单组资料的均数比较,/* SasProg08002.SAS */ data D08002; input x; cards; 3.83 3.28 4.05 3.62 3.49 2.86 3.91 4.24 3.20 4.30 3.39 3.54 4.16 2.79 3.25 3.14 3.44 3.11 3.14 3.16 3.80 3.87 3.29 3.23 3.18 3.63 3.48 3.48 3.87 3.50 3.53 2.95 3.72 3.52 3.36 ; proc univariate mu0=3.30 alpha=0.05; var x; histogram x/normal cbarline=green cfill=red barwidth=8 midpoints=2.75 to 4.35 by 0.2; run;,Proc univariate语句后选项mu0=3.30用来指定univariate过程对样本进行分布位置的假设检验时的位置参数,以便进行样本均数和指定值之间差别的假设检验;alpha=0.05用来指定进行各种总体参数的估计时可信区间的置信水平。,单组资料的均数比较,结果 Tests for Location: Mu0=3.3 Test -Statistic- -p Value- Students t t 3.048499 Pr |t| 0.0044 Sign M 4.5 Pr = |M| 0.1755 Signed Rank S 166 Pr = |S| 0.0048 Tests for Location是关于样本分布位置的假设检验,这是我们此处关心的内容。 大家可以看到,除一般的t检验外,univariate过程还给出了非参数检验方法的检验结果(符号检验和符号秩和检验)。,Ttest过程,Ttest过程 Ttest过程可以进行单组样本、成组资料、配对资料均数比较的t检验。 格式: Proc Ttest class variable; paired variables; by variables; var variables; freq variable; weight variable; Run;,Ttest过程,Ttest过程的选项,Ttest过程,Paired语句 用来指定配对t检验中要进行比较的变量对。 变量之间可用星号(*)或冒号(:)连接。 以星号连接的变量列表表示星号左侧的每一个变量将与星号右侧的每一个变量组成变量对。 以冒号连接的变量列表表示其左侧的变量只与右侧相应排列位置上的变量组成变量对。冒号连接的两个变量列表必须包含相同个数的变量。 比如: Paired a*b 组成变量对a-b Paired (a b)*(c d) 组成变量对a-c a-d b-c b-d Paired (a1-a2):(b1-b2) 组成变量对a1-b1 a2-b2,Ttest过程,示例08003:用Ttest过程分析示例08001数据。 /* SasProg08003.SAS */ data D08003; input x; cards; 4.33 4.62 3.89 4.14 4.78 4.64 4.52 4.55 4.48 4.26 ; proc ttest h0=4.5 alpha=0.05; var x; run;,Ttest过程,结果(The TTEST Procedure) Statistics T-Tests,Ttest过程,示例08004:用Ttest过程分析示例08002数据。 /* SasProg08004.SAS */ data D08004; input x; cards; 3.83 3.28 4.05 3.62 3.49 2.86 3.91 4.24 3.20 4.30 3.39 3.54 4.16 2.79 3.25 3.14 3.44 3.11 3.14 3.16 3.80 3.87 3.29 3.23 3.18 3.63 3.48 3.48 3.87 3.50 3.53 2.95 3.72 3.52 3.36 ; proc ttest h0=3.30 alpha=0.05; var x; run;,两组资料的均数比较,两个变量均数比较的假设测验 两个变量的均数显著性比较,其样本的来源有两种: 完全随机取得的,也称为成组数据。特点是两个样本的各观测都是从各自的总体中抽取的,两个样本的观测之间没有任何联系,即两抽样样本彼此独立; 配对法取得的,也称为成对数据或配对数据,要求两样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致。,两组资料的均数比较,成组数据的均数比较 成组资料的t检验过程要涉及对分组变量的处理。 Ttest过程具有直接进行近似t检验的功能,Satterthwaite法为默认方法,可选Cochran-Cox法进行近似t检验。,两组资料的均数比较,独立组样本t检验要求数据符合以下3个条件: 观察值之间是独立的; 每组观察值来自正态分布的总体; 两个独立组的方差相等。 当样本量较小(任何一组样本小于60)且两样本来自于正态总体时,应根据两总体方差是否相等而采取不同的分析方法。 当两总体方差相等(方差齐)时,可采用通常的t检验法(合并方差法)进行分析; 当两总体方差不等(方差不齐)时,可采取数据变换、近似t检验(即t检验)或非参数检验的方法。,两组资料的均数比较,示例08005(西北农学院、华南农业大学主编农业化学研究法121页): 水稻浅施硫铵、浅施硝铵两个处理,完全随机排列进行试验,试比较两种施氮肥方法的效果。 浅施硫铵5次重复的亩产量(kg):247.65, 255.85, 261.20, 257.40, 255.40 浅施硝铵5次重复的亩产量(kg):239.50, 240.60, 247.50, 232.50, 237.50,两组资料的均数比较,/* SasProg08005.SAS */ data D08005; input group x; cards; 1 247.65 1 255.85 1 261.20 1 257.40 1 255.40 2 239.50 2 240.60 2 247.50 2 232.50 2 237.50 ;,proc ttest h0=0 alpha=0.05 cochran ci=none; class group; var x; run; “H0=0”用来指定要与两组均数之差进行比较的数值。 大多数情况下,问题是两组均数是否相同,即两均数之差是否为0,因此,多数情况下H0=0,这也是默认值。 如果需要,也可以将H0=设置为其他值。 Ci=none指定ttest过程不输出标准差的置信区间。,两组资料的均数比较,结果 第1组和第2组均数差值的均数为15.98,置信区间( 8.4006,23.559)。由于置信区间不包括0,可看出两组均数不相等。 T-Tests给出t检验分析结果,分别为合并方差法t检验、Satterthwaite法近似t检验、Cochran-Cox法近似t检验。第1种方法用于方差齐(Equal)时的检验,后2种用于方差不齐(Unequal)时的检验。 Equality of Variances给出方差齐性检验(双侧F检验)结果,F=1.21,p=0.85910.05,所以两组数据总体方差相等,因此,应依据合差方差法来进行t检验。 本例结论t=4.86,p=0.00130.05,所以拒绝原假设(均数相等),两处理间差异显著。,两组资料的均数比较,样本数目不等资料的均数比较 成组数据的均数比较也可以处理各组样本数目不等的资料。 比如上例去掉浅施硝铵的第5个数据。 从分析结果看,两种处理的均数仍存在显著差异。,两组资料的均数比较,示例08006:成绩分析 2001年农业化学成绩(Mylib.Ac2001),分析男生和女生成绩是否有显著性差异。 程序: proc ttest data=mylib.ac2001 cochran; var total; class sex; run; 结果:男生26名,女生16名,平均分差8.63。方
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号