资源预览内容
第1页 / 共102页
第2页 / 共102页
第3页 / 共102页
第4页 / 共102页
第5页 / 共102页
第6页 / 共102页
第7页 / 共102页
第8页 / 共102页
第9页 / 共102页
第10页 / 共102页
亲,该文档总共102页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第十章 基于秩次的非参数检验,本节要点,重点: 非参数检验的概念、适用条件与优缺点 完全随机设计的两组独立样本的秩和检验难点: 何时采用非参数检验 有序变量资料的秩和检验,统计方法回顾(1),t检验,方差分析,方差不齐?,血清铁 尿素氮发铅含量 生存时间 上网时间,镇痛效果 (有效,无效)检测结果 (阳性,阴性)肝炎类型 (甲,乙,丙,丁,戊),满意度 (满意,一般,不满意) 疗效 (很好,好,一般,差),检验 确切概率法,构成百分比(%),等级资料?,统计方法回顾(2),以下资料如何进行统计推断呢?,不服从正态分布的资料 多组资料满足正态分布但方差不齐 等级资料,非参数检验方法!,非参数检验,非参数检验:对总体分布不作严格规定,不依赖于总体分布类型。 适合于处理: 总体分布不易确定或未知; 分布非正态但无合适转换方法; 等级资料等。,参数检验:总体分布类型已知,对未知参数进行推断。 例如: 均数的区间估计。 t检验/Z检验,F检验。,参数检验,假设检验,统计推断方法,秩和检验 (Rank Sum Test),表1 高中生与大学生的每周平均上网时间比较 (小时/周),高中生,大学生,秩和检验的基本思想,1,4,10,2,3,11,13,12,14,15,5,6,7,8,9,16,假设两总体分布相同(H0),可认为两样本是从同一总体中抽取的随机样本;将二者混合后由小到大编秩,然后分别计算两样本组的平均秩和 与 , 与 应大致相等,其中的差别是由于随机抽样引起;如果按上述方法计算的两样本平均秩和 和 差别很大,我们就有理由认为H0不成立。,秩和检验的基本思想,完全随机化设计两独立样本的秩和检验 (Wilcoxon法),两组连续变量资料的秩和检验两组有序变量资料的秩和检验,Frank Wilcoxon (1892-1965),两组连续变量资料的秩和检验,目的:推断两样本分别代表的总体分布位置是否不同。区别于两独立样本的t检验。,例1 请分析高中生和大学生的每周上网时间是否有差别?,表1 高中生与大学生的每周平均上网时间比较(小时/周),1. 建立检验假设,确定检验水准:H0:两个总体的分布位置相同,即高中生和大学生的每周平均上网时间的总体分布相同;H1:两个总体的分布位置不同,即高中生和大学生的每周平均上网时间的总体分布不同。 =0.05,秩和检验的步骤,秩和检验的步骤,编秩将两组数据由小到大统一编秩,编秩时如遇有相同数据,取平均秩次。 3. 求秩和两组秩次分别相加。 4. 确定统计量若两组例数相等,则任取一组的秩和为统计量,若两组例数不等,则以样本例数较小者对应的秩和为统计量。,表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),表1 高中生与大学生的每周平均上网时间比较(小时/周),T=54.5,表1 高中生与大学生的每周平均上网时间比较(小时/周),秩和检验的步骤,5. 查表确定P值,作出推断结论。(附表10),TL,TU,附表10 T界值表(两样本比较的秩和检验用) 单侧 双侧 1行 P=0.05 P=0.10 2行 P=0.025 P=0.05 3行 P=0.01 P=0.02 4行 P=0.005 P=0.01,T=54.5,刚好在T界值表对应的界值范围内,因此P0.05,暂不拒绝H0,无统计学意义,故可认为高中生和大学生的每周平均上网时间的分布相同。,49-87,说明,如果n1或n2-n1超出了T界值表的范围,可用正态近似检验。,正态近似法,当n110或(n2-n1)10时,若Z值超过标准正态分布的临界值,则拒绝H0;若出现相持较多,则用下式进行校正,出现相同的数据,两组有序变量资料的秩和检验,目的:推断两样本分别代表的总体分布位置是否不同。区别于2检验。,例2 请分析两种药物治疗高甘油三酯血症的疗效是否不同,表2 两种药物治疗高甘油三酯血症的疗效,等级资料的统计推断为何使用秩和检验?,2检验只能反映其构成比有无差异,不能比较效应的平均水平。 秩次:在一定程度上反映了等级的高低; 秩和:在一定程度上反映了等级的分布位置。 对等级的分析,可以转化为对秩次的分析。,秩和检验的步骤,建立假设,确定检验水准H0:两种药物疗效的总体分布位置相同; H1:两种药物疗效的总体分布位置不同; =0.05 编秩:编秩时,相同等级的个体属于相持 求秩和,表2 两种药物治疗高甘油三酯血症的疗效,18788125126189,44106.5157.5,由于本例中n1=6910,超出了两样本秩和检验T界值表范围,需用近似正态法进行检验。,计算统计量,秩和检验的步骤,相同秩次较多,需进行校正:,秩和检验的步骤,5. 确定P值。,,查标准正态分布表,得 。按 检验水准,拒绝H0,接受H1,可以认为,两种药物对高甘油三脂血症的疗效不同。,秩和检验的步骤,秩和检验的优点,计算简单,容易掌握 对资料的分布类型不作要求,不依赖于总体分布类型,秩和检验的缺点,如果资料合适做参数检验时,则将损失掉原始数据的一些信息。,完全随机化设计 多组独立样本的秩和检验,(Kruskal-Wallis法),William Kruskal (1919-2005),W. Allen Wallis (1912-1998),多组连续变量资料的秩和检验,对于完全随机设计多组资料比较,如果不满足方差分析的条件,可采用Kruskal-Wallis秩和检验。 完全随机设计多组样本比较的非参数方法是在两独立样本秩和检验的基础上扩展而来,称为K-W检验或H检验。 此法的基本思想与两独立样本的秩和检验法相近:如果各组处理效应相同,混合编秩后,各组的秩和应近似相等。,例3 某研究者欲研究A、B两个菌种对小鼠巨噬细胞吞噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?,多组连续变量资料的秩和检验,两独立样本(A),小鼠总体,随机分组,A菌种,B菌种,生理盐水,设计?,资料 类型?,正态性检验1 检验 -统计量- -P 值- Shapiro-Wilk W 0.865304 Pr D W-Sq 0.0058 Anderson-Darling A-Sq 1.04024 Pr A-Sq 0.0076正态性检验2 检验 -统计量- -P 值- Shapiro-Wilk W 0.891246 Pr D 0.1480 Cramer-von Mises W-Sq 0.109595 Pr W-Sq 0.0821 Anderson-Darling A-Sq 0.830736 Pr A-Sq 0.0277正态性检验3 检验 -统计量- -P 值- Shapiro-Wilk W 0.936913 Pr D 0.0771 Cramer-von Mises W-Sq 0.107134 Pr W-Sq 0.0865 Anderson-Darling A-Sq 0.582427 Pr A-Sq 0.1157,K-W检验的步骤,1.建立假设,确定检验水准H0:三组资料的总体分布位置相同H1:三组资料的总体分布位置不同或不全相同 2. 编秩:将各组数据由小到大统一编秩,编秩时如遇有相同数据,取平均秩次。 3. 求秩和R1=238.5 R2=956.5 R3=635.0,K-W检验的步骤,4.计算统计量,相同秩次的校正,K-W检验的步骤,5. 确定P值并作出推断结论 (1)查表法:当组数k =3,每组例数 ,可查附表11。 (2)当不满足条件(1)时,H 近似地服从自由度为 的 分布,可查 界值表得到P 值本题中, ,v=k-1=2, ,P0.05,拒绝H0,有统计学意义,可认为不同菌种对小鼠巨噬细胞的吞噬指数的作用不同。,例4 四种疾病患者痰液内嗜酸性粒细胞的检查结果见表10-6。问四种疾病患者痰液内嗜酸性粒细胞的等级分布有无差别?,K-W检验的步骤,1.建立假设,确定检验水准H0:四种疾病患者痰液内嗜酸性粒细胞总体分布位置相同; H1:四种疾病患者痰液内嗜酸性粒细胞总体分布位置不同或不全相同。 2. 编秩 编秩时,相同等级的个体属于相持。 3. 求秩和R1=739.5 R2=436.5 R3=409.5 R4=244.5,K-W检验的步骤,4.计算统计量,相同秩次的校正,K-W检验的步骤,5. 确定P值并作出推断结论已知H0成立时,Hc近似服从v=k-1=3的2 分布。根据Hc=15.52,查2界值表 ,得P0.05,暂不拒绝H0,无统计学意义,暂不能认为某药物对治疗组与对照组的疗效不同。,请问:该方法合适吗?如不合适,该使用何种方法?,正确的方法,由于该资料为单向有序列联表资料,欲比较两种药物的疗效,如果采用RC表的2检验,则反映不出两种药物在疗效上的等级差别,因此正确的方法应该采用秩和检验进行统计推断。,如何用SAS程序解决?,data b; do x=1 to 5;do group=1 to 2;input n;output;end; end; cards; 1 1 5 14 13 10 9 5 2 0 ;,proc npar1way wilcoxon; var x; class group; freq n; run;* x是有序分类变量; * group 是分组变量; * n是频数;,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号