资源预览内容
第1页 / 共68页
第2页 / 共68页
第3页 / 共68页
第4页 / 共68页
第5页 / 共68页
第6页 / 共68页
第7页 / 共68页
第8页 / 共68页
第9页 / 共68页
第10页 / 共68页
亲,该文档总共68页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Medical Statistics 医学统计学,秩和检验 Rank Sum Test 基于秩次的非参数统计学方法 Non-Parametric Statistics Methods,主要内容,秩和检验的应用范围(掌握) 秩次与秩和 (掌握) 成组设计两样本比较的秩和检验(掌握) 成组设计多样本比较的秩和检验(熟悉) 配对设计样本比较的秩和检验(掌握) 随机区组设计样本比较的秩和检验(了解) 秩和检验的正确应用(掌握) 参数统计学和非参数统计学(了解),已经学过的假设检验方法,数值变量资料在满足正态性、方差齐性时,对均数进行比较,采用t检验或方差分析。无序分类资料(dichotomous、polynomous)率或构成比的比较采用卡方检验。,未解决的: 数值变量资料在严重不满足正态性(极度偏态、数据不规则),对平均水平进行比较。数值变量资料在方差相差悬殊,无法利用变量变换达到方差齐性时,对平均水平进行比较。等级资料的分析,欲充分利用次序信息,比较组间等级差异。,医学研究中的等级资料,疗 效:痊愈、显效、有效、无效、恶化 化验结果:、+、+、+ 体格发育:下等、中下、中等、中上、上等 心功能分级:I、II、III 文化程度:小学、中学、大学、研究生 营养水平:差、一般、好,等级资料的特点,既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;比“定量”粗,而比一般的“定性”细;等级间既非等距,亦不能被度量。,秩次与秩和,秩次(rank),秩统计量(rank statistics)是指全部观察值按某种顺序排列的位序;秩和(rank sum)同组秩次之和,编秩,A组: 1 2 3 4 5 7 秩次 1 2 4.5 4.5 4.5 8.5TA=25 B组: 6 8 9 10 11 12 秩次 4.5 8.5 8.5 8.5 11.5 11.5 TB=53,TA+TB=N(N+1)/2=78,秩次:在一定程度上反映了等级的高低; 秩和:在一定程度上反映了等级的分布位置。对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验。,成组设计两样本比较的秩和检验,某实验室检测了两组各6人的尿蛋白,结果如下,问所得两组结果有无差异? A组: + + + +1 2 4.5 4.5 4.5 8.5B组:+ + + + + +4.5 8.5 8.5 8.5 11.5 11.5TA=25、TB=53,成组设计两样本比较的秩和检验,基本思想(Wilcoxon成组秩和检验) 如果H0 成立,即两组分布位置相同,A组的实际秩和应接近理论秩和n1(N+1)/2;B组的实际秩和应接近理论秩和n2(N+1)/2或相差不大。如果相差较大,超出了预定的界值,则可认为H0不成立。,为什么? 若两组没有差异,最理论的情形是所有观察值一样,即秩次均为(N+1)/2。,检验假设H0 :A、B两组分布相同;H1 :A、B两组分布不同(相互偏离)。 =0.05。,A组 B组 和 实际秩和 25 53 78 理论秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 39 78 差值 -14 14 0抽样误差?如果H0成立,则理论秩和与实际秩和之差纯粹由抽样误差造成。,两样本秩和检验 T 界值,该范围表明,在当前水准下,只要实际秩和位于范围内,都可以认为实际秩和和理论秩和的偏离属于抽样误差n1=6 n2-n1=0 双侧 单侧 2850 0.10 0.0526 52 0.05 0.02524 54 0.02 0.0123 55 0.01 0.005,间距22263032,6(12+1)/2=39(理论值),检验结果,如果H0成立,则按0.05水准,A组秩和之界值为2652。现A组的实际秩和为25,在界值之外,故拒绝H0,接受H1,认为两组的分布位置不同。,秩和检验的结论判断,A组的实际秩和在界值之外,(小于或等于下界,大于或等于上界)则拒绝H0,接受H1。A组的实际秩和在界值之内,(大于下界且小于上界)则不拒绝H0。,两组等级资料间的秩和检验,用复方猪胆胶囊治疗老年性慢性支气管炎患者403例,疗效见表。问该药对此两型支气管炎疗效是否相同?,建立检验假设: H0 :两型老慢支疗效分布相同; H1 :两型老慢支疗效分布不同。 =0.05。 编秩 ,求秩和。 确定检验统计量T 若两样本例数不等,以例数较少者为n1,检验统计量T=T1=40682.5。 确定P值,作出推断结论,正态近似法(n1,n2-n1超出表的范围时),n110或n2-n1 10时相同秩次多时校正,P 20.005,2 ,P0.005。按 =0.05水准拒绝H0,接受H1,认为三药疗效有差别。,统计量 H 的意义(1),设有k个对比组 各组样本含量: ni 秩和: Ri 平均秩和: 总样本含量: N=n1+n2+nk 总秩和为: N(N+1)/2 总秩次之平均为: (N+1)/2。,统计量 H 的意义(2),设无相同等级,则秩次的总离均差平方和为:秩次的组间离均差平方和为:H值:,等级资料的多组比较是两组比较的扩展,相当于单因素方差分析的秩和检验。属于秩变换检验:将原始观察值编秩后,再进行统计,多组间的两两比较,如果多组等级比较拒绝H0,认为组间存在差异,则可进行两两比较 ( t 检验法):自由度为v=N-k。 H 为Kruskal-Wallis中的 H 统计量( H或HC )。,建立检验假设 H0 :三个处理组中任两个总体分布均相同; H1 :至少有两个总体分布不同。 =0.05。 计算各组平均秩次 令老复方组为第1组、复方I为第2组、复方II为第3组。,确定P值,作出推断结论 按=5223查t界值表,得P值。按 =0.05水准,拒绝H0,接受H1,三种方剂疗效总体分布不全相同,差别主要存在于老复方小叶枇杷与复方I组之间,其余组间差别无统计学意义。,配对设计样本比较的秩和检验,Wilcoxon符号秩和检验计算等级之差值,对差值进行编秩。查 T 界值表,或用近似 u 检验,计算 P 值;界定 P 值,作出结论。,Wilcoxon符号秩和检验,H0:差值的总体中位数为0; H1:差值的总体中位数不为0。 =0.05。 当n50时,查界值表 当n50时,用u近似,用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好。,配对资料的编秩,按差值绝对值大小从小到大编秩。 若差值为0,不参与编秩。 若差值绝对值相等,则取平均秩。 按差值的正负号在秩次上冠以符号。 累积正秩次和负秩次,得到正秩和和负秩和。 正负秩和的绝对值秩和应等于n(n+1)/2。,H0:差值的总体中位数为0; H1:差值的总体中位数不为0。 =0.05。 编秩,求秩和,确定检验统计量T。 T=61.5,T=4.5。 确定 P值和推断结论,符号秩和检验的基本思想,总秩和为Tn(n+1)/2如H0成立,则正负各半,T+ 与 T 均接近 n(n+1)/4。 如果相差太大,超出了事先规定的界值,则H0不成立。,符号秩和检验 T 界值表,N=11 双侧 单侧 13 53 0.10 0.0510 56 0.05 0.0257 59 0.02 0.01 5 61 0.01 0.005,间距 40465256,11(11+1)/4=33(理论值),本例中双侧0.05的界值为1056,0.01的界值为5-61。正、负秩和均在范围之外,故P50时),配伍设计样本比较的秩和检验,Friedman法 分别对每一配伍组中的观察值进行编秩;计算Friedman M 统计量;查M界值表或自由度为k-1的卡方界值表,计算 P 值;界定 P 值,作出结论。,五位评委分别评定了4种葡萄酒的等级(一至四级),结果如表8.5,问对四种酒的评判是否一致(四种酒的等级有无差别)? (设一级为最优,二级其次,依次类推。),检验假设 H0:对四种葡萄酒评判结果的总体分布相同; H1:评判结果的总体分布不同或不全相同。 =0.05。 编秩并求秩和 先在每一配伍组内将数据从小到大编秩(见括弧内数字),如有相同数据,取平均秩次;再按处理组求各组秩和Ri,i=1,2,k。,按式(8.8)计算检验统计量M值,确定P值,作出推断性结论 根据配伍组数b与处理组数k查附表13,得到P值范围。本例b=5,k=4,查表得:M0.05=7.80,M0.01=9.96。0.05MM0.01,0.01P0.05。下结论,按 =0.05水准拒绝H0,接受H1,差异有统计学意义,即可认为四种酒的等级有差别。,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号