资源预览内容
第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
第9页 / 共25页
第10页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第五章 两均数差别的 统计意义检验test of statistical significance 又称test of hypothesis第一节 假设检验的基本步骤l基本步骤:4l1、建立无效假设null hypothesis和确定检 验水准 如=0,又称检验假设hypothesis under test, 零假设、原假设,用H0表示 0:称备择假设或对立假设alternative hypothesis.用H1或HA表示 一般取=0.05和0.01l2、选定检验方法,计算检验统计量l3、确定统计意义的水平和检验用临界值 level of significance:指无效假设是对的而被 拒绝的可能性,即第I类错误,用表示,常取 值0.05、0.01:significant at the 5% level 查表获得界值l4、统计判断:no statistical significance (NS), statistical significance, highly significant (P0.05,P0.05,P0.01) P,结论为按检验水准,不拒绝H0,无统计学意义( 统计结论),还不能认为不同或不等(专业结论)。 不拒绝H0不等于接受H0 。此时尚没有足够的证据认为 H0成立。从决策的观点:可认为暂时接受它,或阴性 待观察。 下结论时,对只能说拒绝H0或不拒绝H0 ;而对H1只能 说,接受H1 ,除此之外其他说法均不妥当假设检验种类l非等效性检验nonequivalencel优效性检验superiorityl等效性检验equivalencel非劣效性检验noninferiority第二节 样本均数和总体均数差别的统计 意义检验linferences from means ( one sample/group u, t-test)l样本均数代表的未知总体均数和已知总 体均数0(一般为理论值、标准值或经过大 量观察所得的稳定值)l若已知总体标准差,可用统计量u,如果总 体标准差未知,只有从样本中获得的标 准差s,那么应该用t检验lP41例5-1:建立检验假设;选定和计算统 计量;查得临界值;确定P值,判断结果。第三节 配对t检验paired t-test for dependent samplesl医学科研中配对设计有: 同一批对象身体两个部位的数据 同一批对象实验(或处理)前后的配对数据 同一批样品用两种方法(两种仪器、两名化验员 、两种条件)检验的结果 配对试验的结果(两个同质受试对象分别接受两 种不同的处理)l一、同体比较(自身对照比较)的t检验:见 P43例5-2,计算差值d,并假设差值的总体 均数为0l二、配对实验的t检验:见P44例5-3l三、同一批对象两次检验结果差值的t检验第四节 两样本均数差别的统计意 义检验l一、两样本均数差别的t检验ltwo-sample/group t-test for independent samples 又称成组t检验comparison for two meansl适用于:完全随机设计两样本均数的比较l完全随机设计:指分别从两研究总体中随 机抽取样本,然后比较两组的平均效应lt值计算公式为:equal variance: the two-sample t testl例题:P46例5-5(合并方差combined/pooled v)l二、关于非正态分布资料均数差别的检验l当资料的分布与正态分布略有偏倚时,对结果影 响不会太大,仍可用t检验l当资料与正态分布偏倚较大时处理方法:l1、n较大时,样本均数仍可近似正态,且S估计 的误差较小(每组例数均大于100),用u检验l2、当n较小时,进行数据较换,近拟正态 后再作检验。是否符合正态分布应作正态 性检验l3、用非参数统计方法第五节 方差不齐时两样本均数 差别的t检验l总体方差不等时unequal variance situationl正态分布由位置参数和变异度参数两者所决定 ,t检验需方差齐性。可用F检验来判断lP48例56l求得F值后查附表6-1 P550l1、近似t检验separate variance estimation t-test: t-test(原版教材称统计量d)。有三种方法,前两 种常用lCochran t和t 值也用双尾概率时的lt/2和t/2lSatterthwaite 法:对自由度进行校正lWelch 法:也是对自由度进行校正l重点介绍第一种方法,见书P48例5-6l第六节 两种检验与两类错误l一、单侧检验与双侧检验l1、若检验目的在于检验两总体均数是否相 等,两者谁大谁小都有可能,只要t的绝对 值大于0.05界值即认为均数差别有统计学意 义,称双侧检验(two-tailed test)或双尾检验l2、若已知一个均数不可能低于另一个均数 ,检验时只需考虑一侧的临界值,称单侧 (one-tailed test)或单尾检验l单、双侧检验时界值间的关系见面积示意 图,图5-1、图5-2(p49-50)l二、第一类错误与第二类错误lI型错误type I error:拒绝了实际上成立的H0 ,这类“ 弃真”的错误称I型错误,其概率大 小用表示,可取单尾亦可取双尾。取 0.05时,表示当无效假设正确时,在100次 抽样中可以有5次推断是错误的。false positive errorlII型错误:“接受”不拒绝了实际不 成立的H0 ,这类“取伪”的错误,称type II error。其概率大小用表示,只取 单尾,其值的大小在进行检验时一般并不 知道。false negative errorType I errorType II error001l两类错误示意图见P51图5-3l1- 称为检验效能power of a test,过去 曾称为把握度。它的意义是当两总体确有 差异,按规定检验水准所能发现该差异 的能力。只取单尾, 1- =0.90,意味着 两总体确有差别,理论上在100次检验中, 平均有90次能够得出有统计学意义的结论 。 愈小,愈大,反之亦然。若要同时 减小I和II型错误,只有增加样本含量n。 l注:拒绝H0只能犯I型错误,不可能犯II型 错误;“接受”不拒绝H0,只可能犯II 型错误。l三、假设检验应注意的问题l1、要有严密的研究设计l2、不同变量或资料应选用不同的检验方法l3、正确理解“ 显著性” 一词的含义:差别 有统计学意义,亦称差别有“ 显著性”,不能 理解为差异大。假设检验的结果并不指差 异的大小,只能反映两者是否相同,差异 的大小只能根据专业知识予以确定。l4、作结论不能绝对化:因统计结论具有概 率性质,不宜用“ 肯定”、“ 一定”、“ 必定” 等词。报告中最好列出统计量的值和P值确 切范围。以便读者与同类研究进行比较l5、P值的正确理解:P或=0.05时,作出 差别有统计意义的结论。理解:若无效假 设正确,从该总体抽样所得的样本,它们 能计算得这样的或比它更大的|t|值的可能性 小于或等于0.05。决不能把P 或=0.05理 解为两总体均数相同的可能性小于或等于 0.05。l6、统计“ 显著性”与医学/临床/生物学“ 显著 性”:统计“ 显著性”对应于统计结论;医学/ 临床/生物学“ 显著性”对应于专业结论。统 计结论与专业结论有机结合,才能得出恰 如其分、符合实际的最终结论。如体重、 血压值的差异检验l四、可信区间与假设检验的区别和联系l可信区间用于说明量的大小 即推断总体均数的范 围,而假设检验用于推断质的不同即判断两总体 均数是否不同。l1、可信区间亦可回答假设检验的问题:算 得的可信区若包含了H0 ,则按水准不拒绝H0; 若不包含H0,则按水准,拒绝H0接受H1。l2、可信区间比假设检验可提供更多的信息 :CI不但能回答差别有无统计学意义,还能提示 差别有无实际专业意义。但并不意味着CI可完全 替代假设检验,因CI在预先确定概率情况下计算 的,而假设检验可获得精确的概率值,两者结合 才是完整的分析。有实际意 义的值H0有统计学意义无统计学意义有实际 意义可能有实际意义无实际意义样本过小可接受零假设(1 )(2)(3)(4 )(5 )第七节 正态性检验l一、正态概率纸法 :适用于小样本、大样本或分 组资料,粗略检验. 亦可用Proportion-proportion plot or quartile-quartile plot (PP or QQ plot)l将观察值从小到大排序,计算累计百分数,转换 成概率单位probability unit: probit查附表5-1 ,以概率单位为纵坐标,以观察值单位为横坐标 ,作点图,若点子基本在一直线上,即近似正态 分布。l二、偏度与峰度检验(method of moment)l正态分布有一定的峰度kurtosis,用g2表示 ,且左右对称,即偏度skewness,用g1表 示,不应太大l按P5456计算峰度系数和偏度系数,再作 u检验l正态时两者都为0,g1为正时表示多数频数 集中在左边,少数较大数据向右延伸,曲线向 右偏(正偏,医学常见),为负时向左偏(负 偏,医学少见);g2为负时曲线较平坦(平阔 峰),为正时曲线峰度超出正态分布(尖峭峰 ),即靠中心处数据过多。l三、W检验 (用于3n50时,且不需知道偏 离正态的类型),W越大(附表5-3),P越大 。l四、D检验:用于不需知道偏离正态分布类 型,且样本含量50n1000时l计算统计量y,y值不在y0.025y0.975之间为有 统计意义(附表5-4),拒绝原假设,认为不 符合正态分布
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号