资源预览内容
第1页 / 共51页
第2页 / 共51页
第3页 / 共51页
第4页 / 共51页
第5页 / 共51页
第6页 / 共51页
第7页 / 共51页
第8页 / 共51页
第9页 / 共51页
第10页 / 共51页
亲,该文档总共51页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*卡方检验卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*卡方检验基础四格表卡方检验配对卡方检验与一致性检验两分类变量间关联程度的度量分层卡方检验小结v 内容提要浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*2检验是以2分布为基础的一种假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相关或相互独立。其原假设为:H0:观察频数与期望频数没有差别卡方检验基础浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*首先假设H0成立,计算出2值,它表示观察值与理论值之间的偏离程度。根据2分布,2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。如果P 很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。卡方检验基础v 2检验的基本思想浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*2值的计算:由英国统计学家Karl Pearson首次提出,故被称为Pearson 2 。卡方检验基础浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*当n比较大时, 2 统计量近似服从k -1个自由度的2分布。在自由度固定时,每个2值与一个概率值(P 值)相对应,此概率值即为在H0成立的前提下,出现这样一个样本或偏离假设总体更远的样本的概率。如果P 值小于或等于显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不一致。如果P 值大于显著性水准,则不拒绝H0,认为观察频数与期望频数无显著性差异。P 值越小,说明H0假设正确的可能性越小;P 值越大,说明H0假设正确的可能性越大。卡方检验基础卡方分布浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布,Possion分布等检验某个分类变量各类的出现概率是否等于指定概率检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致卡方检验基础用途浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*例1 某种药物加化疗与单用某种药物治疗的两种处理方法,观察对某种癌症的疗效,结果见下表。(数据见cancer.sav)四格表卡方检验处理疗效 合计有效 无效药物加化疗 42 13 55单用药物 48 3 51合计 90 16 106两种治疗方法的疗效比较浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*首先建立数据文件,如下。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*结果分析v 表示药物加化疗与单用药物治疗某种癌症的疗效比较的行列表,除了观察值以外,还有期望值。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*结果分析v 此为四格表2检验的结果,26.508,P0.011,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*连续性校正2检验:仅适用于四格表资料,在n40,所有期望频数均大于1,只有1/5单元格的期望频数大于1小于5时;Fisher精确概率法:在样本含量40,最小期望频数5时,结论与Pearson 2基本一致;v 几种卡方检验的比较:四格表卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*配对卡方检验在Pearson卡方检验中,对行列变量的相关性作了检验,其中的行列变量是一个事物的两个不同属性。实际应用中,还有一种列联表,其中的行列变量反映的是一个事物的同一属性。例如把每一份标本分为两份,分别用两种方法进行化验,比较两种化验方法的结果是否有本质不同;或分别采用甲、乙两种方法对同一批病人进行检查,比较此两种方法的结果是否有本质不同,此时要用配对卡方检验。浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*配对卡方检验配对卡方检验公式:若b+c40,则用公式:若b+c40,则用公式:浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*例2 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结果见下表,问两种方法的检测结果有无差别?(数据见McNemar.sav)免疫荧光法乳胶凝集法 合计+ + 11 12 23 2 33 35合计 13 45 58两种方法的检测结果配对卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*首先建立数据文件,如下。配对卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*配对卡方检验同理,由于是频数表数据,应该先用weight cases进行预处理。不能忘记 哦!浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*在此选入频数变量即可进 行下一步的分析。配对卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*配对卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*配对卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*配对卡方检验选中进行配对 卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*配对卡方检验结果分析浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*在Pearson 卡方检验中,对行变量和列变量的相关性作检验,其中行变量和列变量是一个事物的两个不同属性。在实际中,还有一种列联表,其行变量和列变量反映的是一个事物的同一属性的相同水平,只是对该属性各水平的区分方法不同。其特征是:行的数目和列的数目总是相同的。如果希望检验这两种区分同一属性的方法给出的结果是否一致,则不应当使用Pearson 2检验,而应该采用Kappa一致性检验对两种方法一致程度进行评价。一致性检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*结果分析v 如果在crosstab过程的 statistics子对话框中勾选上Kappa复选框,则有以下结果:一致性检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*一般认为,当Kappa0.75时,表明两者一致性较好;0.75Kappa 0.4时,表明一致性一般;Kappa0.4时,表明两者一致性较差。一致性检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*注意:Kappa检验会利用列联表的全部信息,而McNemar 检验只会利用非主对角线单元格上的信息。因此,对于一致性较好,即绝大多数数据都在主对角线的大样本列联表,McNemar检验可能会失去实用价值。一致性检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量2检验可以从定性的角度说明两个变量是否存在关联,当拒绝原假设时,在统计上有把握认为两个变量存在相关。但接下来的问题是,如果两变量之间存在相关性,它们之间的关联程度有多大?针对不同的变量类型,在SPSS中可以计算各种各样的相关指标,而且Crosstabs过程也对此提供了完整的支持,此处只涉及两分类变量间关联程度的指标,更系统的相关程度指标见相关与回归一章。浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为1,表明试验因素与反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生率降低;大于1时,表明试验因素导致反应阳性的发生率增加。优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。当关注的事件发生概率比较小时(0.1),优势比可作为相对危险度的近似。浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量例3 某次食物中毒,现想通过调查发现,吃某海产品(food)和食物中毒发生(poison)是否具有相关性,以及吃了某食物的人是没吃海产品的人的几倍。数据文件见poison.sav。浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量v 分别指定行列变量到Row(s)和Columns中。浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*选中可得到RR值两分类变量间关联程度的度量浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量结果分析v 这就是两变量的四格表。浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量结果分析v 这是卡方检验的结果,说明吃食物与食物中毒相关。浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*两分类变量间关联程度的度量结果分析v 结果显示,OR3.00,说明吃了该食物者发生食物中毒的可能性是没有吃该食物者的3.00倍?浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*例4 某研究人员对3家医院的卫生服务情况进行了调查,现希望分析寻求就诊和性别之间有无联系。(数据见cmh.sav)分层卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*分层卡方检验v选入分层变量center浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*分层卡方检验进行分层 卡方检验浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*分层卡方检验v 首先给出的是层间差异的检验,结果显示,不同中心间,性别与就诊的联系是相同的。结果分析浙江大学医学院流行病与卫生统计学教研室 沈毅重庆交通大学管理学院*分层卡方检验v 分层卡方检验结果,即考虑了分层因素的影
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号