资源预览内容
第1页 / 共71页
第2页 / 共71页
第3页 / 共71页
第4页 / 共71页
第5页 / 共71页
第6页 / 共71页
第7页 / 共71页
第8页 / 共71页
第9页 / 共71页
第10页 / 共71页
亲,该文档总共71页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
分类变量资料的统计分析Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望主要内容主要内容分类变量资料的统计描述分类变量资料的统计描述分类变量资料的统计推断分类变量资料的统计推断卡方检验卡方检验2卫生学(第7版) 第十章 分类变量资料的统计分析什么是分类变量资料?什么是分类变量资料?用什么指标进行描述?用什么指标进行描述?甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人,何地较为严重?若甲地易感儿童667人,而乙地易感儿童250人。甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。3卫生学(第7版) 第十章 分类变量资料的统计分析第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 常用相对数常用相对数应用相对数时的注意事项应用相对数时的注意事项率的标准化法率的标准化法4卫生学(第7版) 第十章 分类变量资料的统计分析相对数相对数相对数相对数:是两个有关联的数值或指标之比。:是两个有关联的数值或指标之比。常用的相对数有:常用的相对数有:率率构成比构成比相对比相对比5卫生学(第7版) 第十章 分类变量资料的统计分析率率(rate)率率:是是指指在在一一定定观观察察时时间间内内,某某现现象象实实际际发发生生数数与与可可能能发发生生该该现现象象的的总总数数之之比比,用用以以说说明明某某现现象象发发生生的频率或强度。的频率或强度。K K为为比比例例基基数数,如如100%100%、10001000等等。比比例例基基数数的的选选择择主主要要依依习习惯而定或使计算结果能保留惯而定或使计算结果能保留1 12 2位整数。位整数。 6卫生学(第7版) 第十章 分类变量资料的统计分析构成比构成比(constituent ratio) 构构成成比比:是是指指事事物物内内部部某某一一部部分分的的观观察察单单位位数数与与事事物物内内部部各各组组成成部部分分的的观观察察单单位位数数总总和和之之比比,用用以以说说明事物内部各部分所占的比重或分布。明事物内部各部分所占的比重或分布。常用百分数表示,故又称百分比。常用百分数表示,故又称百分比。7卫生学(第7版) 第十章 分类变量资料的统计分析各部分构成比之和为各部分构成比之和为100%。此消彼长。此消彼长。构成比的两个特点:构成比的两个特点:8卫生学(第7版) 第十章 分类变量资料的统计分析例例10-1 2001年年对对某某地地中中小小学学学学生生进进行行HbsAg检检查查,结结果果见见表表10-1,试试计计算算各各级级学学生生HbsAg检检出出率率及及阳阳性者构成比性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。率和构成比不是同一指标,在应用时应注意加以区分。 9卫生学(第7版) 第十章 分类变量资料的统计分析相对比相对比相相对对比比:指指两两个个有有关关指指标标之之比比,说说明明两两个个指指标标的的比比例关系。例关系。两个指标可以是绝对数、相对数、平均数,可以是性质相同两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。或性质不同,但两个指标互不包含。 10卫生学(第7版) 第十章 分类变量资料的统计分析例例10-2 某某地地2003-2005年年不不同同性性别别新新生生儿儿数数见见表表10-2,试计算该地不同年份新生儿性别比。,试计算该地不同年份新生儿性别比。 11卫生学(第7版) 第十章 分类变量资料的统计分析应用相对数的注意事项应用相对数的注意事项计算相对数时分母不宜过小计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率正确区分构成比和率,不能以构成比代替率 正确计算平均率正确计算平均率对率和构成比进行比较时,对率和构成比进行比较时,应注意资料的可比性应注意资料的可比性 率的标准化率的标准化 样本率或构成比进行比较时要作假设检验样本率或构成比进行比较时要作假设检验 12卫生学(第7版) 第十章 分类变量资料的统计分析率的标准化率的标准化13卫生学(第7版) 第十章 分类变量资料的统计分析 在在进进行行两两个个内内部部构构成成不不同同的的总总率率比比较较时时,采采用用统统一一的的标标准准进进行行校校正正,然然后后计计算算校校正正后后的的标标准准化化率,再进行比较的方法称为率的标准化法。率,再进行比较的方法称为率的标准化法。率的标准化法率的标准化法14卫生学(第7版) 第十章 分类变量资料的统计分析计算标准化率时,首先要选定一个比较的计算标准化率时,首先要选定一个比较的“标准标准”。如如,对对年年龄龄构构成成进进行行标标化化时时,可可选选用用全全国国、全全省省等等大大范范围围人人口口构构成成资资料料作作标标准准,也也可可将将比比较较组组的的合合并并人人口口或或以以其其中中任任一一组的人口构成作标准。组的人口构成作标准。原原则则上上,选选定定的的标标准准人人口口应应有有代代表表性性、较较稳稳定定,容容易易获获得得,便于比较。便于比较。根根据据获获得得的的资资料料和和选选定定的的标标准准不不同同,标标准准化化法法可可分分为为直直接接法法和和间接法间接法。15卫生学(第7版) 第十章 分类变量资料的统计分析直接法直接法适适用用情情况况:已已知知被被标标化化组组各各年年龄龄组组的的实实际际率率P Pi i,用标准人口数或标准人口构成进行计算。用标准人口数或标准人口构成进行计算。其中其中 为第为第i 组标准人口数,组标准人口数, 为标准组总人数,为标准组总人数, 为第为第i 组的实际率,组的实际率, 为第组标准人口构成。为第组标准人口构成。 16卫生学(第7版) 第十章 分类变量资料的统计分析甲社区标准化后的患病率甲社区标准化后的患病率 乙社区标准化后的患病率乙社区标准化后的患病率17卫生学(第7版) 第十章 分类变量资料的统计分析如根据选定的标准人口构成做标准,如根据选定的标准人口构成做标准, 18卫生学(第7版) 第十章 分类变量资料的统计分析间接法间接法适适用用情情况况:已已知知被被标标化化组组的的死死亡亡总总数数及及年年龄龄别别人人口数,但不知道各年龄组的实际死亡率。口数,但不知道各年龄组的实际死亡率。标准化死亡比标准化死亡比19卫生学(第7版) 第十章 分类变量资料的统计分析标标准准化化死死亡亡比比:被被标标化化组组实实际际死死亡亡数数与与预预期期死死亡亡数数之之比比,称称为为标标准准化化死死亡亡比比(standard mortality ratio),简简称称为为SMR。若若SMR1,表表示示被被标标化化人人群群的的死死亡亡率率高高于于标标准准组组;反反之之,若若SMR1,表表示示被被标标化人群的死亡率低于标准组。化人群的死亡率低于标准组。 20卫生学(第7版) 第十章 分类变量资料的统计分析例例10-410-4 某某地地观观察察了了吸吸烟烟者者与与不不吸吸烟烟者者各各年年龄龄组组人人数数如如表表10-610-6,同同时时观观察察期期内内吸吸烟烟者者中中有有432432人人死死于于肺肺癌癌,不不吸吸烟烟者者中中有有210210人人死死于于肺肺癌癌,试试计计算算吸吸烟烟者者与与不不吸吸烟烟者者的的标标准准化化死死亡率。亡率。 21卫生学(第7版) 第十章 分类变量资料的统计分析吸烟者的肺癌标准化死亡比吸烟者的肺癌标准化死亡比 非吸烟者的肺癌标准化死亡比非吸烟者的肺癌标准化死亡比 22卫生学(第7版) 第十章 分类变量资料的统计分析吸烟者的肺癌标准化死亡率吸烟者的肺癌标准化死亡率 非吸烟者的肺癌标准化死亡率非吸烟者的肺癌标准化死亡率 23卫生学(第7版) 第十章 分类变量资料的统计分析率的标准化应注意的问题率的标准化应注意的问题 (1 1)当当各各比比较较组组内内部部构构成成(如如年年龄龄、性性别别等等)不不同同时时,应对率进行标准化后,再作比较。应对率进行标准化后,再作比较。(2 2)标标准准化化率率只只表表明明各各标标化化组组率率的的相相对对水水平平,而而不不代代表表其实际水平。其实际水平。(3 3)两两总总率率各各分分组组对对应应的的率率有有明明显显交交叉叉时时,则则不不能能用用标标准化率进行比较。准化率进行比较。(4 4)如如为为抽抽样样研研究究资资料料,两两样样本本标标准准化化率率的的比比较较也也应应作作假设检验。假设检验。 24卫生学(第7版) 第十章 分类变量资料的统计分析第二节第二节 分类变量资料的统计推断分类变量资料的统计推断率的抽样分布率的抽样分布率的抽样误差与标准误率的抽样误差与标准误总体率的区间估计总体率的区间估计率比较的率比较的u u检验检验25卫生学(第7版) 第十章 分类变量资料的统计分析率的抽样分布率的抽样分布从从某某个个二二项项分分类类总总体体中中随随机机抽抽取取含含量量一一定定的的样样本本,其其样样本本率率的的分分布布概概率率是是有有规规律律的的,这这种种规规律律为为服服从从二二项项分分布布(binomial distribution),即即样样本本中中阳阳性性数数或或样样本本阳阳性性率率的的分分布布概概率率等等于于二二项项式式展展开开后后各各项项。若若总总体体阳阳性性率率为为、样样本本含含量量为为n,阳阳性性数数为为X,则则样样本本中中出出现现X个阳性事件的概率可由下式求得。个阳性事件的概率可由下式求得。 26卫生学(第7版) 第十章 分类变量资料的统计分析已已知知: =0.5,n =10; =0.3,n =5; =0.3,n =10; =0.3,n =15。试试根根据据式式(10-6)求求各各阳阳性性数数事事件件的的概概率率并作概率分布图。并作概率分布图。 图图10-1 10-1 率的抽样分布图率的抽样分布图 27卫生学(第7版) 第十章 分类变量资料的统计分析率的抽样分布特征率的抽样分布特征1.为离散型分布;为离散型分布;2.2.当当 =1-=1-时,呈对称分布;时,呈对称分布;3.3.当当n n增大时,逐渐逼近正态分布。增大时,逐渐逼近正态分布。 一般认为,当一般认为,当nn和和n n(1-(1-)5)5时时, , 可近似看可近似看作正态分布。作正态分布。 28卫生学(第7版) 第十章 分类变量资料的统计分析率的抽样误差和标准误率的抽样误差和标准误由由于于抽抽样样所所引引起起的的样样本本率率和和总总体体率率或或各各样样本本率率之之间间存存在在着着差差异异,这这种种差差异异称称为为率率的的抽抽样样误误差差。用率的标准误表示用率的标准误表示 。29卫生学(第7版) 第十章 分类变量资料的统计分析例例10-6 10-6 为为了了解解某某地地人人群群结结核核菌菌素素试试验验阳阳性性率率情情况况,某某医医疗疗机机构构在在该该地地人人群群中中随随机机检检测测了了17731773人人,结结核核菌菌素素试试验验阳阳性有性有682682人,阳性率为人,阳性率为38.47%38.47%,试计算其标准误。,试计算其标准误。30卫生学(第7版) 第十章 分类变量资料的统计分析总体率的区间估计总体率的区间估计总体率的估计:总体率的估计:点估计点估计区间估计区间估计正态近似法正态近似法查表法查表法31卫生学(第7版) 第十章 分类变量资料的统计分析正态近似法正态近似法当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均大于均大于5),样本率的分布近似正态分布。),样本率的分布近似正态分布。 u 是是标标准准正正态态分分布布双双侧侧临临界界值值,在在估估计计总总体体率率的的95%置信区间时,其值为置信区间时,其值为1.96;99%置信区间时,其值为置信区间时,其值为2.58。32卫生学(第7版) 第十章 分类变量资料的统计分析95%的置信区间:的置信区间: 38.47% 1.96 1.16%=36.20%40.74%99%的置信区间:的置信区间: 38.47% 2.58 1.16%=35.48%41.46% 例例10-6中中该该地地人人群群中中结结核核菌菌素素试试验验阳阳性性率率95%和和99%的置信区间为:的置信区间为:33卫生学(第7版) 第十章 分类变量资料的统计分析查表法查表法当当n较较小小,如如n 50,特特别别是是p接接近近于于0或或1时时,按按二二项项分布原理估计总体率的可信区间。分布原理估计总体率的可信区间。因因其其计计算算比比较较复复杂杂,统统计计学学家家已已经经编编制制了了总总体体率率可可信信区区间间估估计计用用表表,可可根根据据样样本本含含量量n和和阳阳性性数数x查查阅阅统统计计学专著中的附表学专著中的附表 。34卫生学(第7版) 第十章 分类变量资料的统计分析u u 检验检验 当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均均大大于于5),样样本本率率的的分分布布近近似似正正态态分分布布。样样本本率率和和总总体体率率之之间间、两个样本率之间的比较可用两个样本率之间的比较可用u检验检验(u test) 。35卫生学(第7版) 第十章 分类变量资料的统计分析样本率与总体率的比较样本率与总体率的比较 36卫生学(第7版) 第十章 分类变量资料的统计分析例例10-7 10-7 一一般般情情况况下下,直直肠肠癌癌围围术术期期并并发发症症发发生生率率为为30%30%,现现某某医医院院手手术术治治疗疗了了385385例例直直肠肠癌癌患患者者,围围术术期期出出现现并并发发症症有有100100例例,并并发发症症发发生生率率为为26%26%,问问该该院院直直肠肠癌癌患患者者围围术术期期并并发发症症发发生生率率与与一一般般情情况况比比较有无统计学差异。较有无统计学差异。本本例例,样样本本率率为为26%,np和和n(1-p)均均大大于于5,可可采采用用u检验。检验。37卫生学(第7版) 第十章 分类变量资料的统计分析1. 建立检验假设建立检验假设2. H0: = 0,H1: 0, =0.052. 计算计算u值值 3. 确定确定P值,判断结果值,判断结果本本题题u u=1.713=1.7131.961.96,P P0.05,0.05,按按 =0.05=0.05的的水水准准不不拒拒绝绝H H0 0,差差异异没没有有统统计计学学意意义义,故故尚尚不不能能认认为为该该院院直直肠肠癌癌患患者者围术期并发症发生率与一般情况不同。围术期并发症发生率与一般情况不同。 38卫生学(第7版) 第十章 分类变量资料的统计分析两个样本率的比较两个样本率的比较 39卫生学(第7版) 第十章 分类变量资料的统计分析例例10-8 10-8 为为了了解解某某地地小小学学生生蛔蛔虫虫感感染染率率的的城城乡乡差差异异,抽抽样样调调查查了了该该地地小小学学生生2279222792人人,其其中中城城镇镇小小学学生生82078207人人,粪粪检检蛔蛔虫虫卵卵阳阳性性数数为为701701人人,蛔蛔虫虫感感染染率率为为8.54%8.54%,乡乡村村小小学学生生1458514585人人,粪粪检检蛔蛔虫虫卵卵阳阳性性数数为为21672167人人,蛔蛔虫虫感感染染率率为为14.86%14.86%,试试比比较较该该地地小小学学生生蛔蛔虫虫感感染染率率城城乡乡差差异异有有无无统统计计学意义。学意义。1. 建立检验假设建立检验假设2. H0: 1= 2,H1: 1 2, =0.052. 计算计算u值值 40卫生学(第7版) 第十章 分类变量资料的统计分析 确确定定P P值值和和判判断断结结果果 本本题题 =13.739=13.7392.582.58,P P0.01,0.01,按按 =0.05=0.05的的水水准准拒拒绝绝H H0 0,接接受受H H1 1,差差异异有有统统计计学学意意义。义。 3. 确定确定P值,判断结果值,判断结果41卫生学(第7版) 第十章 分类变量资料的统计分析第三节第三节 2检验检验基本思想基本思想四格表资料的卡方检验四格表资料的卡方检验配对设计分类变量资料的卡方检验配对设计分类变量资料的卡方检验行行列表资料的卡方检验列表资料的卡方检验42卫生学(第7版) 第十章 分类变量资料的统计分析 2检验(检验(Chi-square test)t 是是现现代代统统计计学学的的创创始始人人之之一一,英英国国统统计计学学家家K.Pearson于于1900年年提提出出的的一一种种具具有有广广泛泛用用途途的的假假设设检检验验方方法法。常用于分类变量资料的统计推断。常用于分类变量资料的统计推断。43卫生学(第7版) 第十章 分类变量资料的统计分析基本思想基本思想例例10-9 某某医医生生欲欲比比较较用用甲甲、乙乙两两种种药药物物治治疗疗动动脉脉硬硬化化的的疗疗效效,甲甲药药治治疗疗71例例,有有效效52例例, 乙乙药药治治疗疗42例例,有有效效39例例,结结果果见见表表10-7。问问两两种种药药物物的的有有效效率率是是否否有有差别?差别?表表10-7 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较44卫生学(第7版) 第十章 分类变量资料的统计分析卡方检验的基本公式:卡方检验的基本公式:A:实际频数:实际频数T:理论频数:理论频数由由上上式式可可以以看看出出,x2值值反反映映的的是是在在检检验验假假设设H0前提下实际频数与理论频数的吻合程度。前提下实际频数与理论频数的吻合程度。45卫生学(第7版) 第十章 分类变量资料的统计分析 2 2检验的自由度检验的自由度 指可以自由取值的基本格子数指可以自由取值的基本格子数 自由度一定时,其自由度一定时,其 2 2值的概率分布也就确定。根据自由值的概率分布也就确定。根据自由度度 和检验水准和检验水准 查表查表10-13 10-13 可得可得 2 2界值,若界值,若 2 2值值 2 20.050.05( ),),则可按则可按 =0.05=0.05的检验水准拒绝的检验水准拒绝H H0 0;若;若 2 2值值 2 20.050.05( ),),则还不能拒绝则还不能拒绝H H0 0。46卫生学(第7版) 第十章 分类变量资料的统计分析四格表资料的卡方检验四格表资料的卡方检验四格表资料四格表资料处处 理理+-合合 计计Aaba+bBcdc+d合合 计计a+cb+dn(a+b+c+d)47卫生学(第7版) 第十章 分类变量资料的统计分析H0 :两药有效率相同,即:两药有效率相同,即 1 2H1 :两药有效率不同,即:两药有效率不同,即 1 2 =0.05(1) 建立检验假设,确定检验水准建立检验假设,确定检验水准例例10-9 10-9 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较48卫生学(第7版) 第十章 分类变量资料的统计分析 2 20.0250.025(1 1)=5.02=5.02, 2 20.010.01(1 1)=6.63=6.63。 本本 例例5.025.02 2 2=6.486.63=6.4840,Tmin549卫生学(第7版) 第十章 分类变量资料的统计分析四格表专用公式:四格表专用公式:本例,本例,50卫生学(第7版) 第十章 分类变量资料的统计分析校正公式:校正公式:四格表资料四格表资料 2 2检验的校正检验的校正 分分布布是是一一种种连连续续性性分分布布,而而分分类类变变量量资资料料属属离离散散性性分分布布,由由此此得得到到的的 统统计计量量也也是是不不连连续续的的。为为改改善善 2 2统统计计量量分分布布的的连连续续性性,英英国国统统计计学学家家Yates F建建议议将将实实际际频频数数和和理理论论频数之差的绝对值减去频数之差的绝对值减去0.5以作校正。以作校正。51卫生学(第7版) 第十章 分类变量资料的统计分析例例10-10 10-10 某某医医生生研研究究比比较较A A、B B两两种种药药物物对对急急性性细细菌菌性性肺肺炎炎的的疗疗效效,有有关关资资料料见见表表10-810-8,问问两两种种药药物物的的疗疗效差别有无统计学意义?效差别有无统计学意义?表表10-8 A、B两药治疗急性细菌性肺炎的疗效比较两药治疗急性细菌性肺炎的疗效比较 52卫生学(第7版) 第十章 分类变量资料的统计分析H0: 1= 2H1: 1 2 =0.05 T22=22 8/64=2.75 5 按按 =1=1, 查查 2 2值值 表表 , 2 20.050.05(1 1)=3.84=3.84, 2 2=4.79=4.79 3.843.84,P P0.05, 0.05, 按按 =0.05=0.05水水准准,拒拒绝绝H H0 0,接接受受H H1 1,认认为为两两药药的的疗疗效效差差别别有有统统计计学学意意义义,A A药药疗效要好于疗效要好于B B药。药。 53卫生学(第7版) 第十章 分类变量资料的统计分析在实际工作中,对于四格表资料,通常规定在实际工作中,对于四格表资料,通常规定(1 1)T5T5,且,且N40N40时,直接计算值,不用校正;时,直接计算值,不用校正;(2 2)1T5, 1T5, 且且N40N40时,用连续性校正检验;时,用连续性校正检验;(3 3)T1T1或或N40N40,不能用卡方检验,用直接计算概率的方法。,不能用卡方检验,用直接计算概率的方法。54卫生学(第7版) 第十章 分类变量资料的统计分析配对设计分类变量资料的配对设计分类变量资料的 2 2检验检验 55卫生学(第7版) 第十章 分类变量资料的统计分析配对卡方检验又称配对卡方检验又称McNemar检验:检验: 56卫生学(第7版) 第十章 分类变量资料的统计分析例例10-11 10-11 用用两两种种血血清清学学方方法法对对100100例例肝肝癌癌患患者者进进行行检检测测,有有关关检检测测结结果果见见表表10-910-9,问问两两种种血血清清学学方方法检测结果有无差别?法检测结果有无差别?表表10-9 两种血清学方法对肝癌检测的结果比较两种血清学方法对肝癌检测的结果比较甲法甲法乙法乙法合计合计+-+503282-15 318合计合计653510057卫生学(第7版) 第十章 分类变量资料的统计分析H0 :两种方法检出率相同,即:两种方法检出率相同,即B = CH1 :两种方法检出率两种方法检出率不同,即不同,即B C =0.05查查表表得得,P 2 20.010.01(2 2), PP0.01, 0.01, 按按 =0.05=0.05的检验水准,拒绝的检验水准,拒绝H H0 0,接受接受H H1 1,故可认为甲、乙、丙三家医院院内感染率总的,故可认为甲、乙、丙三家医院院内感染率总的来讲有差别。来讲有差别。 62卫生学(第7版) 第十章 分类变量资料的统计分析例例10-13 10-13 某某研研究究者者欲欲了了解解白白内内障障发发病病是是否否与与ABOABO血血型型有有关关,收收集集有有关关资资料料见见表表10-1110-11,问问白白内内障障组组与与对照组对照组ABOABO血型分布有无差别?血型分布有无差别?63卫生学(第7版) 第十章 分类变量资料的统计分析H0 :白内障组与对照组:白内障组与对照组ABO血型分布相同血型分布相同H1 :白内障组与对照组白内障组与对照组ABO血型分布不同或不全相同血型分布不同或不全相同 =0.05查查表表得得, 2 20.050.05(3 3)=7.81=7.81, 2 2 P0.05, 0.05, 按按 =0.05=0.05的的检检验验水水准准,不不拒拒绝绝检检验验假假设设,尚尚不不能能认认为为白白内障组与对照组内障组与对照组ABOABO血型分布不同。血型分布不同。 (1)(2)(3) =(2-1)(4-1)=3 64卫生学(第7版) 第十章 分类变量资料的统计分析理理论论数数不不宜宜太太小小。(不不能能有有1/51/5以以上上格格子子的的理理论论频频数数小小于于5 5或者有一个格子的理论频数小于或者有一个格子的理论频数小于1 1)。)。处理方法处理方法如如假假设设检检验验的的结结果果是是拒拒绝绝无无效效假假设设,只只能能认认为为各各总总体体率率或或构构成成比比之之间间总总的的来来说说有有差差别别。若若要要进进一一步步了了解解哪哪两两者者之之间间有差别,可用有差别,可用卡方分割法卡方分割法,或者调整检验水准。,或者调整检验水准。对对于于单单向向有有序序行行列列表表,在在比比较较各各处处理理组组的的效效应应有有无无差差别别时时,应该用秩和检验。应该用秩和检验。行行列表卡方检验的注意事项:列表卡方检验的注意事项:65卫生学(第7版) 第十章 分类变量资料的统计分析如如:用用某某药药治治疗疗某某病病患患者者,5例例中中有有3例例治治愈愈,计计算算治治愈愈率率为为3/5100%=60.0%,如如果果有有4例例治治愈愈,则其治愈率为则其治愈率为80%。显然,这个结果是不稳定的。显然,这个结果是不稳定的。在在分分母母例例数数很很少少的的情情况况下下,个个别别的的偶偶然然因因素素会会导导致致结结果果的的变变化化,只只有有分分母母例例数数较较大大时时,计计算算的的相相对对数数才才比比较较稳稳定定。在在例例数数较较少少时时,通通常常直直接接用用绝绝对对数数表表示示。如如果果要要用用相相对对数数表表示示,则则需需列列出出其其总总体率的置信区间。体率的置信区间。66卫生学(第7版) 第十章 分类变量资料的统计分析 某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿新生儿44704470例,得以下资料,据此得出结论例,得以下资料,据此得出结论:“:“母亲年龄在母亲年龄在24292429岁时,畸形儿最多,占总数的岁时,畸形儿最多,占总数的92.2%92.2%,表明该年龄段易,表明该年龄段易发生畸形儿,符合一般规律发生畸形儿,符合一般规律”。试分析该结论是否合理?。试分析该结论是否合理?某地畸形儿与母亲分娩年龄的关系某地畸形儿与母亲分娩年龄的关系67卫生学(第7版) 第十章 分类变量资料的统计分析学学 生生检查人数人数阳性人数阳性人数检出率出率(%)阳性构成比阳性构成比(%)小学生小学生66060.915.41初中生初中生1115494.3944.14高中生高中生1563563.5850.45合合 计33381113.33100.00表表10-1 200110-1 2001年某地中小学学生年某地中小学学生HBsAgHBsAg检出率及构成比检出率及构成比68卫生学(第7版) 第十章 分类变量资料的统计分析在在进进行行率率或或构构成成比比比比较较时时,除除了了要要比比较较的的因因素素外外,其其他他影影响响的因素应基本一致。的因素应基本一致。例例如如,分分析析比比较较两两医医院院病病死死率率的的时时,应应注注意意两两个个医医院院的的条条件件应应基基本本相相同同,如如果果上上级级医医院院的的病病死死率率高高于于基基层层医医院院的的病病死死率率,并并不不能能说说明明上上级级医医院院医医疗疗水水平平不不如如基基层层医医院院,这这是是因因为为许许多多疑难病人均由基层医院转入上级医院所致。疑难病人均由基层医院转入上级医院所致。 69卫生学(第7版) 第十章 分类变量资料的统计分析当当比比较较两两个个总总率率时时,若若其其内内部部构构成成不不同同,需要进行率的标准化。需要进行率的标准化。 70卫生学(第7版) 第十章 分类变量资料的统计分析理论频数太小的理论频数太小的3 3种处理方法种处理方法1)增大样本含量,以达到增大理论频数的目的;增大样本含量,以达到增大理论频数的目的;2)删去理论频数太小的格子对应的行或列;删去理论频数太小的格子对应的行或列;3)合合理理合合并并:结结合合专专业业,将将理理论论频频数数太太小小的的行行或或列与性质相近的行或列合并。列与性质相近的行或列合并。( (黄陈平黄陈平 施红英施红英) )71卫生学(第7版) 第十章 分类变量资料的统计分析
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号