资源预览内容
第1页 / 共46页
第2页 / 共46页
第3页 / 共46页
第4页 / 共46页
第5页 / 共46页
第6页 / 共46页
第7页 / 共46页
第8页 / 共46页
第9页 / 共46页
第10页 / 共46页
亲,该文档总共46页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
主要内容一、常用相对数二、应用相对数的注意事项三、动态数列四、常用疾病统计指标五、计数资料的统计推断年龄工人管理人员农民商业服务无知识分子总计 18 2 0 0 0 3 0 5 20 9 2 610 18 0 45 2228 71024 7011150 245034285215344361 265043254513370366 2834351034 7857248 3011141122 3917114 3214 2 314 24 3 60 34 4 2 5 3 12 2 28 36 2 1 1 4 5 1 14 38 3 1 1 0 2 1 8 40 0 0 2 0 0 0 2 合计 207 1411022085372061401按某种属性分类,然后清点每类的数据。如按年龄(2 岁一组)与职业整理。计数资料的数据整理s为什么引入相对数?绝对数的局限性。相对数的概念:两个有联系的(数值)指标之比。相对数的种类:比: 1.构成比2.相对比3.率重要区别:分子、分母率(rate):说明某现象或某事物发生的频率或强度。率=(实际发生数/可能发生总数)比例基数比例基数:100%、1000、10000/万、100000(1/10万)等。如:发病率、死亡率、发生率、阳性率、患病率等。注意:不受其它指标的影响;各率相互独立,其之和不为1(如是则属巧合);一、常用相对数(relative number)指标某地某年四种常见心血管病死亡率构成比(proportion):说明某一事物内部,各组 成部分所占的比重。也叫百分比。构成比=(某部分观察单位数/各组成部分观察单位总数)100%如:教研室16人中高级职称有4人,占20。注意:各组成部分的构成比之和为100% 某一部分比重增大,则其它部分相应减少。常用相对数(relative number)指标相对比(relative ratio):是A、B两个有关指标 之比,说明A是B的若干倍或百分之几,通常用倍数或 分数表示。如:男:女、医生:护士、教师:学生s注意:1. A、B可以相同,也可以不同2. A、B可以是绝对数,也可以是相对数常用相对数(relative number)指标率与构成比率构成比概念发生的频率或强度各组成部分所占的比重强调点随机发生事件各部分的构成资料获得较难容易特点不一定合计为100年龄 组 受检 人数 白内障 例数 患者年龄构 成比(%) 患病率(%)=(3)/(2) 40 50 60 70 80 合计560 441 296 1492268 129 135971915.18 28.79 30.13 21.654.2412.14 29.25 45.61 65.10 86.361468448100.0030.52率与构成比的例子1.不能以构成比代替率。2.计算相对数的分子不宜过小。小则直接叙述。3.进行率的对比分析时,应予注意资料可比性。两个率 要在相同的条件下进行。研究方法相同、研究对象同 质、观察时间相等、地区、民族、年龄、性别等。4.正确求平均率。例:若P1=x1/n1;P2=x2/n2;P3=x3/n3 P(x1+x2+x3)/n1+n2+n3) (正确)P(P1+P2+P3)/3 (错误)5.假设检验:遵循随机抽样原则,进行差别显著性检验。二、应用相对数的注意事项例子例1.在进行某遗传病的研究中,一研究人员发现,在该病患者中,有90%是第一个孩子,由此可见该病的遗 传与出生顺序有关-更容易遗传给第一个孩子。这个 结论是否正确,为什么?例2.该县为提高医疗卫生的服务水平,对卫生人员进行培训,但是,经过1年培训,与培训前相比,该县孕 产妇的死亡率却升高,统计学检验差异有显著性。如 何解释?培训前:2000孕产妇 100/10万 ( 死亡2人)培训后:2010孕产妇 149/10万 (死亡3人)s概念:按照一定的时间顺序,将某事物的统计指标依次排 列起来,以便于观察和比较该事物在时间上的发展变化趋 势。s常用指标:1.绝对增长量:说明事物在一定时期内所增长的绝对数量( 累计增长量、逐年增长量)。2.定基比发展速度:统一某个时间的指标作基数,其它各时间 的指标与之相比3.环比发展速度:以前一个时间的指标作基数,相邻的后一 个指标与之相比。三、动态数列四、常用疾病统计指标s1.发病率s2.患病率s3.某病病死率s4.治愈率s5.有效率1.发病率(incidence rate)s概念:表示在观察期内,可能发生某种疾病的一定 人群中新发生该病的频率。s计算公式:某病发病率= K在通常情况下,发病率的分母泛指一般平均人口数。意义:发病率是反映某病在人群中发生频率大小的指 标,常用于衡量疾病的发生,研究疾病发生的因果 关系和评价预防措施的效果。2.患病率(prevalence rate)s概念:表示在某时点检查时可能发生某病的一定人 群中患有某病的频率。 s计算公式:其中某病病例数包括新病例和旧病例,凡患该病的 一律统计在内。同一人不应同时成为同一疾病的两 个病例。s这一指标最适用于病程较长的疾病的统计研究,用 于衡量疾病的存在,反映某病在一定人群中的流行 规模或水平,估计医疗设施的需求量。3.某病病死率(case fatality)s概念:在规定的观察时间内,某病患者中因该病而死亡的频率。s计算公式:某病病死率=上式分母中患病情况不同,指标的概念也不同。如住院病人的病死率,分母为出院人数。某一地区某病病死率的分母则包括该地区所有患该病的病人。故医院的病死率不能代表地区的病死率。s治愈率概念:接受治疗的病人中治愈的频率。s治愈率=(治愈病人数/受治病人数)100%s有效率概念:接受治疗的病人中治疗有效的频率s有效率=(治愈有效病人数/受治病人数)100%s注意比较时:明确的标准;可比性。4.治愈率、有效率率的抽样误差与可信区间 率的统计学推断 1.样本率与总体率比较的u检验 2.两个样本率比较的u检验 卡方检验 1.卡方检验的基本思想 2.四格表专用公式 3.连续性校正公式 4.配对四格表资料的2检验 5.行列(RC)表资料的2检验五、计数资料的统计学推断(一)率的抽样误差与可信区间1.率的抽样误差与标准误2.总体率的可信区间1. 率的抽样误差与标准误样本率(p)和总体率()的差异称为率的抽样 误差(sampling error of rate) ,用率的标准误 (standard error of rate)度量。如果总体率未知,用 样本率p估计标准误的计算2. 总体率的可信区间总体率的可信区间 (confidence interval of rate):根据样本率推算总体率可能所在的范围(二)率的统计学推断1.样本率与总体率比较u检验2.两个样本率的比较u检验1、样本率与总体率比较的u检验u检验的条件:n p 和n(1- p)均大于5时2. 两个独立样本率比较的u检验 表5-1 两种疗法的心血管病病死率比较疗法死亡生存 合计病死率(%)盐酸苯乙双胍26 (X1)178 204(n1) 12.75 (p1)安慰剂 2 (X2) 62 64(n2) 3.13 (p2)合 计 28240 268 10.45 (pc)u检验的条件: n1p1和n1(1-p1)与 n2p2和n2(1-p2)均5小 结1样本率也有抽样误差,率的抽样误差的大小用 p或Sp来衡量。2率的分布服从二项分布。当n足够大,和1- 均不太小,有n5和n(1-)5时,近似正态分布。3总体率的可信区间是用样本率估计总体率的可 能范围。当p分布近似正态分布时,可用正态近似法估 计率的可信区间。4根据正态近似原理,可进行样本率与总体率以 及两样本率比较的u检验。率的u检验能解决以下问题吗?率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关系(如治疗A、治疗B);反应为多分类,如何进行假设检验?率的u检验要求:n足够大,且n5和n(1-) 5。如果条件不满足,如何进行假设检验? (三)卡方检验2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于 1900年提出的一种具有广泛用途的统计方法,可 用于两个或多个率间的比较,计数资料的关联度 分析,拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的2检验。1.卡方检验的基本思想(1)疗疗法死亡生存 合计计病死率(%)盐盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75 (p1)安慰剂剂 2 (c) 62 (d) 64(c+d) 3.13 (p2)合 计计 28 (a+c.)240(b+d.) 268(a+b+c+d=n) 10.45 (pc)表5-2 两种疗疗法的心血管病病死率的比较较实际频数实际频数A A(actual frequency) ( a(actual frequency) ( a、b b、c c、d)d)的的 理论频数理论频数T T(theoretical frequency)(theoretical frequency)(H H0 0: :1 1= =2 2= =):):a a的理论频数的理论频数= =(a+b)pc=(a+b)(a+c.)/n=nRnC/n=21.3b b的理论频数的理论频数= =(a+b)(1-pc)=(a+b)(b+d.)/n=nRnC/n=182.7c c的理论频数的理论频数= =(c+d)pc=(c+d)(a+c)/ n=nRnC/n=6.7d d的理论频数的理论频数= =(c+d)(1-pc)=(c+d)(b+d.)/n=nRnC/n=57.1.卡方检验的基本思想(2)各种情形下,理论与实际偏离的总和即为卡方 值(chi-square value),它服从自由度为的卡 方分布。2检验的基本公式上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍 的其他卡方检验公式都是在此基础上发展起来的 。它不仅适用于四格表资料,也适用于其它的“ 行列表”。2.四格表专用公式(1)为了不计算理论频数T, 可由基本公式推导出,直接 由各格子的实际频数(a、b、c、d)计算卡方值的公式:2.四格表专用公式(2)2(1) u2 2.194924.82(n40,所有T5时)3.连续性校正公式(1)2分布是一连续型分布,而行列表资料属离散型分 布,对其进行校正称为连续性校正(correction for continuity),又称Yates校正(Yates correction)。 当n40,而1T5时,用连续性校正公式 当n40或T1时,用Fisher精确检验(Fisher exact test )校正公式:3.连续性校正公式(2)因为1T5,且n40时,所以应用连续性校正2检验4.配对四格表资料的2检验配对四格表资料的2检验也称McNemar检验(McNemars test)H0:b,c来自同一个实验总体(两种剂量的毒性无差异);H1:b,c来自不同的实验总体(两种剂量的毒性有差别);=0.05。配对四格表资料的2检验公式推导5.行列(RC)表资料的2检验RC表的2检验通用公式几种RC表的检验假设H0RC表的计算举例RC表2检验的应用注意事项1. 对RC表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号