资源预览内容
第1页 / 共110页
第2页 / 共110页
第3页 / 共110页
第4页 / 共110页
第5页 / 共110页
第6页 / 共110页
第7页 / 共110页
第8页 / 共110页
第9页 / 共110页
第10页 / 共110页
亲,该文档总共110页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第三章社区卫生与健康调查研究方法学习目标1.掌握流行病学方法的基本步骤和常用方法,卫生统计的基本概念,数值变量资料、分类变量资料的统计描述,统计工作的基本步骤;2.熟悉假设检验的目的;3.了解社区卫生与健康调查研究方法的内容;4.能运用流行病学的各种方法,制订社区卫生与健康调查计划;5.能正确绘制统计图、统计表。第一节社区健康调查流行病学方法1.什么是社区卫生与健康的流行病学调查?2.如何科学地进行流行病学调查? (一)流行病学定义基本内涵流行病学是研究疾病和健康状态在人群中的分布及其影响因素,以及制定和评价预防、控制和消灭疾病及促进健康的策略与措施的科学1、研究对象:人群2、不仅研究疾病,而且研究健康状况3、重点:研究疾病和健康状态的分布及其影响因素4、落脚点:为控制和消灭疾病及促进健康提供科学的决策依据流行病学与传染病学的区别 流行病学 传染病学 范范 畴畴 预防医学预防医学 临床医学临床医学研究对象研究对象研究对象研究对象 群体(病人、健康人)群体(病人、健康人)群体(病人、健康人)群体(病人、健康人) 单个病人单个病人单个病人单个病人研究内容研究内容研究内容研究内容 疾病在人群中的分布特点,疾病在人群中的分布特点,疾病在人群中的分布特点,疾病在人群中的分布特点, 传染病的传染过程,传染病的传染过程,传染病的传染过程,传染病的传染过程, 流行原因及预防对策和措施流行原因及预防对策和措施流行原因及预防对策和措施流行原因及预防对策和措施 临床表现及诊断治疗临床表现及诊断治疗临床表现及诊断治疗临床表现及诊断治疗研究方法研究方法研究方法研究方法 流行病学调查分析和实验流行病学调查分析和实验流行病学调查分析和实验流行病学调查分析和实验 临床检查及诊治技术临床检查及诊治技术临床检查及诊治技术临床检查及诊治技术研究目的研究目的研究目的研究目的 预防、控制、消灭疾病预防、控制、消灭疾病预防、控制、消灭疾病预防、控制、消灭疾病 治疗病人,恢复健康治疗病人,恢复健康治疗病人,恢复健康治疗病人,恢复健康 三、流行病学方法的主要用途1、描述疾病和健康状况的分布2、研究人群健康、疾病的消长及疾病特征变化的规律3、对社区和人群健康作出诊断4、用于卫生决策和评价5、完整揭示疾病自然史6、利用流行病学方法探讨原因不明疾病的病因7、疾病预防疾病分布疾病分布是指疾病在不同地区、不同时间和不同人群中(简称为“三间分布”,即人间、空间、时间分布)发生水平的高低,疾病的发生、发展有和规律和特点等。研究内容属于描述性流行病学的范畴,是分析性流行病学的基础。(一)疾病的空间(地区)分布我国血吸虫病仅限于长江流域及以南的13个省份流行;高血压的患病率北方高南方低;原发性肝癌集中分布于东南沿海地区;食管癌以河南、河北、山西省交界的太行山地区的发病率最高。(二)疾病的时间分布疾病的时间分布可分为下列四种类型:疾病的时间分布可分为下列四种类型: 1 1、短期波动、短期波动 含义接近于暴发,区别在于暴发常用含义接近于暴发,区别在于暴发常用于少量人群,而短期波动多用于较大数量的人群。于少量人群,而短期波动多用于较大数量的人群。2 2、季节性、季节性 指疾病在每年的一定季节呈现发病率升指疾病在每年的一定季节呈现发病率升高的现象。高的现象。 疾病呈现季节性升高的原因较复杂,主要与气象条件,媒介昆疾病呈现季节性升高的原因较复杂,主要与气象条件,媒介昆虫、野生动物等的生长繁殖周期有关,另外,人们的生活、风俗虫、野生动物等的生长繁殖周期有关,另外,人们的生活、风俗习惯及生产活动情况等因素也会产生一定的影响。习惯及生产活动情况等因素也会产生一定的影响。3、周期性指疾病的发生频率经过一个较为规律的时间间隔,呈现周期性变动的状况。4、长期变异指经过一个相当长的时期(几年、几十年或更长)疾病的临床表现、发病率、死亡率等发生了较大变化的现象。如近40-50年来,猩红热的发病率和病死率均有明显下降,临床上重症病人的比例减少,轻型和不典型病例增多,这可能与菌株、毒力及人体免疫力等因素的变化有关。(三)疾病的人群分布人群的一切固有特性或社会特征均可构成疾病或健康状人群的一切固有特性或社会特征均可构成疾病或健康状态的人群特征。如年龄、性别、职业、种族、收入等。态的人群特征。如年龄、性别、职业、种族、收入等。 1 1、年龄、年龄 一般来说,疾病与年龄的关系比其他人一般来说,疾病与年龄的关系比其他人群特征都更为密切。几乎所有疾病的发病率、死亡率都群特征都更为密切。几乎所有疾病的发病率、死亡率都随着年龄的变化而变化。随着年龄的变化而变化。如麻疹、白喉、百日咳、流行如麻疹、白喉、百日咳、流行性脑脊髓膜炎等发病以儿童多见,高血压、糖尿病、肿性脑脊髓膜炎等发病以儿童多见,高血压、糖尿病、肿瘤等则以老年人多见。瘤等则以老年人多见。2 2、性别、性别 发病率男性发病率男性女性,如肺癌、肝癌、胃癌、钩端螺旋体病、疟女性,如肺癌、肝癌、胃癌、钩端螺旋体病、疟疾等疾等发病率女性发病率女性男性,如乳腺癌、胆囊炎、胆石症等。男性,如乳腺癌、胆囊炎、胆石症等。这主要与两性间解剖、生理特点、内分泌代谢等生物因素的差这主要与两性间解剖、生理特点、内分泌代谢等生物因素的差异及男女两性暴露或接触致病因子的机会不同有关。异及男女两性暴露或接触致病因子的机会不同有关。3 3、 职业职业 不同职业间疾病分布的差异主要与暴露于致病因子不同职业间疾病分布的差异主要与暴露于致病因子的机会不同有关。的机会不同有关。如接触石棉、砷、镍的工人易患肺癌;接触如接触石棉、砷、镍的工人易患肺癌;接触联苯胺等化学染料的工人易患膀胱癌;伐木工人、森林调查员联苯胺等化学染料的工人易患膀胱癌;伐木工人、森林调查员易患森林脑炎等。易患森林脑炎等。另外,隐藏在职业背后的还有社会经济地位、卫生文化水平、体力劳动强度及另外,隐藏在职业背后的还有社会经济地位、卫生文化水平、体力劳动强度及精神紧张程度等因素的差异,这些因素也会对疾病的发生产生较大影响。精神紧张程度等因素的差异,这些因素也会对疾病的发生产生较大影响。 4 4、种族和民族、种族和民族 不同种族和民族间疾病的分布可有明不同种族和民族间疾病的分布可有明显的差异。显的差异。n 美国黑人的高血压、心脏病、结核病的发病率和死亡率高美国黑人的高血压、心脏病、结核病的发病率和死亡率高于白人,而冠心病则是白人较高。于白人,而冠心病则是白人较高。n 不同种族间鼻咽癌的发病率也有明显差异。不同种族间鼻咽癌的发病率也有明显差异。n 我国广东地区是世界上鼻咽癌高发区,移居到东南亚、美我国广东地区是世界上鼻咽癌高发区,移居到东南亚、美国的华侨和华裔鼻咽癌发病率仍高于当地人。国的华侨和华裔鼻咽癌发病率仍高于当地人。5.社会阶层6.婚姻状况7.行为8.流动人口 理论性研究理论性研究 理论流行病学理论流行病学 流行病学方法学研究流行病学方法学研究 现况调查(现况调查(横断面研究横断面研究) 描述性研究描述性研究 比例死亡比研究比例死亡比研究 观察性研究观察性研究 生态学研究生态学研究 分析性研究分析性研究 病例对照研究病例对照研究 队列研究队列研究临床试验临床试验 现场试验现场试验社区干预和整群随机试验社区干预和整群随机试验实验性研究实验性研究描述性研究又称为描述性流行病学,是指利用日常工作收集的和专题调查的资料描述疾病或健康状况在不同地区、不同时间及不同人群中的分布特征。流行病学研究的基础步骤(一)描述性流行病学方法概念:现况研究是指在特定的时间内(某一时点概念:现况研究是指在特定的时间内(某一时点或短时间内),通过普查或抽样调查的方法,对或短时间内),通过普查或抽样调查的方法,对特定人群中某种疾病或健康状况及有关因素的情特定人群中某种疾病或健康状况及有关因素的情况进行调查,从而描述该病或健康状况的分布及况进行调查,从而描述该病或健康状况的分布及其与相关因素的关系。其与相关因素的关系。 某一时点某一时点+ +描述性质描述性质 横断面调查横断面调查适用于病程较长且发病率较高的疾病调查适用于病程较长且发病率较高的疾病调查1、现况研究现况调查的种类o(1 1)普查:特定时间内、对特定普查:特定时间内、对特定范围内的人群进行的全面调查范围内的人群进行的全面调查注意:注意:n明确的范围;明确的范围;n统一调查时间和期限;统一调查时间和期限;n检测方法必须统一固定;检测方法必须统一固定;n要使漏查率尽量小要使漏查率尽量小发现全部病例,并给予治疗发现全部病例,并给予治疗全面描述疾病分布特点全面描述疾病分布特点有利于进行科普宣传有利于进行科普宣传普查的优点普查的优点普查的局限性普查的局限性容易漏查容易漏查不易控制质量不易控制质量某些疾病不适用某些疾病不适用(2)抽样调查o如果现况调查的目的是为了查明现患情况或当前某病的流行强度或某项生理指标值,则可以进行抽样调查。是指从全部被研究对象中,按照一定的方法随即抽取一部分对象作为代表进行调查分析,以此推论全体倍研究对象状况的一种调查。适用于患病率较高的疾病调查。o必须遵循随机化和样本量足够大两个原则(二) 分析性流行病学方法1、病例对照研究p概念: 又称回顾性研究,是一种探索疾病病因的分析性研究方法。选择人群中患某病的病例作为病例组, 不患有该病的人作为对照组,然后追溯两组人群过去暴露于某个(些)因素的情况(包括是否暴露及暴露的剂量),并计算暴露比例进行比较,以判断暴露因素与所研究的疾病之间有无联系的方法p暴露是指曾接触过某种因素或具备某种特征病例对照研究特点p是观察法而非实验法;p按患病与否设病例组和对照组;p观察方向由“果”及“因”;p难以验证因果关系(只是关联);p适用于发病率较低的疾病病因的研究p可能会产生回忆偏倚又称为群组研究、定群研究、前瞻性研究等。是将特定的人群按其是否暴露于某因素或按不同暴露水平分为n个群组或队列,追踪观察一定时间,比较两组或各组的发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。是由“因”及“果”的研究2、队列研究实验性流行病学方法概念按随机化分配原则,将实验人群分为两组,认为地给一组以某种因素、措施或新药作为实验组,另一组不给该种因素、措施或仅给与安慰剂作为对照组,然后随访观察一定时间,并比较两组的发病率或死亡率。这种有计划地在现场进行的实验研究成为实验性流行病学。实验研究的特点p属于前瞻性研究,研究的本质是实验而非观察。p有实验组平行的对照组p需要对实验组施加有研究者所控制的干预措施p实验组和对照组中的每一对象来自同一总体的抽样人群,并严格遵照随机分配的原则分组。社区卫生与健康调查的步骤社区卫生与健康调查的步骤制定调查方案制定调查方案编制调查表编制调查表确定调查目的确定调查目的选择调查研究方法选择调查研究方法确定调查对象和项目确定调查对象和项目制定实施方案制定实施方案选择培训调查员选择培训调查员进行调查相关知识的学习进行调查相关知识的学习树立实事求是的科学态度树立实事求是的科学态度统一调查方法统一调查方法正式调查正式调查资料的整理与分析、资料的整理与分析、撰写调查报告和论文撰写调查报告和论文无应答无应答同质与变异同质与变异总体与样本总体与样本参数与统计量参数与统计量误差误差概率概率12345(一)卫生统计基本概念28同质(homogeneity): 除实验因素外,影响被研究指标的非实验因素相同被称为同质。(对研究指标影响较大的,可以控制的主要因素是相同的。)变异(variance):同质基础上的个体差异称为变异。(一)卫生统计基本概念n例某地某年用随机抽样方法检查了例某地某年用随机抽样方法检查了140140名健康成年名健康成年男子的红细胞数(男子的红细胞数(10101212/L/L):):4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.93观察指标观察指标的的同质部分同质部分:“某地某年健康成年男子某地某年健康成年男子”观察指标的观察指标的变异部分变异部分:各个体间红细胞数间的差异各个体间红细胞数间的差异总体(population):根据研究目的确定的同质的个体所构成的全体。样本(sample):从总体中随机抽取的部分个体。样本中所包含的个体数目称为样本容量。参数(parameter):统计学中把描述总体的特征数称为参数,如、。统计量(statistic):描述样本的特征数称为统计量,如、s、p。统计量样本抽取部分观察单位推 断参 数总体误差定义:定义: 统计上所说的误差泛指统计上所说的误差泛指测量值测量值与与真值真值之差,之差,样本指标样本指标与与总体指标总体指标之差。主要有以下二种:之差。主要有以下二种: 系统误差:系统误差:指数据搜集和测量过程指数据搜集和测量过程中由于仪器不准确、标中由于仪器不准确、标准不规范等原因,造成准不规范等原因,造成观察结果呈倾向性的偏观察结果呈倾向性的偏大或偏小,这种误差称大或偏小,这种误差称为系统误差。为系统误差。特点:特点:具有累加性具有累加性随机误差:随机误差:由于一些非人为的偶然因素使得结果或由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。大或小,是不确定、不可预知的。特点:特点:随测量次数增加而减小。随测量次数增加而减小。(随机测量误差随机测量误差, , 抽样误差)。抽样误差)。在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。随机测量误差由于抽样原因造成的样本指标与总体指标之间的差别。(举例)特点:有抽样发生抽样误差就不可避免。统计上可以计算并在一定范围内控制抽样误差。抽样误差(1)改进抽样方法,增加样本的代表性;)改进抽样方法,增加样本的代表性; 样本量样本量 n 相等的情况下:相等的情况下: 整群抽样整群抽样单纯随机抽样单纯随机抽样系统抽样系统抽样分层抽样分层抽样(2)增加样本量)增加样本量n ;(3)选择变异程度较小的研究指标。)选择变异程度较小的研究指标。减少抽样误差的方法:频率:样本的实际发生率称为频率。设在相 同条件下,独立重复进行n次试验, 事件A出现m次,则事件A出现的频率 为f = m /n。概率:随机事件发生的可能性大小,用大写 的P 表示;取值0,1。 频率与概率频率与概率 (frequency and probabilityfrequency and probability)必然事件 P = 1随机事件 0 P 1不可能事件 P = 0 统计学上把P 0.05(5)或P 0.01(1)称为小概率事件(习惯) ,认为不大可能发生。CertainCertainImpossibleImpossible0.501通常我们把经常遇到的事件分为三种类型:6假设检验又称为显著性检验,是应用统计学原理,由样本之间的差异去推断样本所代表的总体之间是否有差异的一种推断方法。由于抽样误差的存在,当两个或多个样本所得数据之间有差异时,需要进行假设检验,以推断这种差异是抽样误差所致,还是总体之间存在本质差异例:某研究欲比较城乡7岁男孩的身高有无差异,分别从城市和农村两地各随机抽取100名7岁男孩。经测量,城市7岁男孩平均身高为123.35cm,农村地区为122.56cm。如果仅从数值来看,城市7岁男孩身高要高于农村。但这仅是所抽取的200名样本的差异,由于采取了随机抽样的方法,这种身高的差异到底是因为抽样所导致的还是城市和农村7岁男孩身高真的存在差异,需要通过假设检验来推断总体本质是否有差异假设检验的目的计量资料(measurement data):对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般有度量衡单位。如身高、体重计数资料(enumeration data):先将观察对象的观察指标按性质或类别进行分组,然后计数各组的数目所得的资料。如阴性人数、阳性人数统计资料的类型等级资料(ranked data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数。住院号住院号年龄年龄身高身高体重体重住院住院天数天数职业职业文化文化程度程度分娩分娩方式方式妊娠妊娠结局结局20256552716571.55无无中学中学顺产顺产足月足月20256532216074.05无无小学小学助产助产足月足月20258302515868.06管理员管理员大学大学顺产顺产足月足月20225432316169.05无无中学中学剖宫产剖宫产足月足月20224662515962.011商业商业中学中学剖宫产剖宫产足月足月20245352715768.02无无小学小学顺产顺产早产早产20258342015866.04无无中学中学助产助产早产早产20194642415870.53无无中学中学助产助产足月足月20257832915457.07干部干部中学中学剖宫产剖宫产足月足月计量资料计数资料三类资料间关系例:一组20 40岁成年人的血压以12为界分为正常与异常两组,统计每组例数 8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压计量资料计量资料等级资料计数资料计数资料1.1.下面的变量中,属于分类变量的是(下面的变量中,属于分类变量的是( )A A 脉搏脉搏 B B 血型血型 C C 肺活量肺活量 D D 红细胞计数红细胞计数2.2.下面的变量中,属于数值变量的是(下面的变量中,属于数值变量的是( )A A 性别性别 B B 体重体重 C C 血型血型 D D 职业职业3.3.某某人人记记录录了了5050名名病病人人体体重重的的测测定定结结果果:小小于于50Kg50Kg的的1313人人,介介于于50Kg50Kg和和70Kg70Kg间间的的2020人人,大大于于70Kg70Kg的的1717人人,此此时时资料属于(资料属于( )A A 定量资料定量资料 B B 分类资料分类资料 C C 等级资料等级资料 D D 二分类资料二分类资料BBC(三)统计工作的步骤(三)统计工作的步骤统计统计设计设计搜集搜集资料资料整理整理资料资料分析分析资料资料47是根据研究目的,从统计学的角度对搜集资料、整理资是根据研究目的,从统计学的角度对搜集资料、整理资料和分析资料提出周密的计划和要求。料和分析资料提出周密的计划和要求。例如,首先应确定研究目的和内容;确定观察对象和观察单位;需要搜集哪些原始资料;用什么方式和方法获得这些原始资料;怎样对获得的原始资料做进一步的整理汇总和计算统计指标;如何控制误差;预期会得到什么结果;需要多少经费等等统计工作的第一步 关键的一环(一)统计设计(一)统计设计482、搜集资料文本文本文本搜集搜集资料资料经常性资料:日常原始工作记录如医院的病历、各种化验单、出生、死亡登记卡、医院工作年报表传染病报表、职业病报表、等等,报表应做到完整、准确、及时一时性资料:现场调查和实验研究493 3、整理资料、整理资料递进关系递进关系递进关系核查资料核查资料设计分组设计分组拟定整理表拟定整理表归组汇总归组汇总核查资料是否核查资料是否正确、完整正确、完整项目有无重复项目有无重复或遗漏或遗漏记录是否有误,记录是否有误,项目之间是否项目之间是否矛盾矛盾类型分组(按类型分组(按类别分组)类别分组)数值分组(按数值分组(按数量大小)数量大小)过渡性表格过渡性表格尽量把关系密尽量把关系密切的几个项目切的几个项目放在一个表内放在一个表内划记法(正)划记法(正)分卡法分卡法50统计描述用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。如:某区6岁儿童平均身高110cm统计推断用样本信息推断总体特征,包括参数估计和假设检验 4 4、统计分析、统计分析二、统计描述n计量资料的统计描述计量资料的统计描述n计数资料的统计描述计数资料的统计描述n等级资料的统计描述等级资料的统计描述(一)计量资料的统计描述1.1.算数平均数算数平均数定义:定义:指所有观察值的代数和除以观察值的个数。符号:符号:样本均数用 表示,总体均数用 (miu)表示。 应用:应用: 用于反映一组同质观察值的平均水平,应用甚广。 适用于正态或近似正态分布的数值变量资料。计算方法:计算方法:直接法、加权法意义:意义:标准差大,表示观察值的变异度大; 反之,标准差小,表示观察值的变异度小。应用:应用: n适用于描述对称分布资料尤其是正态分布资料的离散程度。n结合均数,描述正态分布资料的频数分布规律,用于估计医学参考值范围;n结合均数,计算变异系数;n结合样本含量,计算标准误,估计抽样误差,用于统计推断。2、标准差(二)计数资料的统计描述计数资料得到的数据为绝对数,在进行统计描述时必须使用相对数计算。相对数即两个有联系的指标的比值。常见的相对数指标有率、构成比和相对比 1.率(rate)人群中某事件发生的频率,可用来表示事件的严重程度,集中趋势。K100,1000,或10000/万(比例基数)2.2.构成比(构成比(proportionproportion)事物某一部分所占的比重,即局部与总体的数量上事物某一部分所占的比重,即局部与总体的数量上的比值。的比值。表表3-2 某医院护理人员学历构成某医院护理人员学历构成率和构成比的概念是不同的率和构成比的概念是不同的药品种类药品种类(1)期初观察人数期初观察人数(2)不良反应人数不良反应人数(3)发生率发生率(%)(4)构成比构成比(%)(5)抗感染药800162.0010.26中成药780648.2141.02循环系药3224012.4225.64其他药1800362.0023.08合计37021564.21100.00表 某地两年来部分药物不良反应情况3.相对比(比)(ratio) 两个具有相同意义和单位变量的比值,表示数量间的关系,两个具有相同意义和单位变量的比值,表示数量间的关系,可用来表示事物间联系的的程度。可用来表示事物间联系的的程度。构成比和相对比的区别构成比是局部占总体的比例比是内部各组成部分的比值BCA为总体B BCB BCBCB常用“率”的指标(1)描述疾病分布的指标发病率(incidencerate):表示一定时间内,特定人群中某病新病例出现的频率通常以通常以年年为单位为单位新发新发/初次诊断初次诊断一人多次发病一人多次发病该时期内平均人口该时期内平均人口可能会发生该病的人群可能会发生该病的人群不可能发病不可能发病K=100%,1000,10000/万.X K与发病率不同2、患病率(、患病率(prevalence rate)患病率主要用于病程较长的慢性病的研究发发 病病 率率 与与 患患 病病 率率 的的 关关 系系患病率患病率发病率发病率基线患病率基线患病率基线患病率基线患病率患病率升高患病率升高患病率下降患病率下降死亡或痊愈死亡或痊愈发病率发病率患病率患病率死亡或痊愈死亡或痊愈与分子应该是相对应(时间、地域、人口特征等)的人口3.3.死亡率(死亡率(mortality ratemortality rate)表示一定时间内,某人群中所有死亡人数(或某病死亡人数)所占比例通常为通常为“1年年”通常为通常为“1年年”4.病死率(fatalityrate)与死亡率不同与死亡率不同表示一定时间内患某病的全部患者中因该病而死亡的比例。可以说明疾病的严重程度和医院的医疗水平。某地人口某地人口10001000人,人,19951995年发生霍乱年发生霍乱2020人,人,6 6人死于人死于霍乱。霍乱。该年霍乱发病率该年霍乱发病率=20/1000*100%=2%该年霍乱死亡率该年霍乱死亡率=6/1000*100%=0.6%该年霍乱病死率该年霍乱病死率=6/20*100%=30%该年霍乱病死率该年霍乱病死率=0.6%/2%=30%例题某县有人口10万人,1997年因各种疾病死亡1000人,该年共发生结核300人,原有结核病人400人,1997年共有60人死于结核,请计算:(1)该县的总死亡率;(2)结核病的病死率;(3)1997年结核病的发病率;(4)1997年结核病的患病率 4.应用相对数注意的问题n计算相对数的分母不宜过小n不能以构成比代替率死因构成比与死亡率的区别n正确计算合计率n样本率或构成比的比较应遵循随机化原则并进行假设检验n相对数的比较应注意可比性四、统计表和统计图统计表(statistical table)是用表格的形式将统计指标与数量恰当的安排在表内,表达研究对象的特征、内部构成以及各项目分组间的相互关系;(一)统计表的基本格式 表号表号 标题标题横标目名称横标目名称纵标目名称纵标目名称合合 计计横标目横标目合合 计计顶顶 线线标目线标目线合计线合计线底底 线线表表1 不同药物治疗急性冠周炎效果比较不同药物治疗急性冠周炎效果比较分组分组治愈治愈未愈未愈合计合计替硝唑替硝唑25 429甲硝唑甲硝唑181432合计合计411861(1)标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。 (2)标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标的单位。横标目表示表中被研究事物或对象的主要标志,位于表的左侧,说明表内同一行数字的含义;纵标目用来说明横标目的各种统计指标,位于表的右侧上方,说明表内同一纵列数字的含义(3)线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。(4)数字:用阿拉伯数字表示。无数字用“”表示,缺失数字用“”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。(5)备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*”号,在表下方说明。 例1 表1列出某地进行喷昔洛韦软膏治疗颜面单纯疱疹与阿昔洛韦软膏比较的随机对照临床试验结果。该表只有试验分组一个层次,属简单表。统计表的种类1.简单表 统计表的主语只有一个层次 2. 组合表 统计表的主语有两个以上层次 例2 某年某地分别在城乡进行乙型肝炎病毒抗原携带者的检测,该研究的对象按城乡和年龄两个特征分层,结果列在表2。该表属组合表。表2 某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析 两个治疗组对比(原表)两个治疗组对比(原表) 西药组西药组 中西药结合组中西药结合组 结果结果 结果结果并发症并发症 例数例数 例数例数 良好良好 死亡死亡 良好良好 死亡死亡 休克休克 13 6 7 10 10 0 急性心肌梗塞并发休克患者的疗效比较(修改表)急性心肌梗塞并发休克患者的疗效比较(修改表) 治疗结果治疗结果 治疗组治疗组 患者例数患者例数 良好良好 死亡死亡 西药组西药组 13 6 7中西药结合组中西药结合组 10 10 01、线条过多,有竖线2、标题太简单,不能概括表的内容3、纵横标目安排不当,标目组合重复,层次不清4、两组疗法的数字未能紧密对应,不便于相互比较二、统计图统计图是用点的位置、线条的升降、直条的长短或面积的大小等形式来表达统计分析的结果,直观地反映事物及其指标间的数量关系统计图的意义: 统计图将统计数据形象化,让读者更易于领会统计资料的核心内容,易于做分析比较,并且可以给读者留下深刻的印象。2统计图的种类:根据资料类型和统计分析目的不同,需要用不同的统计图表达数据和统计指标值。常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图和统计地图等,还有在数据探索性分析中应用的茎叶图、残差图、箱式图,序贯分析的检验区域图,判别分析的类别分布图,聚类分析的谱系图等特殊分析图等。统计图的基本格式:统计图的基本格式:图例图例图体图体横标目横标目 (单位)(单位)(图例)(图例)标题标题纵纵标标目目(单单位位)03统计图制作的一般原则 (1)根据资料性质和分析目的正确选用适当的统计图。 (2)必须有标题,概括统计图资料的时间、地点和主要内容。用阿拉伯数字表示编号。统计图的标题一般放在图的下方。(3)标目:纵横轴应有标目,注明单位(4)尺度:横轴尺度自左而右,纵轴尺度自下而上,数值一律由小到大,等距或者有规律性地标明。纵坐标数字一般从0开始(5)比例:除圆形图外,图形的纵横轴比例一般为5:7(避免错觉)(6)图例:在图内右上角或图下方标题之上二、常用统计图1直条图(bar chart)2圆图(pie chart)和百分比条图(percent bar chart)3线图(line graph)4直方图(histogram)5统计地图(statistical map) 6其他特殊分析图 箱式图(box plot) 茎叶图(stem-leaf plot) 误差条图误差条图(error bar chart)1直条图 适用于按性质分组的相互独立的、无连续关系的资料。用等宽直条的长短来表示各指标的数值大小。直条图按直条是横放还是竖放分卧式和立式两种,按对象的分组是单层次和两层次分单式和复式两种。图1 某年某地主要死因的死亡率(/10万)作直条图的要点作直条图的要点1、以横轴为基线,以纵轴表示频率或频数,纵轴必须从0开始;图3直条图的纵轴尺度起点必须为零示意图2、各直条之间的距离相等,一般与直条等宽或为直条的一半;复式直条图中,同一观察项目的各组之间无间隔,并用图例加以说明。组内直条排序前后应一致。3、为便于比较,直条一般由高到低的次序排列2圆图和百分比条图 圆图(pie chart)是以圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。 百分比条图(percent bar chart)是以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例。圆图和百分比条图适合描述分类变量的构成比资料。 百分比条图特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。 图4 20世纪70年代和80年代某地7常见恶性肿瘤发病构成比较 百分条形图百分条形图(Percent bar graph)图图5 5 我国部分县我国部分县19881988年的死因构成比年的死因构成比其他其他心脏心脏疾病疾病损伤与损伤与 中毒中毒恶性恶性肿瘤肿瘤脑血脑血管病管病呼吸呼吸系病系病 25.70%20.22%16.07%15.04%11.56%11.41%0 20 40 60 80 100百分条图绘制要点标尺:图的上方或下方,起始位置、总长度和百分条图一致,并和百分条图平行。全长为100%分段:按各部分所占百分比的大小排列,可以在图上用数字标出百分比图例:在图外要附图例说明多组比较:若要比较的事物不止一个时,可以画几个平行的百分条图,以便于比较表2 1998年我国部分县前五位死因构成 死亡原因占死亡比(%) 呼吸系统疾病 25.70 脑血管病 16.07 恶性肿瘤15.04 损伤与中毒11.56 心脏疾病11.41其他其他心脏疾病心脏疾病损伤与中毒损伤与中毒恶性肿瘤恶性肿瘤脑血管病脑血管病呼吸系病呼吸系病20.22%25.70%16.07%15.04%11.56%11.41%图图6 6 我国部分县我国部分县19881988年的死因构成比年的死因构成比圆形图(圆形图(Pie graphPie graph)圆形图绘制要点n绘制一圆形,将各指标的构成比乘以3.6即为其所占扇形的圆心角度数(圆心角共360每1%所占的度数即为3.6)n从相当于9或12点的位置开始,用量角器按顺时针方向测量圆心角n每部分用不同线条或颜色表示,附图例说明,并在图上标出百分比n当比较不同资料的百分比构成时,可以画两个大小相等的圆,在每个圆的下面写明标题,用相同的图例表示同一构成部分3线图(line graph) 线图是用线段的升降来表示数值的变化,适合于描述某统计量随另一连续性数值变量变化而变化的趋势,最常用于描述统计量随时间变化而变化的趋势。 普通线图:横轴和纵轴都是算术尺度。 半对数线图:横轴是算术尺度,纵轴是对数尺度,特别适宜作不同指标变化速度的比较。 图7 19902000年某沿海城市甲状腺功能亢进发病率变化趋势 注意注意 普通线图的纵轴一般以0点作起点,否则需作特殊标记或说明,以防给读者错误印象。 标记直线的连接点时要注意,如测定值是在某时间段或数值段的,应标记在段的中点; 如测定值是在某时点或确定值的,标记在相应时点或数值上。相邻两点用直线连接,不能任意改为光滑曲线描述2个以上事物时,需用不同的颜色或不同的线条加以区分,并附图例说明。同一图内不应有太多的线条,一般不超过4-5条,否则不易分清 4直方图(histogram) 以直方面积描述各组频数的多少,面积的总和相当于各组频以直方面积描述各组频数的多少,面积的总和相当于各组频数之和,适合表示连续性数值变量的频数分布。直方图的横轴尺数之和,适合表示连续性数值变量的频数分布。直方图的横轴尺度是数值变量值,纵轴是频数。度是数值变量值,纵轴是频数。直方图绘制要点坐标轴:横轴代表变量值,要用相等的距离表示相等的数量;纵轴代表频数,要从0开始。各矩形间不留间隙(直条图有间隙)对于组距相等的资料可以直接作图;组距不等的资料先进行换算,转化为组距相等的频数,用转化后的频数作图图9 2003年广东省某急性传染病发病数的地理分布 5统计地图统计地图是用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。 6 6多边图(多边图(PolygonPolygon)凡适宜作直方图的资料都可作多边图,曲线下凡适宜作直方图的资料都可作多边图,曲线下的面积为总频数。的面积为总频数。图图10 10 某地区某地区130130名正常成年男子红细胞数的频数分布名正常成年男子红细胞数的频数分布302520151050人人数数红细胞数(红细胞数(10 12 / L)7 7散点图(散点图(Scatter diagramScatter diagram)用于双变量资料,表示两种现象之间的相互关系。用于双变量资料,表示两种现象之间的相互关系。图图11 大白鼠进食量与增加体重的关系大白鼠进食量与增加体重的关系进食量(克)进食量(克)增增加加体体重重(克克)图形的选择(根据资料的性质和分析的目的)图形的选择(根据资料的性质和分析的目的)1.1.资料是连续性的,目的是用线段的升降表达事物的动态变化趋势,资料是连续性的,目的是用线段的升降表达事物的动态变化趋势,选择普通线图。选择普通线图。2.2.资料是连续性的,分析的目的是用线段的升降表达事物动态变化资料是连续性的,分析的目的是用线段的升降表达事物动态变化的速度,选择半对数线图。的速度,选择半对数线图。3.3.数值变量的频数表资料,分析目的用直方的面积表达各组段的频数值变量的频数表资料,分析目的用直方的面积表达各组段的频数或频率分布情况,选择直方图。数或频率分布情况,选择直方图。4.4.资料是相互独立的,目的是用直条的长短比较数值的大小,选用资料是相互独立的,目的是用直条的长短比较数值的大小,选用直条图。直条图。5.事物内部各部分的百分构成资料,目的是用面积大小表达各部分所占比重大小,选圆图或百分条图6.双变量连续性资料,目的用点的密集程度和趋势表达两个变量的相互关系,选用散点图。7.地区性资料,目的用不同的颜色或纹路表示某事物在地域上的分布情况,选用统计地图。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号