资源预览内容
第1页 / 共94页
第2页 / 共94页
第3页 / 共94页
第4页 / 共94页
第5页 / 共94页
第6页 / 共94页
第7页 / 共94页
第8页 / 共94页
第9页 / 共94页
第10页 / 共94页
亲,该文档总共94页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
分析流行病学方法分析流行病学方法2n队列研究列研究n病例病例对照研究照研究 分析流行病学分析流行病学(analytical epidemiology)也称分析性研究)也称分析性研究(analytical study),是在描述性研究基),是在描述性研究基础上进一步在有选择的人群中观察可疑病因础上进一步在有选择的人群中观察可疑病因与疾病和健康状况之间关联的一种研究方法。与疾病和健康状况之间关联的一种研究方法。3一、队列研究一、队列研究n概念概念n用途用途n类型型n研究研究对象的象的选择n资料的收集料的收集n资料分析及料分析及结果解果解释n优点和局限性点和局限性4 队列研究队列研究(cohort study)是将一个范围)是将一个范围明确的人群按明确的人群按是否暴露是否暴露于可疑因素或于可疑因素或暴露程度暴露程度分为不同的亚组,追踪各组的结局并比较其差分为不同的亚组,追踪各组的结局并比较其差异,从而判定暴露因素与结局之间有无关联及异,从而判定暴露因素与结局之间有无关联及关联程度大小的一种关联程度大小的一种观察观察性研究方法。性研究方法。(一)概(一)概 念念5暴露暴露(exposure) 指接触指接触过某种物某种物质、具、具备某种特征或某种特征或处于某种状于某种状态。 队列列(cohort) 有共同有共同经历或有共同暴露特征的一群人或有共同暴露特征的一群人 分分为固定固定队列列和和动态队列列危危险因素因素(risk factor) 泛指能引起某特定不良泛指能引起某特定不良结局局(outcome),),或使或使其其发生的概率增加的因子,包括个人行生的概率增加的因子,包括个人行为、生活、生活方式、方式、环境和境和遗传等多方面的因素。等多方面的因素。6固定队列固定队列 Fixed Cohort研究开始研究开始研究结束研究结束出现结局出现结局未出现结局未出现结局7动态队列动态队列 Dynamic Cohort研究开始研究开始研究结束研究结束出现结局出现结局失访失访8根据研究根据研究对象是否暴露于某研究因素或其不同水平将象是否暴露于某研究因素或其不同水平将研究研究对象分成暴露象分成暴露组(E E)与非暴露)与非暴露组()随随访一定一定时间,比,比较两两组之之间所研究所研究结局局(outcome)发生率的差异,以分析暴露因素与研究生率的差异,以分析暴露因素与研究结局之局之间的关的关系系基本原理基本原理9时间顺序时间顺序 10主要特点主要特点观察察法法设立立对照照 由因到果由因到果,符合,符合时间顺序序确确证暴露和暴露和结局因果关系局因果关系11(二)用途(二)用途检验病因假病因假设描述疾病自然史描述疾病自然史评价价预防效果防效果预后研究后研究12(三)研究类型(三)研究类型前瞻性队列研究前瞻性队列研究(prospective cohort study) 历史性队列研究历史性队列研究(historical cohort study)双向性队列研究双向性队列研究(ambispective cohort study) 13时间顺序时间顺序 过去过去 现在现在 将来将来 历史性队列历史性队列双向性队列双向性队列前瞻性队列前瞻性队列回顾性收集已有的历史资料回顾性收集已有的历史资料回顾性收集已有的历史资料回顾性收集已有的历史资料继续前瞻性收集资料继续前瞻性收集资料继续前瞻性收集资料继续前瞻性收集资料前瞻性收集资料前瞻性收集资料回顾性收集已有的历史资料回顾性收集已有的历史资料回顾性收集已有的历史资料回顾性收集已有的历史资料14 前瞻性队列研究前瞻性队列研究 Prospective Cohort Study研究研究队列的确定是列的确定是现在在根据研究根据研究对象象现在的暴露分在的暴露分组需要随需要随访(follow-up)结局在将来某局在将来某时刻出刻出现15 历史性队列研究历史性队列研究 Historical (Retrospective) Cohort Study根据研究开始根据研究开始时研究者掌握的有关研究研究者掌握的有关研究对象既往象既往的暴露情况的的暴露情况的历史材料分史材料分组不需要随不需要随访,研究开始,研究开始时结局已出局已出现16 双向性队列研究双向性队列研究 Mixed (Ambispective) Cohort Study研究研究队列的确定是列的确定是过去去根据研究根据研究对象既往的暴露情况分象既往的暴露情况分组需要随需要随访部分部分结局可能已出局可能已出现17现场的代表性、配合度的代表性、配合度从目从目标人群中抽出的具有代表性的人人群中抽出的具有代表性的人未患所研究疾病未患所研究疾病 分分为暴露人群和非暴露人群暴露人群和非暴露人群(四)研究对象的选择(四)研究对象的选择18暴露人群选择暴露人群选择n特殊暴露人群特殊暴露人群n一般人群一般人群n有有组织的人群的人群团体体19非暴露(对照)人群选择非暴露(对照)人群选择内内对照照(internal controls) 一群研究一群研究对象内部象内部外外对照照(external controls) 一群研究一群研究对象外部象外部总人口人口对照照(total population controls) 整个地区整个地区现成的成的发病或死亡病或死亡资料料多重多重对照照(multiple controls) 两种或以上的两种或以上的对照形式照形式20:两个发病率的平均值两个发病率的平均值(五)样本含量的估计(五)样本含量的估计p1:暴露组发病率:暴露组发病率p0:对照组发病率:对照组发病率21 基基线资料料 随随访和和结局局资料料(六)资料的收集(六)资料的收集22 基基线资料料(baseline information)收)收集集 暴露于研究因素的信息暴露于研究因素的信息与与结局有关的其他信息局有关的其他信息人口学人口学资料料23 随访随访(follow-up)和和结局结局资料的收集资料的收集结局变量结局变量(outcome variable)()(也称结局,观也称结局,观察察 对象出现的预期结果指标)对象出现的预期结果指标)随访:对象、内容、方法、间隔、随访者随访:对象、内容、方法、间隔、随访者观察终点(观察终点(研究对象出现了预期的结局研究对象出现了预期的结局)观察终止时间(观察终止时间(整个随访工作截止的时间整个随访工作截止的时间)24查漏漏补缺、缺、资料入料入库 统计描述(描述(见病例病例- -对照研究部分)照研究部分)统计推断推断 (七)资料的整理、分析及结果解释(七)资料的整理、分析及结果解释一、分析前的工作一、分析前的工作(一一)所所选的的研研究究对象象及及其其选择方方式式是是否否符符合合研研究究设计,凡不符合者,凡不符合者,应予剔除。予剔除。(二二)是是否否调查了了调查表表上上的的全全部部项目目并并填填写写了了结果果,遇有缺遇有缺项和漏和漏项应补充充调查和填写。和填写。(三三)调查表表中中所所填填写写的的调查资料料是是否否有有逻辑性性错误,若若遇遇有有这类错误应予予更更正正;不不合合乎乎要要求求又又无无法法纠正正的的表格表格应剔除。剔除。(四四)对资料料分分组、归纳或或编码、输入入计算算机机,并并抽抽查核核对数数据据输入入过程程的的正正确确性性。如如发现有有较大大的的输入入错误,应检查核核对输入的全部数据并加以改正。入的全部数据并加以改正。 二、资料的整理二、资料的整理(一)累(一)累积发病率的病率的资料整理料整理 n当当研研究究时间不不长,研研究究人人群群的的数数量量较多多,人人口口比比较稳定定,资料料比比较整整齐时,可可用用固固定定人人口口作作分分母母来来计算算 发 病病 率率 , 称称 之之 为 累累 积 发 病病 率率 ( cumulative incidence)。如如从从某某年年1月月1日日开开始始观察察至至该年年底底12月月31日日截截止止,全全年年内内某某疾疾病病发病病的的累累积总数数除除以以该研研究究人人群群数数,即即得得出出某某病病的的年年累累积发病病率率。当当我我们以以累累积发病病率率为指指标来来分分析析资料料时,其其资料料整整理理模模式式见表表1。(二)发病密度资料整理(二)发病密度资料整理n如如果果观察察时间较长,难以以作作到到人人口口稳定定,则应以以人人时为单位位来来计算算发病病率率。以以人人时为单位位计算算出出来来的的率率带有有瞬瞬时频率率的的性性质,因因此此区区别于于累累积发病病率率而而称称之之为发病病密密度度(incidence density)。对于于应计算算发病病密密度度的的队列列研研究究资料料,其其资料料整整理理和和率率的的计算算,除除了了将将每每个个观察察对象象折折算算成成“人人年年”以以代代替替“人人”,其其余余均均与与累累积发病病率率相相同同。其其资料料整整理理模模式式如表如表2所示:所示:n“人人时”是是观察察人人数数与与观察察时间的的综合合指指标。它它是是研研究究人人群群中中所所有有个个体体暴暴露露于于所所研研究究因因素素的的时间的的总和和,即即人人数数每每人人暴暴露露时间=人人时数数,时间可可以以是是日日、月月、年年中中任任一一单位位,通通常常用用人人年年。因因此此,10人人年年可可以是以是1个人被个人被观察察10年,也可能是年,也可能是5个人被个人被观察察2年。年。n人年的人年的计算方法有多种,算方法有多种,这里介里介绍三种。三种。人时的计算人时的计算n1)以以个个人人为为单单位位计计算算暴暴露露人人年年(精精确确法法):该该法法结结果果精精确确但但很很费费时时间间,如如样样本本不不太太大大时时可可用用此此法法计计算算。以以某某研研究究中中的的三三个个研研究究对对象象为为例例说说明明其其计计算算方方法法从从表表4、表表5结结果果可可知知,虽虽然然总总的的观观察察对对象象只只有有3名名,且且进进出出研研究究对对象象的的时时间间不不一一,但但其其观观察察经经历历可可合合并并成成一一个个总总的的统统一一的的人人时时单单位位,即即34.13人人年。年。2)用用近近似似法法计算算暴暴露露人人年年:如如果果不不知知道道每每个个队列列成成员进入入与与退退出出队列列的的具具体体时间(精精确确到到天天);如如果果研研究究样本本太太大大;另另外外,如如果果对暴暴露露人人年年计算算的的精精确确性性要要求求不不高高时,都都没没有有必必要要应用用精精确确法法计算算;此此时,都都可可应用用近近似似法法计算算暴暴露露人人年年,即即用用平平均均人人数数乘乘以以观察察年年数数得得到到总人人年年数数,平平均均人人数数一一般般取取相相邻两两年年的的年年初初人人口口的的平平均均数数或或年年中中人人口口数数。观察察不不满1年年的的进行行折折算算,1个个月月折折算算为1/12年。年。n该法法计算算简单,但但精精确确性性较差差。现以以表表6来来说明明人人年年的的近似近似计算方法。算方法。式中式中Lx为x时间内的暴露人年数,内的暴露人年数,为x时间开始开始时的的观察人数,察人数,Nx为x时间内内进入入队列的人数,列的人数,为x时间内出内出现终点点结局的人数,局的人数,为x时间内失内失访的人数。的人数。试以表以表5-8的的资料料为例,例,说明其明其计算方法。算方法。n3)用用寿寿命命表表法法计计算算人人年年:当当观观察察对对象象人人数数较较多多,难难以以用用精精确确法法计计算算暴暴露露人人年年,但但又又要要求求有有一一定定的的精精度度时时,可可利利用用简简易易寿寿命命表表的的方方法法。该该法法计计算算简简单单,并并有有一一定定的的精精确确度度。常常用用的的计计算算方方法法是是规规定定观观察察当当年年内内进进入入队队列列的的个个人人均均作作1/2个个人人年年计计算算,失失访访或或出出现现终终点点结结局局的的个个人人也也作作1/2个个人人年年计计算。其观察人年数计算式如下:算。其观察人年数计算式如下:式中式中Lx为为x时间内的暴露人年数,为时间内的暴露人年数,为Ix时间开始时的观察时间开始时的观察人数,人数,Nx为为x时间内进入队列的人数,为时间内进入队列的人数,为x时间内出现终时间内出现终点结局的人数,为点结局的人数,为x时间内失访的人数。试以表时间内失访的人数。试以表7的资料的资料为例,说明其计算方法。为例,说明其计算方法。n在在队列列研研究究中中通通常常是是用用标准准化化的的发病病或或死死亡亡的的比比值来来代代替替率率,即即以以标准准年年龄发病病率率或或死死亡亡率率计算算该观察察人人群群的的理理论发病病(死死亡亡)数数,再再求求实际发病病(死死亡亡)数数与与此此预期期数数的的比比值,即即得得标化化发病病比比或或标化化死死亡亡比比(standard mortality ratio or standard mortality ratio,SMR)。当当研研究究对象象数数目目较少少,发病病率率较低低时,无无论观察察时间长短短,都都不不宜宜计算算率率,而而以以SMR来代替。来代替。(三)标化(发病)死亡比(三)标化(发病)死亡比式式中中Y1i是是暴暴露露组组总总的的观观察察发发病病(或或死死亡亡)数数;N1i是是暴暴露露组组各各年年龄龄段段人人年年数数;R0i是是非非暴暴露露组组按按年年龄龄分分布布的的标标准准发病率或死亡率。发病率或死亡率。率的率的显著性著性检验n检验暴露暴露组与与对照照组的的发病(死亡)率是否有病(死亡)率是否有显著性著性差异可采用多种方法:若差异可采用多种方法:若观察察样本量本量较大,大,样本率的本率的频数分布近似正数分布近似正态分布,可用分布,可用u检验:(式(式3)n式中式中p1为暴露暴露组的率,的率,p0为对照照组的率,的率,SP1为暴露暴露组率的率的标准准误,SP0为对照照组率的率的标准准误。求出。求出u值后,后,查u界界值表得表得P值,按所取得,按所取得检验水准即可作出判断。水准即可作出判断。n如果率比如果率比较低,低,样本率的本率的频数分布不符合正数分布不符合正态分布,分布,可改用二可改用二项分布或泊松分布分布或泊松分布检验,其,其检验方法可参方法可参阅有关有关书籍。籍。n此外,此外,还可以用卡方来可以用卡方来检验两两组的率是否有的率是否有显著性差著性差异。异。nn式中式中t=a+b+c+d(式(式4)(二)暴露与疾病关联强度的测量(二)暴露与疾病关联强度的测量n队列列研研究究的的最最大大特特点点在在于于可可确确证暴暴露露与与疾疾病病的的因因果果联系系。通常用以下几个指通常用以下几个指标来表示来表示这种种联系的系的强度。度。n首先,将首先,将资料整理成表料整理成表1的模式,然后的模式,然后计算下列指算下列指标。n1.相相对危危险度度(relative risk,RR)也也叫叫危危险度度比比(risk ratio)或或率率比比(rate ratio),均均以以RR表表示示,它它是是说明明暴露与疾病关暴露与疾病关联的的强度及其在病因学上意度及其在病因学上意义大小的指大小的指标。 (式(式5)n对于对于RR值的大小反映关联强度应根据的标准可参考表值的大小反映关联强度应根据的标准可参考表8,工作中仍需根据实际情况,工作中仍需根据实际情况RR值的可信区间来判断其值的可信区间来判断其意义。意义。2.归因因危危险度度(attrbutable risk, AR)又又叫叫特特异异危危险度度,或或叫叫率率差差(rate difference, RD),表表明明暴暴露露组与与对照照组发病病危危险相差的相差的绝对值,即暴露者,即暴露者单纯由于暴露而增加的由于暴露而增加的发病概率。病概率。n (式(式7) (式(式8)nRR与与AR同同为估估计危危险度度的的指指标,但但其其公公共共卫生生意意义不不同同。RR说明明暴暴露露使使个个体体比比未未暴暴露露情情况况下下增增加加相相应疾疾病病的的危危险程程度度,是是比比值;AR则是是暴暴露露使使人人群群比比未未暴暴露露情情况况下下增增加加超超额疾疾病病的的数数量量。如如果果暴暴露露因因素素消消除除,就就可可以以减减少少这个个数数量量的的疾疾病。病。 n下面以表下面以表9为例例说明二者的区明二者的区别。n3.归因危因危险度百分比(度百分比(AR%) Lilienfeld等称它等称它为病病因分因分值EFe,是指暴露人群中,是指暴露人群中发病病归因于暴露的成份占因于暴露的成份占全部病因的百分比全部病因的百分比。(式(式9)(式(式10)n4.人人群群归因因危危险度度(population attributable risk, PAR) 它它说明明人人群群由由于于暴暴露露于于某某一一危危险因因子子而而增增加加的的发病病率率。PAR与与AR不不同同,因因为AR仅仅是是从从抽抽取取的的人人群群资料料中中计算算出出来来,而而研研究究对象象暴暴露露与与非非暴暴露露的的比比例例不不会会与与目目标人人群群中中两两者者的的比比例例一一致致,若若目目标人人群群中中暴暴露露的的比比例例低低,尽尽管管AR较高高,人人群群中中的的实际发病病者者也也不不会会很很高高,即即人人群群中中的的归因因危危险度受人群暴露比例的影响。度受人群暴露比例的影响。n设It为全人群的率,全人群的率,Pe为全人群的暴露比例全人群的暴露比例(式(式11)n5.人群人群归因危因危险度百分比(度百分比(PAR%) 类似地可以得到似地可以得到(式(式12) 可可见见PAR和和PAR%取取决决于于暴暴露露因因子子的的流流行行率率和和相相对对危危险险度度两两个个因因素素,可可用用于于估估计计某某危危险险因因子子对对整整个个人人群群引引起起的的疾疾病病负负担担,说说明明在在整整个个社社会会的的卫卫生生问问题题中中哪哪些些是是重重要要的的,在在卫卫生生保保健健工工作作及及卫卫生生管理上意义较大。管理上意义较大。n例:例:Tolonen关于二硫化碳与冠心病死亡联系的队列研关于二硫化碳与冠心病死亡联系的队列研究资料整理如表究资料整理如表10,对该资料进行分析。,对该资料进行分析。n暴露组与非暴露组死亡率差异有极显著性,这一结果暴露组与非暴露组死亡率差异有极显著性,这一结果提示:暴露于提示:暴露于CS2与冠心病死亡率有统计学联系。暴与冠心病死亡率有统计学联系。暴露于露于CS2与冠心病死亡联系强度的估计:与冠心病死亡联系强度的估计:52 选择偏倚选择偏倚 失访偏倚失访偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚偏倚及其控制偏倚及其控制53 产生原因生原因 选择对象的方法不当象的方法不当 最初最初选定参加研究的定参加研究的对象中有人拒象中有人拒绝参加参加 历史性史性队列研究中部分档案列研究中部分档案丢失或失或记录不全不全 志愿者志愿者队列列 研究开始研究开始时未能未能发现早期病人等早期病人等 预防为主,抽样方法正确,严格按规定标准选择对预防为主,抽样方法正确,严格按规定标准选择对象象控控 制制选择偏倚选择偏倚 研究人群在一些重要因素方面与一般人群或待研究的总研究人群在一些重要因素方面与一般人群或待研究的总体人群存在差异,而导致研究结果的偏倚。体人群存在差异,而导致研究结果的偏倚。54控控 制制设计设计 选择便于随访的人群选择便于随访的人群 在计算的研究样本的基础上在计算的研究样本的基础上扩大扩大10%10% 实施实施 加强对随访员的管理加强对随访员的管理 制定随访计划和监测措施制定随访计划和监测措施中期分析中期分析 整理资料整理资料 对于有缺项或漏项的对象进行补查对于有缺项或漏项的对象进行补查 研究对象研究对象迁移迁移、外出外出、死于非终点疾病死于非终点疾病或或拒绝继拒绝继续参加观察续参加观察而而退出退出队列队列失访偏倚失访偏倚55疾病、暴露疾病、暴露标准不明确准不明确检验仪器不精确、器不精确、检验技技术不熟不熟询问技巧不佳技巧不佳记录错误,造假等,造假等产生原因产生原因 控控 制制提高临床诊断技术、明确各项标准提高临床诊断技术、明确各项标准选择精确稳定的测量方法选择精确稳定的测量方法事前调准仪器事前调准仪器严格实验操作规程严格实验操作规程同等对待每个研究对象同等对待每个研究对象培训调查员,提高技巧,统一标准培训调查员,提高技巧,统一标准信息偏倚信息偏倚56控控 制制设计阶段段 限制研究限制研究对象,匹配象,匹配分析分析阶段段 分分层分析、分析、标准化或多因素分析准化或多因素分析混杂偏倚混杂偏倚 与所研究因素和结果均有联系的与所研究因素和结果均有联系的第三因素第三因素在暴露在暴露组与对照组的分布不均衡,混淆了研究因素和结果间组与对照组的分布不均衡,混淆了研究因素和结果间的真实联系的真实联系57队列研究的优点队列研究的优点 直接直接获得暴露得暴露组和非暴露和非暴露组的的发病率病率或死亡率或死亡率 直接估直接估计危危险度度 符合符合时间顺序,序,验证病因的能力病因的能力较强 获得得一种暴露与多种一种暴露与多种结局局的关系的关系 收集的收集的资料完整可靠,料完整可靠,不存在回不存在回忆偏倚偏倚 可研究疾病的自然史可研究疾病的自然史58队列研究的局限性队列研究的局限性 不适于不适于发病率很低病率很低的疾病的病因研究的疾病的病因研究 易易发生生失失访偏倚偏倚 耗耗时,耗人力、物力、,耗人力、物力、财力力 设计要求要求严密,密,资料的收集和分析料的收集和分析难度度较大大 随随访过程中,已知程中,已知变量的量的变化或未知化或未知变量的引入增量的引入增加分析加分析难度度59二、病例对照研究二、病例对照研究n概念概念n用途用途n种种类n研究研究对象的象的选择n样本含量估本含量估计n资料的收集料的收集n资料分析和料分析和结果解果解释60病例病例对照研究(照研究(case-control study) 也称也称回顾性研究回顾性研究(retrospective study),),选择患有和未患有某特定疾病的人群分别作选择患有和未患有某特定疾病的人群分别作为为病例病例组和组和对照对照组,调查两组人群过去组,调查两组人群过去暴露暴露于某种或某些可疑危险因素的比例,判断该于某种或某些可疑危险因素的比例,判断该暴露因素是否与该疾病有关联及其关联程度暴露因素是否与该疾病有关联及其关联程度大小的一种观察性研究方法。大小的一种观察性研究方法。(一)概(一)概 念念61以确以确诊患某种特定疾病的病人作患某种特定疾病的病人作为病例病例以不患以不患该病但具有可比性的个体作病但具有可比性的个体作为对照照通通过询问、实验室室检查或复或复查病史,搜集既往危病史,搜集既往危险因素因素暴露史暴露史测量并比量并比较两两组各因素的各因素的暴露比例暴露比例,经统计学学检验该因素与疾病之因素与疾病之间是否存在是否存在统计学学联系系,以及,以及关关联强度度大小大小基本原理基本原理62病例对照研究示意图病例对照研究示意图暴露暴露非暴露非暴露暴露暴露非暴露非暴露病例病例对照对照比较比较时间时间收集资料的方向收集资料的方向研究起点研究起点63病例对照研究特点病例对照研究特点 观察观察法(无干预)法(无干预) 由果至因由果至因研究研究 按按有无疾病有无疾病分组(一病与多因)分组(一病与多因)64(二)用途(二)用途初步初步检验检验病因假设病因假设提出病因线索提出病因线索评价防治策略和措施的效果评价防治策略和措施的效果65(三)病例对照研究的种类(三)病例对照研究的种类 非匹配非匹配 匹配匹配66病例与对照不匹配病例与对照不匹配 从设计所规定病例和对照人群中,分别抽从设计所规定病例和对照人群中,分别抽 取一定量的研究对象取一定量的研究对象 对照组人数对照组人数病例组人数病例组人数 选择对照没有特殊规定选择对照没有特殊规定67病例与对照匹配病例与对照匹配 匹匹 配配/ /配配 比比( (matching) )要求要求 对照在照在某些因素或特征某些因素或特征上与病例保持一致上与病例保持一致目的目的 对两两组进行比行比较时排除匹配因素的干排除匹配因素的干扰 分分 类 频数匹配(数匹配(frequency matching) 个体匹配(个体匹配(individual matching)68 匹配法注意事项匹配法注意事项 慎重选择匹配因素慎重选择匹配因素 可疑病因可疑病因不作为匹配因素不作为匹配因素 比例一般为比例一般为1:11:1,最多不超过,最多不超过1:4 1:4 避避 免免 “匹匹 配配 过过 度度 ( over-matching)”匹匹配配过过度度:将将不不必必要要的的项项目目列列入入匹匹配配,企企图图使使病病例例与与对对照照尽尽量量一一致致,就就可可能能徒徒然然丢丢失失信信息息,增增加加工工作作难难度度,反反而而降降低低了了研研究效率,这种情况称为匹配过度。究效率,这种情况称为匹配过度。 匹配的目的匹配的目的 提高研究效率提高研究效率 控制混杂因素的作用控制混杂因素的作用 69(四)研究对象的选择(四)研究对象的选择n病例的病例的选择n对照的照的选择70选择病例时应考虑的问题选择病例时应考虑的问题疾病疾病诊断断标准(准(公公认的指的指标)病例确病例确诊时间(首首选新新发病例病例)病例的代表性病例的代表性: 病情、疾病分型等方面代表病情、疾病分型等方面代表总体,体,而且在人口学特征(年而且在人口学特征(年龄、性、性别、种族等)、所、种族等)、所处的的社会社会环境、生活境、生活环境与疾病境与疾病发生有关的生有关的诸多方面也能多方面也能代表其代表其总体体对病例某些特征的限制病例某些特征的限制71病例的来源病例的来源来源于来源于医院医院的病例(的病例(hospital-based)优点:易收集、配合好、信息点:易收集、配合好、信息质量高量高缺点:外延性推缺点:外延性推论时受到限制,易受到限制,易发生生选择偏倚偏倚来源于来源于社区社区的病例(的病例(community-based)优点:外延性好点:外延性好缺点:病例缺点:病例较难获得得72选择对照时应考虑的问题选择对照时应考虑的问题确确认对照的照的标准准对照的照的代表性代表性对照与病例的照与病例的可比性可比性对照不照不应患有与所研究因素有关的其他疾病患有与所研究因素有关的其他疾病可同可同时选择两种以上两种以上对照照73对照的来源对照的来源同一或多个医同一或多个医疗机构中机构中诊断的其他疾病病例断的其他疾病病例社区人口中未患社区人口中未患该病的人病的人病例的病例的邻居中未患居中未患该病的人病的人病例的配偶、同胞、病例的配偶、同胞、亲戚戚病例的同事病例的同事74(五)样本含量的估计(五)样本含量的估计 病例与对照人数相等的非匹配或频数匹配病例病例与对照人数相等的非匹配或频数匹配病例对照研究分类变量资料样本含量的估计对照研究分类变量资料样本含量的估计 公式还可简化为公式还可简化为病例组暴露率病例组暴露率对照组暴露率对照组暴露率已知已知p0和和OR值时,可计算值时,可计算p1,公式为,公式为751:11:1匹配匹配设计76 资料来源料来源 医院病案医院病案记录疾病登疾病登记报告等摘告等摘录致病因素数据需致病因素数据需检测病人的病人的标本或本或环境境获得得询问调查获得得(六)资料的收集(六)资料的收集77X资料料核核查、整整理理(查漏漏补缺缺、纠错、编码、入入库)X统计描述描述X统计推断推断(七)资料整理、分析和结果解释(七)资料整理、分析和结果解释78统计描述统计描述n研究对象一般特征描述研究对象一般特征描述表明研究所选择对象代表了哪种特征的有限总体表明研究所选择对象代表了哪种特征的有限总体n比较组间均衡性检验比较组间均衡性检验检验病例和对照之间除研究因素外的与疾病发生有检验病例和对照之间除研究因素外的与疾病发生有关的各种特征是否均衡可比关的各种特征是否均衡可比79统计推断统计推断n成组病例对照研究资料的分析成组病例对照研究资料的分析n1:1匹配病例对照研究资料的分析匹配病例对照研究资料的分析801.1.列出资料整理表列出资料整理表2.2.假设检验(假设检验(2检验) 若差异有统计学意义,则说明暴露因素与疾病的若差异有统计学意义,则说明暴露因素与疾病的关联很可能不是由抽样误差造成的。关联很可能不是由抽样误差造成的。成组比较法资料的分析成组比较法资料的分析 (非匹配与频数匹配资非匹配与频数匹配资料料)813.3.估计暴露与疾病的关联强度估计暴露与疾病的关联强度 比比值值比比(odds ratio,OR),也也叫叫优优势势比比、交交叉叉乘乘积积比比;比比值值(odds)是是指指某某事事物物发发生生的的可可能能性性与不发生的可能性之比。与不发生的可能性之比。82 与相与相对危危险度度一一样,优势比反映暴露者患比反映暴露者患某种疾病的危某种疾病的危险性性较无暴露者高的程度。一定条无暴露者高的程度。一定条件下件下ORORRR。前提条件前提条件所研究疾病的所研究疾病的发病率(死亡率)很低病率(死亡率)很低病例病例对照研究中所照研究中所选择的研究的研究对象代表性好象代表性好OROR值的意义值的意义834.4.OROR值可信区间估计值可信区间估计Miettinen法估计法估计OR值的值的95%可信区间计算公式:可信区间计算公式:Woolf法估计法估计OR值的值的95%可信区间计算公式:可信区间计算公式:其中其中OR自然对数方差为:自然对数方差为:84 结结果果表表明明吸吸烟烟者者患患食食管管癌癌的的危危险险性性是是不不吸吸烟烟者者的的2.872.87倍,倍,95%95%的可信范围是在的可信范围是在2.182.183.783.78之间之间例例:一项食管癌与吸烟的病例对照研究资料整理见下表:一项食管癌与吸烟的病例对照研究资料整理见下表851:11:1配配对资料的分析料的分析 匹配匹配资料是由病例与料是由病例与对照照结合成合成对子子,分析,分析结果果时不不应把把对子拆开分析子拆开分析 分析步分析步骤与成与成组资料相同,只是料相同,只是计算公式不同算公式不同 861.1.列出四格表列出四格表2.2.假设检验(假设检验(2检验) 配对卡方检验考虑暴露情况不一致的对子数,若配对卡方检验考虑暴露情况不一致的对子数,若配对卡方检验考虑暴露情况不一致的对子数,若配对卡方检验考虑暴露情况不一致的对子数,若差异有统计学意义,说明病例暴露而对照不暴露与差异有统计学意义,说明病例暴露而对照不暴露与差异有统计学意义,说明病例暴露而对照不暴露与差异有统计学意义,说明病例暴露而对照不暴露与对照暴露而病例不暴露的对子数的差异有统计学意对照暴露而病例不暴露的对子数的差异有统计学意对照暴露而病例不暴露的对子数的差异有统计学意对照暴露而病例不暴露的对子数的差异有统计学意义。义。义。义。b+c40时,使用校正公式时,使用校正公式873.3.计算计算OROR值值4.4.计算计算OROR值的值的95%95%可信区间可信区间 计算方法同分组资料计算方法同分组资料88 例例:食食管管癌癌发发病病因因素素的的1 1:1 1配配对对病病例例对对照照研研究究中中发发现现,吸烟与发病有关,资料归纳见下表吸烟与发病有关,资料归纳见下表2 2=11.28, OR=4.33=11.28, OR=4.33表明男性吸烟者患食管癌的危险性是不吸烟者的表明男性吸烟者患食管癌的危险性是不吸烟者的4.34.3倍倍 OR95%OR95%可信限可信限89常常见的偏倚及其控制的偏倚及其控制选择偏倚偏倚(selection bias)产生原因生原因 选择的研究的研究对象不能代表象不能代表总体人群体人群最常最常见偏倚偏倚 伯克森偏倚伯克森偏倚(Berksons bias) ) 选择医医院院的的病病人人作作为病病例例与与对照照,这些些病病人人可可以以因因为种种原因造成入院率的差异种种原因造成入院率的差异 例例如如高高血血压、肿瘤瘤、阑尾尾炎炎病病人人的的入入院院率率显然然各各不不相相同入院率的不同就可造成偏倚。同入院率的不同就可造成偏倚。90选择偏倚的偏倚的控制控制尽量合理地尽量合理地选择病例与病例与对照照尽可能地从多家尽可能地从多家( (类) )医院医院选择病例与病例与对照照91信息偏倚信息偏倚(information bias) 回回忆偏倚偏倚 病例病例对照研究的主要弱点,很照研究的主要弱点,很难完全避免完全避免92混混杂偏倚偏倚(confounding bias) 病例病例对照研究遇到很多混照研究遇到很多混杂因素因素 不易不易识别 不易确定不易确定 控制控制混混杂因素作因素作为匹配因素匹配因素分分层分析分析进行多因素分析行多因素分析( (限制)限制)93 病例病例对照研究的照研究的优点点特特别适用于少适用于少见病、罕病、罕见病的研究病的研究省力、省省力、省钱、省、省时间,并易于,并易于组织实施施还可用于疫苗免疫学效果考核及暴可用于疫苗免疫学效果考核及暴发调查等等可同可同时研究多个因素与某种疾病的研究多个因素与某种疾病的联系系对研究研究对象多无象多无损害害病例对照研究的优缺点病例对照研究的优缺点94 病例病例对照研究的照研究的局限性局限性不适于研究暴露比例很低的因素不适于研究暴露比例很低的因素选择偏倚偏倚难以避免以避免暴露与疾病暴露与疾病时间先后先后难以判断,信息真以判断,信息真实性差性差存在回存在回忆偏倚偏倚易易发生混生混杂偏倚偏倚不不能能计算算发病病率率、死死亡亡率率等等,因因而而不不能能直直接接分分析析相相对危危险度度
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号