资源预览内容
第1页 / 共72页
第2页 / 共72页
第3页 / 共72页
第4页 / 共72页
第5页 / 共72页
第6页 / 共72页
第7页 / 共72页
第8页 / 共72页
第9页 / 共72页
第10页 / 共72页
亲,该文档总共72页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
临床流行病学研究的资料收集临床流行病学研究的资料收集 与统计方法应用与统计方法应用 1 1第一节第一节 临床科研资料收集临床科研资料收集 一一. . 临床科研设计的类型临床科研设计的类型 个案报道和病例分析个案报道和病例分析 观察性研究观察性研究 描述性研究描述性研究 分析性研究分析性研究 实验性研究实验性研究2 2针对研究类型选择适当的研究设计针对研究类型选择适当的研究设计 类型类型类型类型目的目的目的目的首选的研究设计首选的研究设计首选的研究设计首选的研究设计治疗研究治疗研究治疗研究治疗研究检验各种干预措施如药物治疗、介入检验各种干预措施如药物治疗、介入检验各种干预措施如药物治疗、介入检验各种干预措施如药物治疗、介入或外科手术的效果或外科手术的效果或外科手术的效果或外科手术的效果随机对照临床试验随机对照临床试验随机对照临床试验随机对照临床试验诊断研究诊断研究诊断研究诊断研究评估新的诊断方法的有效性和可行性评估新的诊断方法的有效性和可行性评估新的诊断方法的有效性和可行性评估新的诊断方法的有效性和可行性横断面调查横断面调查横断面调查横断面调查( (须同时进行须同时进行须同时进行须同时进行新方法和金标准方法检新方法和金标准方法检新方法和金标准方法检新方法和金标准方法检验验验验) )预后研究预后研究预后研究预后研究了解确诊病人以后可能发生的情况了解确诊病人以后可能发生的情况了解确诊病人以后可能发生的情况了解确诊病人以后可能发生的情况纵向队列研究纵向队列研究纵向队列研究纵向队列研究因果关系因果关系因果关系因果关系研究研究研究研究评估有害因素与疾病发生是否有关评估有害因素与疾病发生是否有关评估有害因素与疾病发生是否有关评估有害因素与疾病发生是否有关队列研究或病例队列研究或病例队列研究或病例队列研究或病例- -对照研对照研对照研对照研究,病例报告亦有用究,病例报告亦有用究,病例报告亦有用究,病例报告亦有用筛选研究筛选研究筛选研究筛选研究评估适于大规模人群检验和在疾病呈评估适于大规模人群检验和在疾病呈评估适于大规模人群检验和在疾病呈评估适于大规模人群检验和在疾病呈现症状早期检出该病的各种检查方法现症状早期检出该病的各种检查方法现症状早期检出该病的各种检查方法现症状早期检出该病的各种检查方法横断面调查横断面调查横断面调查横断面调查3 3对某一疾病,研究某药物的效果是否优于安对某一疾病,研究某药物的效果是否优于安慰剂或另一种药物慰剂或另一种药物( (对照药对照药) )?新的手术方法是否优于传统方法?新的手术方法是否优于传统方法?改变生活习惯是否会影响病人血压水平?改变生活习惯是否会影响病人血压水平?适用适用RCT解决的临床问题解决的临床问题4 4适合采用队列研究的临床问题适合采用队列研究的临床问题n n吸烟导致肺癌吗?吸烟导致肺癌吗?n n高血压随着时间推移会变好吗?高血压随着时间推移会变好吗?n n避孕药导致避孕药导致“乳腺癌乳腺癌”吗?吗?n n早产儿在以后的生长发育和学习成绩上早产儿在以后的生长发育和学习成绩上情况如何?情况如何?5 5适合应用病例适合应用病例-对照研究的临床问题对照研究的临床问题n n百日咳疫苗导致脑损害吗?百日咳疫苗导致脑损害吗?n n俯卧睡姿增加俯卧睡姿增加“儿童突然死亡综合征儿童突然死亡综合征”的危险性吗?的危险性吗?n n高架电缆作业人员易患白血病吗?高架电缆作业人员易患白血病吗?6 6适合作横断面调查的临床问题适合作横断面调查的临床问题n n南京地区高血压的患病率是多少?南京地区高血压的患病率是多少?n n3 3岁儿童的岁儿童的“正常正常”身高是多少?身高是多少?n n精神科护士对严重抑郁症患者使用电惊精神科护士对严重抑郁症患者使用电惊厥疗法有多大信心?厥疗法有多大信心?7 7二二. . 临床科研资料的来源临床科研资料的来源 统计报表统计报表 日常性工作记录日常性工作记录 专题调查专题调查 文献资料文献资料8 8三三. . 临床科研资料的测量方法临床科研资料的测量方法 主观测量法主观测量法: : 询问法询问法客观测量法客观测量法: : 查体法查体法 仪器检查法仪器检查法 实验室测量实验室测量 真实真实, , 准确准确, , 尽量控制误差尽量控制误差9 9第二节第二节 临床科研中常用统计方法临床科研中常用统计方法 一一. . 科研资料类型科研资料类型 计量资料计量资料计数资料计数资料等级资料等级资料 1010二、数据处理中的几个基本问题二、数据处理中的几个基本问题 1. 1. 数据核查数据核查 2. 2. 离群数据(离群数据(outlieroutlier)的处理)的处理 第一步:逻辑检查,最大值和最小值第一步:逻辑检查,最大值和最小值第二步:数据核对第二步:数据核对 SPSS软件对其定义:观察值距箱式图(软件对其定义:观察值距箱式图(box plot)的箱体底线(第的箱体底线(第25百分位数)或顶线(第百分位数)或顶线(第75百分位百分位数)的距离为箱体高度数)的距离为箱体高度(四分位数间距)的四分位数间距)的1.5倍至倍至3倍时倍时,被视为离群值,被视为离群值11113. 3. 统计方法前提条件的检验统计方法前提条件的检验 对离群值处理方法:对离群值处理方法: 一种是一种是:直接删除(有逻辑错误,又无法纠正);:直接删除(有逻辑错误,又无法纠正);另一种是另一种是,若数据并无明显逻辑错误,可将该数据,若数据并无明显逻辑错误,可将该数据剔除前后各做一次分析,若结果矛盾,删除;否则剔除前后各做一次分析,若结果矛盾,删除;否则保留。保留。参数统计参数统计时,必需检验是否满足所用方法的条件,时,必需检验是否满足所用方法的条件,如正态性、方差齐性、多重共线性和残差分布的如正态性、方差齐性、多重共线性和残差分布的正态性正态性1212三、统计方法选择的基本思路三、统计方法选择的基本思路 反应变量反应变量 资料类型资料类型 计量、计数、等级计量、计数、等级 单变量、双变量、多变量单变量、双变量、多变量单因素、多因素单因素、多因素 设计类型设计类型 配对、配伍、两组、多组配对、配伍、两组、多组是否满足前提条件是否满足前提条件正态性、方差齐性、正态性、方差齐性、多重共线性、残差正态性多重共线性、残差正态性1313(一一) 计量资料的统计方法计量资料的统计方法选择方法的一般原则选择方法的一般原则: : 2. 2. 根据资料设计类型根据资料设计类型配对配对成组成组多组多组3. 3. 根据样本量大小根据样本量大小 1. 1. 根据资料分布特点根据资料分布特点 正态正态 偏态偏态1414常用方法常用方法 1. 1. 正态分布资料正态分布资料 小小样本样本: : 配对配对t t 检验检验 成组成组t t 检验检验 多组方差分析多组方差分析大样本大样本: u : u 检验检验2. 2. 偏态分布资料偏态分布资料 配对秩和检验配对秩和检验 成组秩和检验成组秩和检验多组秩和检验多组秩和检验1515例例1.1. 为研究女性服用某避孕新药是否影响其为研究女性服用某避孕新药是否影响其血清总胆固醇含量,将血清总胆固醇含量,将2020名女性按年龄配成名女性按年龄配成1010对。每对中随机抽取一人服用新药,另一人服对。每对中随机抽取一人服用新药,另一人服用安慰剂。经过一定时间后,测得血清总胆固用安慰剂。经过一定时间后,测得血清总胆固醇含量(醇含量(mmolmmolL L),),结果如下表。问该新药结果如下表。问该新药是否影响女性血清总胆固醇含量?是否影响女性血清总胆固醇含量?6.25.86.45.05.44.45.05.55.26.2安慰剂安慰剂10987654321配对号配对号5.14.35.96.04.84.94.65.85.04.4新药组新药组新药组与安慰剂组血清总胆固醇含量(新药组与安慰剂组血清总胆固醇含量(mmolmmol/L/L)1616配对配对t检验检验(paired t-test for dependent samples)paired t-test for dependent samples)1717例例例例2.2.2.2. 某医生研究野木瓜用于手术后的镇痛疗效,某医生研究野木瓜用于手术后的镇痛疗效,某医生研究野木瓜用于手术后的镇痛疗效,某医生研究野木瓜用于手术后的镇痛疗效,以哌替啶作为对照,观察两药的镇痛时间以哌替啶作为对照,观察两药的镇痛时间以哌替啶作为对照,观察两药的镇痛时间以哌替啶作为对照,观察两药的镇痛时间(h h h h),),),),得到如下结果,问野木瓜与哌替啶的得到如下结果,问野木瓜与哌替啶的得到如下结果,问野木瓜与哌替啶的得到如下结果,问野木瓜与哌替啶的镇痛时间是否不同?镇痛时间是否不同?镇痛时间是否不同?镇痛时间是否不同?分组分组分组分组n n野木瓜野木瓜野木瓜野木瓜30306.21.46.21.4哌替啶哌替啶哌替啶哌替啶28283.51.23.51.2野木瓜与哌替啶的镇痛时间(野木瓜与哌替啶的镇痛时间(h)1818成组成组t检验检验(two-sample t-test for independent samples):1919例例 3 . 为探讨一氧化氮(为探讨一氧化氮(NO)在肾缺血再灌流过在肾缺血再灌流过程中的作用,将程中的作用,将36只雄性只雄性SD大鼠随机等分为大鼠随机等分为3组组给予不同处理后,测得给予不同处理后,测得NO数据如下表,试问各组数据如下表,试问各组水平是否不同?水平是否不同?表表10.3 3组大鼠肾组织液中组大鼠肾组织液中NO水平水平 (mol/L) 正常对照正常对照 肾缺血肾缺血60min 肾缺血肾缺血60min再灌再灌437.98285.75369.93344.53378.96300.92271.70417.97287.10363.51309.60338.83322.75464.51322.34282.52278.47348.47354.10302.21269.65322.98288.76386.67284.04194.90197.53227.57184.42223.17363.43390.38332.68355.99219.72143.172020注意注意: 自由度自由度; N= ni; k=处理组数处理组数 完全随机设计资料的方差分析完全随机设计资料的方差分析 (单因素多组均数比较单因素多组均数比较)变异来源变异来源 离均差平方和离均差平方和 SS 自由度自由度 均方均方 MS F总总 X2-C N-1 组内组内 SS总总 SS组间组间 N-k SS组内组内/df组内组内组间组间 (Xi)2/ni C k-1 SS组间组间/df组间组间MS组间组间/MS组内组内表表 完全随机设计方差分析计算表完全随机设计方差分析计算表 C= ( X)2/ N2121例例4. 为比较不同产地石棉毒性的大小,取体重为比较不同产地石棉毒性的大小,取体重200-220g的的雌性大鼠雌性大鼠36只,将月龄相同、体重相近的只,将月龄相同、体重相近的3只分为一组。每只分为一组。每组的组的3只动物随机分别接受不同产地石棉处理后,以肺泡巨只动物随机分别接受不同产地石棉处理后,以肺泡巨噬细胞(噬细胞(PAM)存活率评价石棉毒性大小。结果见下表,存活率评价石棉毒性大小。结果见下表,试问不同产地石棉毒性是否不同?试问不同产地石棉毒性是否不同? 表表 经不同产地石棉处理后大鼠巨噬细胞存活率经不同产地石棉处理后大鼠巨噬细胞存活率 区组号区组号(因素(因素B) 石棉产地(因素石棉产地(因素A)甲地甲地 乙地乙地 丙地丙地 12345678910111250.8848.0245.2638.3852.7060.2244.4949.3146.2351.1642.4853.4744.0166.2759.9952.4960.6966.1255.3653.3952.3455.1658.6461.0866.6971.9269.8967.0556.3570.0886.6068.2063.3666.1270.0267.242222表表 随机区组设计方差分析计算表随机区组设计方差分析计算表 变异来源变异来源 SS MS F 总变异总变异 X2-C N-1 or cr-1 处理处理 区组区组 c-1 SSA/(c-1) MSA/MSe r-1 SSB/(c-1) MSB/MSeSST- SSA - SSB (c-1)(r-1) SSe/ e 误差误差随机区组设计方差分析随机区组设计方差分析2323例例5. 某研究者为观察国产乙酰水杨酸钙脲某研究者为观察国产乙酰水杨酸钙脲(CUA)的解热镇痛作用,将的解热镇痛作用,将10只小鼠随机只小鼠随机平均分为两组。一组作为对照,使用旧解热平均分为两组。一组作为对照,使用旧解热镇痛药物;另一组使用镇痛药物;另一组使用CUA,观察两组小鼠观察两组小鼠的痛阈,实验结果如下表,试分析的痛阈,实验结果如下表,试分析CUA的镇的镇痛作用。痛作用。2424两组小鼠的痛阈数据两组小鼠的痛阈数据 组别组别 动物动物 序号序号测量时间测量时间/min 30 60 90 合合 计计 对照组对照组 1 2 3 4 5合计合计 8.5 8.8 8.7 26.0 9.6 9.8 9.7 29.1 8.7 9.0 8.9 26.612.0 11.8 11.7 35.513.3 12.9 12.8 39.052.1 52.3 51.8 156.2CUA组组 6 7 8 910合计合计 9.7 27.4 12.1 49.2 10.7 28.7 14.8 54.2 9.9 26.2 17.2 53.312.7 31.9 16.3 60.913.8 32.3 13.2 59.3 108.9 198.8 125.4 433.156.8 146.5 73.6 276.9总总 计计2525重复测量方差分析重复测量方差分析 重复测量(重复测量(repeated measure)是指对同一是指对同一观察对象的同一观察指标在不同时间点上进行观察对象的同一观察指标在不同时间点上进行多次测量,用于分析该观察指标在不同时间上多次测量,用于分析该观察指标在不同时间上的变化规律。的变化规律。 主要特点:主要特点:同一受试对象在不同时点的观同一受试对象在不同时点的观察值之间彼此不独立,往往存在某种程度上的察值之间彼此不独立,往往存在某种程度上的相关性。相关性。2626 例例6.6. 抽样调查了农村高碘地区抽样调查了农村高碘地区100100名小学生和非名小学生和非高碘地区高碘地区105105名小学生的智商,得结果如表,问两名小学生的智商,得结果如表,问两个不同地区小学生智商水平是否不同?(假定两个不同地区小学生智商水平是否不同?(假定两组受教育年限、学校规模、师资水平等相近)组受教育年限、学校规模、师资水平等相近)高碘区和非高碘区儿童智力比较高碘区和非高碘区儿童智力比较 组别组别组别组别n nS S高碘区高碘区高碘区高碘区10010073.073.07 710.7510.75非高碘区非高碘区非高碘区非高碘区 10510580.380.30 011.8311.832727大大样本样本u u 检验检验: : 成组成组: 配对配对: 2828例例例例7.7.7.7. 某医院组织病人对护理质量作评价,同时某医院组织病人对护理质量作评价,同时某医院组织病人对护理质量作评价,同时某医院组织病人对护理质量作评价,同时对护士再培训,资料见下表。问培训前后的评对护士再培训,资料见下表。问培训前后的评对护士再培训,资料见下表。问培训前后的评对护士再培训,资料见下表。问培训前后的评分结果是否有显著差异?分结果是否有显著差异?分结果是否有显著差异?分结果是否有显著差异? 7776778296466护士编号护士编号 培训前评分培训前评分 培训后评分培训后评分123456789101112131097710696896672929符号秩和检验符号秩和检验(Wilcoxon 配对法配对法)符号秩和检验又称差数秩和检验符号秩和检验又称差数秩和检验符号秩和检验又称差数秩和检验符号秩和检验又称差数秩和检验基本思想基本思想基本思想基本思想: : 如果两个总体分布的位置相同如果两个总体分布的位置相同如果两个总体分布的位置相同如果两个总体分布的位置相同, , 那那那那么这些配对数值的差值应服从以么这些配对数值的差值应服从以么这些配对数值的差值应服从以么这些配对数值的差值应服从以0 0为中心的为中心的为中心的为中心的对称分布。对称分布。对称分布。对称分布。 * *如果差值不等于如果差值不等于如果差值不等于如果差值不等于0, 0, 但和但和但和但和0 0很近很近很近很近, ,那么就认那么就认那么就认那么就认为是随机因素引起为是随机因素引起为是随机因素引起为是随机因素引起的的的的; ; 如果差值很大如果差值很大如果差值很大如果差值很大, , 超出超出超出超出一定的界值范围一定的界值范围一定的界值范围一定的界值范围, , 那么就认为分布位置不同那么就认为分布位置不同那么就认为分布位置不同那么就认为分布位置不同3030 甲种香烟甲种香烟 乙种香烟乙种香烟2528232629222831303221272420例例8. 比较甲、乙两种香烟的尼古丁含量,对比较甲、乙两种香烟的尼古丁含量,对甲种香烟做了甲种香烟做了6次测定,对乙种香烟做了次测定,对乙种香烟做了8次,次,结果如下表,问两种香烟的尼古丁含量有无差结果如下表,问两种香烟的尼古丁含量有无差别?别?3131正态性检验正态性检验矩法矩法(1)偏度系数)偏度系数(2)峰度系数)峰度系数 H0: 1=0; 2= 0 H1: 1 0 ; 2 0 通常通常 = 0.103232图示法图示法P-P图,图,Q-Q图图3333( (二二) ) 计数资料的统计方法计数资料的统计方法 大大样本样本: u: u检验检验 小小样本样本: 配对配对 2检验检验成组成组 2检验检验多组多组 2检验检验 (RC表表)四格表的四格表的Fisher 确切概率法确切概率法秩和检验秩和检验 3434例例9. 某医生某医生用用A,B两种药物治疗急性下呼吸道感两种药物治疗急性下呼吸道感染。染。A药治疗药治疗74例,有效例,有效68例例; B药治疗药治疗63例,例,有效有效52例。问两种药物的有效率是否有差别例。问两种药物的有效率是否有差别?处理处理 有效有效 无效无效 合计合计 有效率有效率(%)A 药药 68 6 74 91.89B 药药 52 11 63 82.54合计合计 120 17 137 87.593535 例例10. 用两种不同的方法对用两种不同的方法对53例肺癌例肺癌患者进行诊断,资料见表。患者进行诊断,资料见表。 问两种检测问两种检测结果有无差别结果有无差别?甲甲 法法 + -乙乙 法法合计合计+ 25 (a) 2 (b) 27- 11 (c) 15 (d) 26合计合计 36 17 533636b+c40:当当 b+c40 时时, 用校正公式用校正公式. (McNemar 检验检验)3737例例11. 随机选择随机选择239例胃、十二指肠疾病患者和例胃、十二指肠疾病患者和187名名健康输血员,其血型分布见下表,问胃、十二指肠健康输血员,其血型分布见下表,问胃、十二指肠疾病患者和健康输血员血型分布有无差别?疾病患者和健康输血员血型分布有无差别?胃十二指肠疾病患者与健康输血员的血型分布胃十二指肠疾病患者与健康输血员的血型分布 分分 组组 A B AB O 合合 计计胃十二指肠疾病胃十二指肠疾病健康输血员健康输血员47 66 20 106 239 4852 54 19 62 187 合合 计计 99 120 39 168 426 3838例例12. 为了研究肺鳞癌中为了研究肺鳞癌中FHIT基因缺失与吸烟基因缺失与吸烟的关系的关系, 结果如下表结果如下表, 问肺鳞癌患者中有无吸问肺鳞癌患者中有无吸烟史与烟史与FHIT基因缺失率有无差别基因缺失率有无差别?吸烟史吸烟史 缺失缺失 无缺失无缺失 合计合计有有 11(a) 4(b) 15 无无 1(c) 5(d) 6 合计合计 12 9 21 n40 3939适用条件适用条件: (1) n40 或有理论数小于或有理论数小于1者者 (2) 用其他检验方法得到的用其他检验方法得到的P值接近值接近检验水准检验水准时 四格表的四格表的Fisher确切概率法确切概率法 4040(三三) 相关与回归相关与回归 1. 1. 简单直线相关与回归简单直线相关与回归 2. 2. 多重线性相关与回归多重线性相关与回归 3. Logistic回归回归 4141 1. 1. 直线相关与回归分析的基本思路直线相关与回归分析的基本思路直线相关与回归分析的基本思路直线相关与回归分析的基本思路 正态分布正态分布等级资料等级资料等级相关分析等级相关分析直线相关直线相关没有没有统计学意义统计学意义有有统计学意义统计学意义直线回归直线回归判断资料性质判断资料性质作作散点图散点图4242例例13. 为了研究空气中一氧化氮的浓度与汽车流量等为了研究空气中一氧化氮的浓度与汽车流量等因素的关系因素的关系,有人测定了某城市交通点在单位时间内有人测定了某城市交通点在单位时间内过往的汽车数、气温、空气湿度、风速以及空气中过往的汽车数、气温、空气湿度、风速以及空气中的浓度,数据见下表。的浓度,数据见下表。空气中空气中NO浓度与相关因素的监测数据浓度与相关因素的监测数据 车流车流 (X1) 气温气温(X2) 气湿气湿 (X3) 风速风速(X4) 一氧化氮一氧化氮(y)13001444786165217561754120015001200174620.023.026.523.029.530.022.521.827.027.0805764847276697758650.450.501.500.400.900.801.800.601.700.650.0660.0760.0010.1700.1560.1200.0400.1200.1000.1294343 2. 2. 多重线性回归与相关多重线性回归与相关4444例例14.14. 某研究着欲探讨影响儿童视力的危险因素某研究着欲探讨影响儿童视力的危险因素, ,调查调查了某中学了某中学6565名学生的视力和名学生的视力和7 7个可能影响视力的有关因个可能影响视力的有关因素。素。7 7个因素包括学习时的坐姿(个因素包括学习时的坐姿(X1X1)、平均每天看电)、平均每天看电视或玩游戏时间(视或玩游戏时间(X2X2)、每天睡眠时间()、每天睡眠时间(X3X3)、饮食)、饮食(X4X4)、连续用眼时间()、连续用眼时间(X5X5)、是否经常做保护眼睛)、是否经常做保护眼睛的活动(的活动(X6X6)和学习成绩()和学习成绩(X7X7),试分析影响学生视),试分析影响学生视力的主要因素。力的主要因素。视力状况及相关因素调查表视力状况及相关因素调查表 编号编号 X1 X2 X3 X4 X5 X6 X7 y12.646500.103540.707011.1021.1200.0100.0141.2400.1045453.Logistic 回归回归4.4. ( (logistic regression) ): 属于概率型属于概率型非线性回归非线性回归,是研究二分类观,是研究二分类观察结果与一些影响因素之间关系的一种多察结果与一些影响因素之间关系的一种多变量分析方法。变量分析方法。4646logistic回归模型:回归模型: 设设应变量应变量Y是一个二值变量,取值为是一个二值变量,取值为 Y=1 出现阳性结果(发病、有效、死亡等)出现阳性结果(发病、有效、死亡等) Y=0 出现阴性结果(未发病、无效、存活等)出现阴性结果(未发病、无效、存活等)另有影响另有影响Y取值的取值的m个自变量,则在个自变量,则在m个自变量的作个自变量的作用下阳性结果发生的概率等于:用下阳性结果发生的概率等于: 4747logisticlogistic回归的应用回归的应用1. 筛选危险因素:筛选危险因素:2. 校正混杂因素:校正混杂因素: 控制混杂因素的方法控制混杂因素的方法 设计阶段的设计阶段的 分层抽样和配对设计分层抽样和配对设计 分析阶段的分析阶段的 Mantel-Haenson分析方法分析方法,但该方法仅适用于,但该方法仅适用于2 2 k表的资料,不表的资料,不适用要分析的因素太多或是二分变量资料,适用要分析的因素太多或是二分变量资料,此时只能用此时只能用logistic回归分析。回归分析。3. 预测与判别:非条件预测与判别:非条件logistic回归可以用于个回归可以用于个体的预测分析。但条件体的预测分析。但条件logistic回归不行。回归不行。4848例例15. 某医学研究者研究人类乳头瘤病毒某医学研究者研究人类乳头瘤病毒(HPV)直直接检测法诊断子宫颈癌的价值接检测法诊断子宫颈癌的价值,以病理组织学结果以病理组织学结果为金标准为金标准,结果见下表,并知道当地女性人群中子结果见下表,并知道当地女性人群中子宫颈癌的患病率为宫颈癌的患病率为9.8/10万。请对该检查方法进行万。请对该检查方法进行评价。评价。HPV直接检测法诊断子宫颈癌的结果直接检测法诊断子宫颈癌的结果 病理组织学病理组织学HPV直接检测法直接检测法 + - +-55(a)49(c) 7(b)84(d)合合 计计 62(a+b)133(c+d)合计合计104 (a+c) 91 (b+d) 195(a+b+c+d) 49491. 真实性真实性 (validity) 效度或准确性效度或准确性(accuracy) 指测量值与实际值相符合的程度指测量值与实际值相符合的程度评价真实性的指标评价真实性的指标:(四四) 临床诊断试验的评价临床诊断试验的评价 2. 可靠性可靠性 (reliability)3. 预测值预测值 (predictive value, PV)5050医学科研医学科研统计学质量主要取决于统计学质量主要取决于统计研究设计质量统计研究设计质量*资料的收集、整理、表达和描述质量资料的收集、整理、表达和描述质量资料的统计分析质量资料的统计分析质量*计算结果的解释质量计算结果的解释质量第三节第三节 医学科研统计学质量医学科研统计学质量5151一、医学文献质量一、医学文献质量 国内:国内: 我国生物医学类期刊所发表的论文,其统计学我国生物医学类期刊所发表的论文,其统计学误用率基本保持在误用率基本保持在9090左右左右(审稿者)(审稿者) 杂志级别不同,错误率不同杂志级别不同,错误率不同 我国生物医学期刊统计学质量不高我国生物医学期刊统计学质量不高 国内已发表的医学论文的统计学错误的研究国内已发表的医学论文的统计学错误的研究发现发现, , 其其错误率达错误率达80%80%以上以上(调查者)(调查者)5252国外:国外: 6060年代到年代到8080年代,国外医学杂志调查结果:年代,国外医学杂志调查结果:有统计错误的论文有统计错误的论文20%20%72%72%。甚至连甚至连 Nature Medicine Nature Medicine 这样公认权这样公认权威的杂志统计学错误率也达威的杂志统计学错误率也达38%38%。5353SCISCI正面临的尴尬局面:正面临的尴尬局面: SCISCI收录的期刊也时常刊登有统计学错误的论文收录的期刊也时常刊登有统计学错误的论文 论文的结论经不起时间考验:论文的结论经不起时间考验: 调查发现在调查发现在1990199020032003年间发表在年间发表在“新英格兰杂志(新英格兰杂志(N N EnglEngl J Med) J Med)”“”“美国医学会杂志(美国医学会杂志(JAMAJAMA)”“”“柳叶刀柳叶刀(LancetLancet)”三大著名医学杂志上的且引用次数在三大著名医学杂志上的且引用次数在10001000次以次以上的文献,有近上的文献,有近1/31/3的研究没有经受住时间考验。的研究没有经受住时间考验。 论文中出现严重的学术造假论文中出现严重的学术造假: : 5454二、临床科研中常见的统计问题二、临床科研中常见的统计问题 1. 1. 统计检验方法选择错误统计检验方法选择错误 t 检验误用于多组资料比较检验误用于多组资料比较 成组成组t 检验与配对检验与配对t 检验误用检验误用 对于偏态分布的数据采用对于偏态分布的数据采用t 检验或方差分析检验或方差分析 四格表的四格表的 2检验误用、率和构成比误用检验误用、率和构成比误用 5555某科研人员为了研究某科研人员为了研究A A、B B两种药物的疗效,设计两种药物的疗效,设计了如下实验。共设立了了如下实验。共设立了4 4个组,每组个组,每组2020只小白鼠,只小白鼠,观测的定量指标为血小板、白细胞等。所设的观测的定量指标为血小板、白细胞等。所设的4 4个个组如下,请问这样设计是否合理?组如下,请问这样设计是否合理?例例1第一组:空白对照;第一组:空白对照;第二组:单用第二组:单用A A药组;药组;第三组:第三组:A A、B B药联合使用组;药联合使用组;第四组:第三组的空白对照第四组:第三组的空白对照答案:答案: 不合理,对照不全不合理,对照不全 5656合理的设计合理的设计 :A A、B B药物疗效比较药物疗效比较 A A药药. .B B药药 用用 不用不用 用用不用不用 (A AB B)药组)药组 A A药组药组 B B药组药组 空白对照组空白对照组 2 22 2 析因设计析因设计 5757肝炎灵联合丹参注射液治疗慢性乙型肝炎肝炎灵联合丹参注射液治疗慢性乙型肝炎6060例例一文其设一文其设计如下:慢性乙型肝炎病人随机分为两组,计如下:慢性乙型肝炎病人随机分为两组,治疗组治疗组6060例接受例接受肝炎灵与丹参注射液联合治疗;肝炎灵与丹参注射液联合治疗;对照组对照组4444例接受肌苷、维生例接受肌苷、维生素素C C治疗。两组在性别、年龄、病程、病情等方面均无显著治疗。两组在性别、年龄、病程、病情等方面均无显著差异。比较两组肝功能指标恢复正常率,得出结论是两药联差异。比较两组肝功能指标恢复正常率,得出结论是两药联合应用治疗慢性乙型肝炎有良好的协同作用。合应用治疗慢性乙型肝炎有良好的协同作用。例例2 2 对照组的设立与实验设计的目的不符对照组的设立与实验设计的目的不符 试验组:肝炎灵丹参试验组:肝炎灵丹参对照组:肝炎灵安慰剂对照组:肝炎灵安慰剂 丹参是否能提高丹参是否能提高肝炎灵疗效?肝炎灵疗效?5858用描述正态分布的统计指标描述偏态分布资料用描述正态分布的统计指标描述偏态分布资料 例例3 3 5959例例4 4 血清肿瘤标志在直肠癌诊断中的作用血清肿瘤标志在直肠癌诊断中的作用一文:为研究一文:为研究CEACEA、CA19-9CA19-9、CA72-4CA72-4和和CA242CA242共共4 4项肿瘤标志在患者术前、项肿瘤标志在患者术前、术后及转移复发有无差异,分别检测了术后及转移复发有无差异,分别检测了5858名手术前患者,名手术前患者,3030名手术后患者及名手术后患者及1919名转移复发患者,测量其名转移复发患者,测量其4 4项指标,项指标,并进行并进行t t检验,结果见下表。问分析方法是否恰当?检验,结果见下表。问分析方法是否恰当?表表 手术前后手术前后4 4项肿瘤标志检测结果(项肿瘤标志检测结果( s s) 不同时期不同时期 CEACEA( g/Lg/L) CA19CA199 9(10103 3U/LU/L) CA72CA724 4(103U/L/L) CA242CA242(103U/L/L) 术前(术前(n=58n=58)术后(术后(n=30n=30)转移复发(转移复发(n=19n=19)34.034.079.079.02.02.01.2*1.2*88.088.0107.0107.0209.0209.0739.0739.011.011.010.9*10.9*212.0212.0529.0529.07.27.24.84.84.34.32.8*2.8*9.89.83.23.2111.0111.0179.0179.010.810.817.5*17.5*148.0148.0240.0240.0与术前组相比较,与术前组相比较,* *:P0.05; *: P0.01P0.05; *: P0.01忽视忽视t t 检验、方差分析的条件检验、方差分析的条件 6060例例5 5 含结核清和含对氨基水杨酸钠方案治疗耐多药肺结核疗效含结核清和含对氨基水杨酸钠方案治疗耐多药肺结核疗效分析分析一文:有人研究含结核清(一文:有人研究含结核清(DPCDPC)方案和含对氨基水杨)方案和含对氨基水杨酸钠(酸钠(p p)方案治疗耐多药肺结核,比较静脉炎副作用的发生)方案治疗耐多药肺结核,比较静脉炎副作用的发生率,见下表。率,见下表。原作者采用一般原作者采用一般 2 2 检验,检验, 2 2 5.145.14,P0.05P0.05,因而认为两种方案在静脉炎副作用发生率上的差异有统计,因而认为两种方案在静脉炎副作用发生率上的差异有统计学意义。学意义。表表 两组病人静脉炎发生情况两组病人静脉炎发生情况 治疗方案治疗方案 例数例数 发生静脉炎与否:发生静脉炎与否: 发生发生 未发生未发生 DPCDPCP P 0 220 22 3 11 3 11误用误用 2 2 检验取代检验取代FisherFisher精确概率检验精确概率检验 6161例例6 6 果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效观察果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效观察一文:为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病一文:为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,随机分为观察组和对照组,观察组用果糖二磷酸的疗效,随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞二磷胆碱。治疗效果分为无效、有效和显钠,对照组用胞二磷胆碱。治疗效果分为无效、有效和显效效3 3个等级,见下表。个等级,见下表。原作者进行一般原作者进行一般 2 2 检验检验, 2 2 4.744.74,P0.05P0.05,认为两组疗效之间的差异有统计学意义。,认为两组疗效之间的差异有统计学意义。表表 观察组和对照组疗效比较观察组和对照组疗效比较 组别组别 疗效疗效 显效显效 有效有效 无效无效 观察组观察组对照组对照组5858 44 18 44 1856 43 3556 43 35误用误用 2 2 检验分析单向有序的列联表资料检验分析单向有序的列联表资料 6262例例7 7 老年患者静脉保护措施应用的临床观察老年患者静脉保护措施应用的临床观察一文:原作者将一文:原作者将内科住院的老年患者随机分成对照组和实验组,每组内科住院的老年患者随机分成对照组和实验组,每组100100例。例。对照组输液操作按照对照组输液操作按照医疗护理技术操作常规医疗护理技术操作常规密闭式输液密闭式输液术的要求;实验组在此基础上实施系统性静脉保护措施。观术的要求;实验组在此基础上实施系统性静脉保护措施。观察液体外渗、静脉炎及血栓性静脉炎等并发症情况(下表)。察液体外渗、静脉炎及血栓性静脉炎等并发症情况(下表)。结果显示:实验组结果显示:实验组3 3项并发症的发生率明显低于对照组,经项并发症的发生率明显低于对照组,经t t检验,检验,t=2.996,P0.005t=2.996,P0.005,差异有统计学意义。,差异有统计学意义。表表 实验组对照组静脉输液并发症发生情况比较实验组对照组静脉输液并发症发生情况比较 液体外渗液体外渗 静脉炎静脉炎 血栓性静脉炎血栓性静脉炎 合计(例)合计(例) 实验组实验组对照组对照组2 2 2 0 4 2 0 421 28 8 57 21 28 8 57 误用误用t t 检验处理定性资料检验处理定性资料 6363例例8 8 丙型肝炎特异性诊断的比较及其意义探讨丙型肝炎特异性诊断的比较及其意义探讨一一文,原作者对四种丙型肝炎特异性诊断方法进行文,原作者对四种丙型肝炎特异性诊断方法进行了比较,见下表:了比较,见下表:表表 4 4种方法对种方法对104104例静脉药瘾者检测结果例静脉药瘾者检测结果 Abbott CP9 GOR PCR Abbott CP9 GOR PCR 阳性阳性阴性阴性合计合计 72 67 52 48 72 67 52 48 32 37 52 56 32 37 52 56104104 104 104 104104 104104105105 69.2 64.4 50 46 69.2 64.4 50 46表格不规范,横纵标目不符合一般阅读习惯表格不规范,横纵标目不符合一般阅读习惯 6464修改表修改表 4 4种方法对种方法对104104例静脉药瘾者检测结果例静脉药瘾者检测结果 AbbottCP9GORPCR检测方法检测方法 阳性阳性 阴性阴性 合计合计 检出率()检出率()7272676752524848323237375252565610410410410410410410410469.269.264.464.450.050.046.246.2检测结果检测结果 65652. 2. 相关与回归分析常见错误相关与回归分析常见错误 专业上无关联的变量作相关与回归专业上无关联的变量作相关与回归 将变量的统计学关系解释为专业上的联系将变量的统计学关系解释为专业上的联系 利用回归预测时,随意将范围扩大利用回归预测时,随意将范围扩大 用直线回归方程描述呈明显曲线变化趋势用直线回归方程描述呈明显曲线变化趋势 的实验资料的实验资料 6666例例9 9 某人在北京郊区调查居民被狗咬伤的情况,结果显示:各年某人在北京郊区调查居民被狗咬伤的情况,结果显示:各年龄组中被狗咬伤的百分率是不同的,即:年龄由小到大,被龄组中被狗咬伤的百分率是不同的,即:年龄由小到大,被狗咬伤的百分率依次为:很小、较小、较大、很大、较大、狗咬伤的百分率依次为:很小、较小、较大、很大、较大、较小、很小、较大。原作者的一个惊人的发现是:年龄与百较小、很小、较大。原作者的一个惊人的发现是:年龄与百分率之间的分率之间的相关系数相关系数r r0.99560.9956,p0.0001p0.0001,因此拟合的直,因此拟合的直线回归方程也是有非常统计学意义的。故原作者认为:在所线回归方程也是有非常统计学意义的。故原作者认为:在所调查的市郊,被狗咬者的年龄与被狗咬伤的百分率之间有很调查的市郊,被狗咬者的年龄与被狗咬伤的百分率之间有很好的线性关系,可用此直线回归方程来预测该地任何一位居好的线性关系,可用此直线回归方程来预测该地任何一位居民被狗咬伤的概率,以便提醒人们外出时携带必要的防身器民被狗咬伤的概率,以便提醒人们外出时携带必要的防身器械,要加倍小心,尽可能减少被狗咬伤的机会。械,要加倍小心,尽可能减少被狗咬伤的机会。年龄与犬咬率之间有直线回归关系吗?年龄与犬咬率之间有直线回归关系吗? 67673. 3. 多因素分析时常见错误多因素分析时常见错误 选用方法不当(多元、选用方法不当(多元、logisticlogistic、CoxCox) 自变量为多分类变量时,未设指示变量自变量为多分类变量时,未设指示变量 自变量高度相关时,忽视了多重共线性自变量高度相关时,忽视了多重共线性 68684. P 0.05时时?统计学意义统计学意义专业意义专业意义检验效能?检验效能? 6969例例10 10 心律平与异搏定治疗阵发性室上性心动过速心律平与异搏定治疗阵发性室上性心动过速一文:采一文:采用心律平和异搏定分别治疗室上性心动过速各用心律平和异搏定分别治疗室上性心动过速各1515例,心律例,心律平组显效平组显效1010例,有效例,有效4 4例,总有效率例,总有效率93.393.3,异搏定组显,异搏定组显效效9 9例,有效例,有效4 4例,总有效率例,总有效率86.686.6,两组总有效率经统计,两组总有效率经统计学计算相差无显著性学计算相差无显著性(P0.05P0.05),),显示应用心律平和异搏显示应用心律平和异搏定治疗阵发性心动过速疗效无显著差异。定治疗阵发性心动过速疗效无显著差异。心律平与异搏定治疗效果比较心律平与异搏定治疗效果比较 显效显效 有效有效 有效率()有效率()组别组别 心律平(心律平(n=15)异搏定(异搏定(n=15) 10 4 93.3 10 4 93.3 9 4 86.6 9 4 86.6检验效能:检验效能:1 1 0.08850.08858.858.85 7070提高临床科研论文质量的关键提高临床科研论文质量的关键- - 研究设计(研究设计(DesignDesign)测量测量 (MeasurenmentMeasurenment)评价(评价(EvaluationEvaluation) 临床流行病学临床流行病学 流行病学流行病学 循证医学循证医学 (evidence- based medicine, EBM) 科研设计科研设计 71717272
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号