资源预览内容
第1页 / 共44页
第2页 / 共44页
第3页 / 共44页
第4页 / 共44页
第5页 / 共44页
第6页 / 共44页
第7页 / 共44页
第8页 / 共44页
第9页 / 共44页
第10页 / 共44页
亲,该文档总共44页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
医学统计学MedicalStatistics000002Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望第一节、统计学与医学统计学方法第一节、统计学与医学统计学方法统计学的定义:统计学的定义:统计学是运用概率论和数理统计的原理统计学是运用概率论和数理统计的原理和方法,研究数据资料的和方法,研究数据资料的收集收集、整理整理、分析分析和和推断推断,从而反映事物内在规律的,从而反映事物内在规律的一门学科一门学科。医学统计学:医学统计学:用统计学的方法和原理对医学数据的研用统计学的方法和原理对医学数据的研究的学科究的学科。 医学研究医学研究以生物或人为对象以生物或人为对象研究疾病的表现研究疾病的表现诊断、临床表现诊断、临床表现特征、规律特征、规律药物疗效、药物疗效、方法的比较方法的比较病因及预病因及预后因素后因素结论指导结论指导医疗工作医疗工作统计学工具统计学工具特征:变异性和不确定性(随机性)特征:变异性和不确定性(随机性)决策和评价?决策和评价?例:为鉴别胃癌、胃炎、非胃病患者,测例:为鉴别胃癌、胃炎、非胃病患者,测定了各定了各50名铜兰蛋白(名铜兰蛋白(X1)、兰色反应)、兰色反应(X2)等指标,观察结果如下)等指标,观察结果如下胃癌胃癌(X1) 228 235 143 187 250 胃炎胃炎(X1) 100 153 178 143 200 非胃病非胃病(X1) 98 123 170 100 120 .胃癌胃癌(X2) 134 167 156 1 21 187 150 胃炎胃炎(X2) 125 135 148 170 200 非胃病非胃病(X2) 198 185 147 105 102 .问:问:三种人的三种人的X1、X2指标有无不同指标有无不同?心肌梗塞患者各预后因素与发心肌梗塞患者各预后因素与发生心性意外的关系生心性意外的关系对对116名心梗患者发生或不发生心性意名心梗患者发生或不发生心性意外的外的22个可能因素做观察和记录。个可能因素做观察和记录。预后因素:年龄、高血压病、前壁心梗、预后因素:年龄、高血压病、前壁心梗、Killip分级、传导阻滞、溶栓治疗分级、传导阻滞、溶栓治疗.等。等。研究目的:哪些预后因素与发生心性意研究目的:哪些预后因素与发生心性意外有关系?关系的强度?外有关系?关系的强度? 统计学研究对象统计学研究对象研究对象研究对象的特点:的特点:(1)在同质的基础上)在同质的基础上(2)有一定的数量观察对象)有一定的数量观察对象 结论结论:(重复观测)(重复观测)用统计学的方法,通过对一定数量的个用统计学的方法,通过对一定数量的个体值的观察,透过偶然现象,体值的观察,透过偶然现象,定量定量的揭的揭示医学现象的规律性,为认识事物的本示医学现象的规律性,为认识事物的本质提供科学的方法和依据质提供科学的方法和依据。医学科研工作必须借助统计学这个工具医学科研工作必须借助统计学这个工具1.统计设计统计设计:如何科学、合理地安排实验:如何科学、合理地安排实验和观察性研究,以正确的方式收集数据和观察性研究,以正确的方式收集数据资料(资料(对象的定义、获取、分组、偏差控制)对象的定义、获取、分组、偏差控制)。2.统计描述统计描述:描述数据的基本特征和规律。:描述数据的基本特征和规律。3. 假设检验假设检验:对不同组间实验和观察结:对不同组间实验和观察结果的差异作出统计推断。果的差异作出统计推断。4. 事物关系测定事物关系测定:研究疾病与影响因素:研究疾病与影响因素的关系及数学模型,对疾病的预后做出的关系及数学模型,对疾病的预后做出预测。预测。第二节第二节 统计学的基本概念统计学的基本概念 (几个常用名词)(几个常用名词)实验与观察研究实验与观察研究实验研究:研究者人为施加某种实验研究:研究者人为施加某种措施于研究对象(如一组用甲药,措施于研究对象(如一组用甲药,一组用乙药),比较措施的效果。一组用乙药),比较措施的效果。观察研究:研究者只是客观的记观察研究:研究者只是客观的记录研究对象的情况(如血压、年录研究对象的情况(如血压、年龄、病情等),了解现况。龄、病情等),了解现况。随机现象是一种带有偶然性的现象,它使随机现象是一种带有偶然性的现象,它使其事物具有某种不确定性状态;是由许多其事物具有某种不确定性状态;是由许多错综复杂、而且作用微小以致容易被忽视错综复杂、而且作用微小以致容易被忽视因素左右,使其必然性被掩盖因素左右,使其必然性被掩盖。随机现象的表现称为随机变量(用随机现象的表现称为随机变量(用X表示)表示)医学中许多现象为随机现象。医学中许多现象为随机现象。随机变量(随机变量(X)的特点)的特点1.X的取值:的取值:不能事先确定;取值波动在一定范围内;不能事先确定;取值波动在一定范围内;各种取值的出现服从一定概率分布。各种取值的出现服从一定概率分布。2.变量的类型:变量的类型:1)连续型变量()连续型变量(continuous variable) 在一定区间变量取值为无限个。在一定区间变量取值为无限个。2)离散型变量()离散型变量( discrete variable)在一定区间变量取值为有限个,可列举。在一定区间变量取值为有限个,可列举。某地某地151例正常成人腋下体温值的分布例正常成人腋下体温值的分布0 1 2 3 0.1-0.2-0.3-0.4-0.00 2 4 6 8n=10, =0.3P(x)n=3, =0.80.00.1-0.2-4 8 12 16n=20, =0.5 4 8 12 16 20n=30, =0.3XXP(X) ( ,n)误差(误差(error):观察结果值与真值之差):观察结果值与真值之差变量值或数据(变量值或数据(data)有变异是统计数据)有变异是统计数据的特征。的特征。个体间变量值个体间变量值变异的主要来源:变异的主要来源:1.随机误差(生物变异)随机误差(生物变异)2.系统误差(偏倚(系统误差(偏倚(bias)反映数据反映数据的质量的质量随机误差随机误差 非随机误差非随机误差(系统误差)(系统误差)过失误差过失误差 :如记:如记录、操作等人为录、操作等人为因素。因素。病例选择、仪器、病例选择、仪器、方法的不一致、对方法的不一致、对试验组结果的期望试验组结果的期望原因原因未知众多微小因素未知众多微小因素所引起数据的变异所引起数据的变异医学中主要是个体差异医学中主要是个体差异避免否避免否不能不能可控制可控制而缩小而缩小 (一)观察数据的原始记录分类(一)观察数据的原始记录分类1.分组因素数据(可能有关因素):如分组因素数据(可能有关因素):如不同用药、方法、不同用药、方法、 不同病情、性别、不同病情、性别、疾病类型、年龄。疾病类型、年龄。2.结果反应变量(结果反应变量(outcome)数据:如)数据:如疗效、是否某病等。疗效、是否某病等。表 100例高血压患者治疗后临床记录例高血压患者治疗后临床记录患者患者 年龄年龄 性别性别 治疗组治疗组 舒张压舒张压 体温体温 疗效疗效编号编号 X1X1 X2X2 X3 X3 X4 X5X4 X5 X6X6 1 37 男男 A 11.27 37.5 显效显效 2 45 女女 B 12.53 37.0 有效有效 3 43 男男 A 10.93 36.5 有效有效 4 59 女女 B 14.67 37.8 无效无效 。100 54 男男 B 16.80 37.6 无效无效(二)原始数据的类型统计上定义为:(二)原始数据的类型统计上定义为:1.计量(计量(quantitative)数据)数据:研究对象的研究对象的指标(变量值)表现为有数字大小和单位指标(变量值)表现为有数字大小和单位的数据的数据,又称计量资料又称计量资料.(1)连续变量)连续变量:身高值身高值 (cm) :1.65,1.70 1.58 . 体重值体重值 (kg): 52,55,61. (2)比率变量)比率变量脑电图波形变化率(脑电图波形变化率(%):):29%,37%.2. 分类数据(分类数据(categorical) :变量值表现为按某属性划分的定性类别。清点各变量值表现为按某属性划分的定性类别。清点各类别个数后得到的资料称计数资料类别个数后得到的资料称计数资料。数据表现(名义变量和分类变量):数据表现(名义变量和分类变量): 两分类数据:两分类数据: 阳性或阴性;存活或死亡;有效或无效,阳性或阴性;存活或死亡;有效或无效, 性别:男性或女性(名义变量)性别:男性或女性(名义变量)多分类数据:如血型:多分类数据:如血型:O ,A,B,AB计数资料(血型)计数资料(血型) 100 52 78 323. 等级数据(等级数据(ordinal data):变量值按变化程度大小划分得到的分类,变量值按变化程度大小划分得到的分类,清点各分类的个数后得到的资料称为半计清点各分类的个数后得到的资料称为半计量或等级资料。量或等级资料。例:病情分级(例:病情分级(1):): , , 疗效(疗效(X):痊愈、显效、有效、无效):痊愈、显效、有效、无效病人满意度(病人满意度(X):): 好、中、差好、中、差 人数人数 50 25 5数据类型及赋值数据(变量)类型数据(变量)类型 变量的表现变量的表现1.计量变量:计量变量: 血压值:血压值:12.3kap2.分类(定性)分类(定性) 1)两分类:)两分类: 疗效:有效疗效:有效=1,无效,无效=0 性别:男性别:男=1,女,女=2 2)多分类(无序):例:副作用(有重复选)多分类(无序):例:副作用(有重复选择)择)3.等级(有序)等级(有序)疗效:疗效:痊愈痊愈=4、显效、显效=3、有效、有效=2、无效、无效=1例:例:105人心脏外科病人心理反应情况人心脏外科病人心理反应情况心理反应心理反应 病例病例 百分比百分比 反应发生率反应发生率症状症状 数数 (%) (%)焦虑焦虑 102 58.6 97.14抑郁抑郁 57 32.8 54.28自我认同紊乱自我认同紊乱 10 5.7 9.52恐惧恐惧 5 2.9 4.76合计合计 174 100.0 原测量原测量转换结果转换结果血压(血压(kPa)正常、可疑、异常正常、可疑、异常年龄(岁)年龄(岁) 60岁,岁, 60岁岁优、良、中、差优、良、中、差9-10分,分,7-8分,分,5-6分,分,4-1分分四、样本与总体四、样本与总体(Sample and Population)总体总体:根据研究的目的,确定根据研究的目的,确定研究对象的研究对象的某指标(变量)值的全体某指标(变量)值的全体。有限总体有限总体:总体中的研究对象为总体中的研究对象为N个,是个,是可以全部获得的(可一一编号)可以全部获得的(可一一编号)。无限总体无限总体:总体中研究对象是不可能全部总体中研究对象是不可能全部获得,为一假设的总体。获得,为一假设的总体。(例:某药治疗高血压病的疗效)(例:某药治疗高血压病的疗效)样本样本:从总体中从总体中随机随机抽取抽取有代表性有代表性的部分研究对的部分研究对象的观察值(数据)所组成,称为样本。观察对象的观察值(数据)所组成,称为样本。观察对象的个数称为样本例数(象的个数称为样本例数(n)。)。*抽样框架抽样框架:对有限总体的每个观察对象编号:对有限总体的每个观察对象编号(1-N),可在总体内实现随机抽样。),可在总体内实现随机抽样。抽样研究目的:用样本观察值的结论抽样研究目的:用样本观察值的结论 推论总体的情况推论总体的情况例:HBsAg阳性与肝癌发生率的关系阳性与肝癌发生率的关系组别人数组别人数 肝癌人数发生率肝癌人数发生率HBsAg组+3454 40 11.58HBsAg组 -19252 1 0.052结论:结论:HBsAg阳性更容易患肝癌,其发生肝阳性更容易患肝癌,其发生肝癌的机会明显大于阴性人群。癌的机会明显大于阴性人群。样本样本3454例BsAg阳性和19252 例HBsAg阴性的人阴性的人群,随访观察群,随访观察总体总体HBsAg阳性和阳性和HBsAg阴性的阴性的人群人群结论结论抽样抽样参数参数(Parameter):总体中全部变量):总体中全部变量值所得的特征值(如疾病的发生率、平值所得的特征值(如疾病的发生率、平均水平),参数为一常数。均水平),参数为一常数。统计量统计量(Statistic):通过样本观察值):通过样本观察值计算的指标值(样本的平均数、发生率)计算的指标值(样本的平均数、发生率),统计量为有变异数。,统计量为有变异数。样本指标样本指标 为总体参数的估计值为总体参数的估计值抽样误差抽样误差(sampling error):样本数):样本数据的统计量与总体参数的差异。据的统计量与总体参数的差异。概率概率:某事件发生的可能性,统计中用某事件发生的可能性,统计中用P表表示。随机事件发生概率在示。随机事件发生概率在0-1间。间。频率频率:独立重复独立重复n次事件,结果次事件,结果A在在n次中出次中出现的比例。现的比例。二者的关系:二者的关系:在在n,频率(样本)频率(样本)概率(总体)概率(总体)。用途:用途:1)医学中常用频率作为概率的估计)医学中常用频率作为概率的估计值。值。2)统计结论是建立在概率的基础上)统计结论是建立在概率的基础上。根据研究的目的根据研究的目的1.研究研究设计设计2.收集收集资料资料3.整理整理资料资料4.分析分析资料资料研究对象、研究对象、指标、例指标、例数、如何数、如何准确得到准确得到数据数据。来源来源:1.日常工作日常工作记录、病历。记录、病历。2.专门的调专门的调查和实验查和实验。目的目的:使资料系使资料系统化,便统化,便于进一步于进一步统计分析统计分析方法方法:用统计方用统计方法分析资法分析资料,阐述料,阐述规律性,规律性,得出结论得出结论。设计考虑设计考虑:第二章、统计描述第二章、统计描述统计方法简介统计方法简介数据的统计处理方法:数据的统计处理方法: 统计描述方法统计描述方法 1.计量数据的统计描述计量数据的统计描述 2. 分类(有序、无序)的统计描述分类(有序、无序)的统计描述数据的组间比较方法数据的组间比较方法 1. 计量数据的比较:计量数据的比较:t、方差分析、方差分析 2. 计数数据的组间比较:卡方检验计数数据的组间比较:卡方检验第一节、计量资料的统计描述第一节、计量资料的统计描述统计描述:统计描述: 1.数据分布特征的描述数据分布特征的描述(频数表,讲义第(频数表,讲义第11页)页) 2.统计指标(均数、变异指标)的统计指标(均数、变异指标)的描述描述表表 100例高血压患者治疗后临床记录例高血压患者治疗后临床记录编号编号 年龄年龄 性别性别 治疗治疗 舒张压舒张压 体温体温 疗效疗效 (岁)(岁) 分组分组 (kPa)(度)(度) 1 37 男男 A 11.27 37.5 显效显效 2 45 女女 B 12.53 37.0 有效有效 3 43 男男 A 10.93 36.5 有效有效 4 59 女女 B 14.67 37.8 无效无效 。100 54 男男 B 16.80 37.6 无效无效方法方法将变量值分为不同的组段,清点各组将变量值分为不同的组段,清点各组段的例数,了解变量值在各组段中段的例数,了解变量值在各组段中例数例数的的分布分布,变量值在不同组段意义是不同的,变量值在不同组段意义是不同的。 某门课的考试成绩某门课的考试成绩 组段(分)组段(分) 例数(例数(f) 60- 1 70- 5 80- 30 90- 6 合计合计 42例:表例:表2-1,160名正常女子的血清甘油三酯数名正常女子的血清甘油三酯数据据编制频数表的步骤:编制频数表的步骤:1.确定全距(确定全距(R)=最大值最大值 最小值最小值2.定组段数(定组段数(8-15组)和组距:组)和组距:3.写出组段:第写出组段:第1组段值小于或等于最小值,并组段值小于或等于最小值,并以整数(以整数(0,5或或2,4,6,8)较好。)较好。4.划计并计数(见表划计并计数(见表2-2,图,图2-1)组距(组距(i)=全距(全距(R)/组段数组段数表表2-2、160名正常成年女性血清甘油三酯分布名正常成年女性血清甘油三酯分布组段组段 频数(频数(f) %0.5- 3 1.870.6- 9 5.620.7- 12 7.500.8- 13 8.120.9- 17 10.61.0- 18 11.21.1- 20 12.51.2- 18 11.21.3- 17 10.61.4- 13 8.121.5- 9 5.621.6- 8 5.001.7- 3 1.87合计合计 160 100.0计量资料分布的统计描述计量资料分布的统计描述:通过通过频数表频数表描述数据的分布特征描述数据的分布特征。内容:内容:X值分布情况:偏态或正态分布值分布情况:偏态或正态分布取值情况:变量值取值范围取值情况:变量值取值范围集中趋势:变量值集中位置集中趋势:变量值集中位置近似正态分布负偏态分布负偏态分布表表1-6资料出院患者住院天数的频数表资料出院患者住院天数的频数表组段(天)组段(天) 频数(频数(f) 0- 6 5- 2110- 1415- 1320- 625- 230- 335- 140及以上及以上 13合计合计 79SHIFT 第二功能键第二功能键MODE 计算模式选择键计算模式选择键LR 计算相关回归选择键计算相关回归选择键SD 统计功能选择键统计功能选择键Min 单独数据储存键单独数据储存键MR 取出储存数据键取出储存数据键Kin(1-6)单独数据储存键)单独数据储存键Kout(1-6)取出储存数据键)取出储存数据键X2 数据平方键数据平方键1/X 倒数键倒数键Log 以以Log 10 的对数键的对数键10x 反对数键反对数键+/- 数据的正负符号键数据的正负符号键本节的作业和思考题本节的作业和思考题练习一练习一 第题(第题(31页)页)指出该数据的总体、样本指出该数据的总体、样本该数据的资料类型是什么?该数据的资料类型是什么?该数据间的的误差(差异)可能是什么原该数据间的的误差(差异)可能是什么原因?因?编制该数据的频数分布表并做简单描述编制该数据的频数分布表并做简单描述。CASIO FX-100W计算器计算器FX100计算器统计功能计算计算器统计功能计算步骤步骤 说明说明1. MODE MODE 1 进入统计功能模式进入统计功能模式2.SHIFT AC = 清除数据清除数据3. 55 M+ 数据输入数据输入 54 M+ 58 M+4 SHIFT 1 = 显示均数显示均数5. SHIFT 3 = 显示标准差(显示标准差(S)6. RCL C 显示例数显示例数7. RCL B 显示显示 二、频数表统计功能计算二、频数表统计功能计算例数较多时计算均数例数较多时计算均数方法方法1:例:例:X(年龄)(年龄) 20 23 25 f: 10 5 3步骤同前:步骤同前:数据输入:数据输入:20 SHIFT , 10 M+ 23 SHIFT , 5 M+ 25 SHIFT , 3 M+步骤同前:步骤同前:
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号