资源预览内容
第1页 / 共35页
第2页 / 共35页
第3页 / 共35页
第4页 / 共35页
第5页 / 共35页
第6页 / 共35页
第7页 / 共35页
第8页 / 共35页
第9页 / 共35页
第10页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
预防医学预防医学 福医卫生统计系福医卫生统计系 林征林征 第六章:医学统计学方法的第六章:医学统计学方法的 基本概念和步骤基本概念和步骤第六章提纲第六章提纲n医学统计学的概念医学统计学的概念n统计学的基本概念统计学的基本概念n统计工作的基本步骤统计工作的基本步骤n医学统计学的学习要求医学统计学的学习要求一、医学统计学的概念一、医学统计学的概念n日常生活中的统计学应用日常生活中的统计学应用n如何判断药物的疗效?如何判断药物的疗效?( (假设检验假设检验) )n体育彩票能否中大奖?(概率论)体育彩票能否中大奖?(概率论)n子女为什么象父母,有多象?子女为什么象父母,有多象?( (相关与回归相关与回归) )n政治人物的支持度,民意测验政治人物的支持度,民意测验( (设计设计, ,抽样抽样) )n不同民族智商测量、税收标准(均数)不同民族智商测量、税收标准(均数)一、医学统计学的概念一、医学统计学的概念n统计学的概念:统计学的概念: Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of numerical datan医学统计学的概念:医学统计学的概念:是应用数统计学的原理与是应用数统计学的原理与方法研究方法研究生物医学领域(临床和基础医学领域)生物医学领域(临床和基础医学领域)中数据的收集、整理、分析和推断的一门科学中数据的收集、整理、分析和推断的一门科学 一、医学统计学的概念一、医学统计学的概念n医学专业学生为何需要学习统计学?医学专业学生为何需要学习统计学?n医学的特点:存在着大量变异、不确定性医学的特点:存在着大量变异、不确定性 的量化学科的量化学科n在医学实践中大量应用医疗经验;在医学实践中大量应用医疗经验;50% of 50% of what you learn about therapy in the next 5 years is what you learn about therapy in the next 5 years is wrong wrong,the trouble is we dont know which 50%the trouble is we dont know which 50%n医学研究结果的科学解释医学研究结果的科学解释 A surgeon had a mortality of 66% for a heart operation inA surgeon had a mortality of 66% for a heart operation in children less than one year old. Nationally the mortality children less than one year old. Nationally the mortality rate for this operation in this age group was 16/123 = 13%rate for this operation in this age group was 16/123 = 13% He may be unlucky. He may be unlucky. He may be operating on more severe casesHe may be operating on more severe casesHe may only have done a few operations.He may only have done a few operations.For example 2/3 is 66%.For example 2/3 is 66%.二、统计学的基本概念统计学的基本概念n变量、变量值及其分类变量、变量值及其分类n同质、异质与变异同质、异质与变异n个体、总体与样本个体、总体与样本n参数与统计量参数与统计量n误差误差n频率与概率频率与概率变量与变量值变量与变量值n在医学研究中,根据研究目的的要求对在医学研究中,根据研究目的的要求对一些观察项目或研究指标在一些研究对一些观察项目或研究指标在一些研究对象中进行观察象中进行观察(或测量或测量),由于这些指标存,由于这些指标存在着变异,故把这些观察项目或研究指在着变异,故把这些观察项目或研究指标(属性、特征)称为标(属性、特征)称为随机变量,简称随机变量,简称变量变量(variable),而观察结果对应的取值,而观察结果对应的取值称为称为变量值变量值或或资料资料(value of variable)变量的不同类型变量的不同类型多分类多分类二分类二分类binominal数值变量数值变量numerical分类变量分类变量categorical有序分类有序分类ordinal无序分类无序分类nominal变量变量variable数值变量数值变量n定义:又称为定量变量、计量资料,指通过度量衡的定义:又称为定量变量、计量资料,指通过度量衡的方方 法,测量每一个观察单位的某项研究指标的量的大小,法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料得到的一系列数据资料n特点:具体意义的数值特点:具体意义的数值 取值即可以是连续性也可为间断性取值即可以是连续性也可为间断性 有度量衡单位有度量衡单位 n如患者的身高(如患者的身高(cmcm)、体重()、体重(kgkg)、血压()、血压(mmHgmmHg)、)、 脉搏(次脉搏(次/ /分)、红细胞计数(分)、红细胞计数(10101212/L/L)n定义:又称为定性变量、计数资料,指将全体观测单定义:又称为定性变量、计数资料,指将全体观测单位按照某种性质或特征分组,取值表现为互不相容的位按照某种性质或特征分组,取值表现为互不相容的类别和属性类别和属性n特点:没有度量衡单位特点:没有度量衡单位 取值为某种属性,通常无法直接运算取值为某种属性,通常无法直接运算 统计时多转化为间断性的计数值统计时多转化为间断性的计数值n如肤色(黑、白)、血型(如肤色(黑、白)、血型(ABO)、职业(工农兵)、)、职业(工农兵)、性别(男女)性别(男女) 分类变量分类变量n定义:介于计量资料和计数资料之间的一种资料,通定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到,分类间有大小强弱之别。过半定量方法测量得到,分类间有大小强弱之别。n特点:没有度量衡单位特点:没有度量衡单位 取值为某种属性取值为某种属性 各属性有强弱大小之别各属性有强弱大小之别n如:癌症分期:早、中、晚。如:癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。 尿蛋白:尿蛋白: , , , , ,+,+,+,+及以上及以上有序变量有序变量变量与变量值变量与变量值病例号病例号年龄年龄(岁岁)性别性别治疗治疗分组分组*病程病程(年)(年)溃疡面积溃疡面积(cm2)上腹部上腹部疼痛疼痛疗效疗效137男男T41.1减轻减轻显效显效245男男C151.8未减轻未减轻无效无效343女女C20.7减轻减轻显效显效454男男T91.5未减轻未减轻恶化恶化561女女T101.2减轻减轻有效有效8031男男C31.0未减轻未减轻无效无效* T* T为试验药,为试验药,C C为对照药为对照药变量转换变量转换n变量的分类不是固定、死板的,在一定的情况下,通变量的分类不是固定、死板的,在一定的情况下,通过相应的规则相互转换过相应的规则相互转换n例如:测得例如:测得5人的人的WBC(个(个/m3)数如下:)数如下: 3000 6000 5000 8000 12000 数值变量数值变量 过低过低 正常正常 正常正常 正常正常 过高过高 分类变量分类变量n若按正常若按正常3人,异常人,异常2人分组人分组二分类变量二分类变量n若按过低若按过低1人,正常人,正常3人,过高人,过高1人分组人分组等级资料等级资料变量的转换变量的转换n数值变量的性质化转换(制定标准)数值变量的性质化转换(制定标准) n数值变量数值变量无序分类变量无序分类变量n数值变量数值变量有序分类变量有序分类变量n分类变量的数量化转换(赋值)分类变量的数量化转换(赋值)n无序分类变量无序分类变量数值变量数值变量n有序分类变量有序分类变量数值变量数值变量n请注意转换后得到的数值变量的含义请注意转换后得到的数值变量的含义*n数字无大小强弱之别;或有大小之别,却不一定数字无大小强弱之别;或有大小之别,却不一定有具体意义有具体意义同质和异质同质和异质n具具有有相相同同性性质质的的事事物物(或或者者决决定定事事物物的的关关键键属属性性和和特特征征相相同同)称称为为同同质质的的(homogeneous)。否否则称为则称为异质异质的或者间杂的的或者间杂的(heterogeneous)。n同同质质和和异异质质是是相相对对的的概概念念。在在不不同同的的情情况况下下同同质与异质的标准会发生改变。质与异质的标准会发生改变。n不同质的个体不能笼统地混在一起分析。不同质的个体不能笼统地混在一起分析。在研究事物的形状时在研究事物的形状时同质和异质示例同质和异质示例在研究事物的颜色时在研究事物的颜色时变异变异 n同质事物之间变量值的差别称为同质事物之间变量值的差别称为变异变异(variation)n变异的两个方面:变异的两个方面:n不同观察单位(个体)间的差别不同观察单位(个体)间的差别n同一个体在不同阶段的差别(重复测量)同一个体在不同阶段的差别(重复测量)变异变异n建立在同质的基础上建立在同质的基础上n一种或多种不可控因素一种或多种不可控因素( (已知的或未知的已知的或未知的) )作用作用下的综合表现,其结果是不可预知的(下的综合表现,其结果是不可预知的(随机的随机的)n个体变异是普遍存在的;个体变异是有规律的个体变异是普遍存在的;个体变异是有规律的n统计学就是要研究变异的规律;没有个体变异,统计学就是要研究变异的规律;没有个体变异,就没有统计学就没有统计学变异示例变异示例在研究事物的颜色时在研究事物的颜色时在研究相同颜色事物的形状时在研究相同颜色事物的形状时变异示例变异示例发热者体温波动发热者体温波动正常人体温波动正常人体温波动n同质个体变异是有规律的,表现为观察值出现同质个体变异是有规律的,表现为观察值出现在不同范围中的概率大小在不同范围中的概率大小n随机现象或随机变异都有其固有的分布规律,随机现象或随机变异都有其固有的分布规律,即概率分布,在大量重复观察的条件下就会呈即概率分布,在大量重复观察的条件下就会呈现其规律性现其规律性n资料分布:称随机变异的规律性为该指标取值资料分布:称随机变异的规律性为该指标取值的概率分布,简称为资料的分布的概率分布,简称为资料的分布个体变异的规律性个体变异的规律性个体、总体和样本个体、总体和样本 n个个体体 Individual:是是构构成成总总体体的的最最基基本本观观察察单单位。位。n总总体体 Population:根根据据研研究究目目的的所所确确定定的的同同质质观察单位的全体;分为观察单位的全体;分为有限总体有限总体和和无限总体无限总体。n样样本本 Sample:是是从从总总体体中中按按照照一一定定的的目目的的按按照照一定的原则抽取的一部分个体。一定的原则抽取的一部分个体。n请请考考虑虑如如何何判判断断样样本本是是否否有有代代表表性性;抽抽样样研研究究的目的的目的*n随机、样本含量;推断总体信息随机、样本含量;推断总体信息总体与样本总体与样本n例:假定某该地在例:假定某该地在1998年的年的7岁男孩有岁男孩有10万人,现研究万人,现研究1998年该地年该地7岁男孩的身高岁男孩的身高情况情况n现在随机抽样调查了解现在随机抽样调查了解200名名7岁男孩的岁男孩的身高情况,测量他们的身高,通过分析身高情况,测量他们的身高,通过分析这这200个儿童的身高推断该地个儿童的身高推断该地10万个万个7岁岁男孩身高情况男孩身高情况总体与样本总体与样本 上述例子中涉及到下列概念:上述例子中涉及到下列概念:n观察单位观察单位(个体个体):每个:每个7岁男孩。岁男孩。n观察指标:身高观察指标:身高(观察指标又称为变量观察指标又称为变量)n观察值:身高测量值观察值:身高测量值(亦称变量的取值亦称变量的取值)n总体:该地总体:该地1998年的年的10万个万个7岁男孩身高观察值的全体岁男孩身高观察值的全体(即:即:10万个身高观察值构成的一个集合万个身高观察值构成的一个集合)。n样本:随机抽样的样本:随机抽样的200个个7岁男孩身高观察值岁男孩身高观察值参数和统计量参数和统计量 n总体参数总体参数 Parameter :描述总体特征的指标:描述总体特征的指标n统计量统计量 Statistic:反映样本特征的指标:反映样本特征的指标n在总体被确定之后,总体参数就是唯一的;而在总体被确定之后,总体参数就是唯一的;而统计量是几乎总是随着样本而变的统计量是几乎总是随着样本而变的n为了区分参数与统计量通常用希腊字母表示参为了区分参数与统计量通常用希腊字母表示参数;用拉丁文字母表示统计量数;用拉丁文字母表示统计量n通常参数是未知的,而统计量则可以通过抽样通常参数是未知的,而统计量则可以通过抽样研究得到,故统计学通常用统计量估计参数研究得到,故统计学通常用统计量估计参数(参数估计参数估计)误差误差n误差误差 error:实际观察值与真实值之差:实际观察值与真实值之差n误差分类:误差分类:随机误差随机误差random非随机误差非随机误差systematic误差误差error抽样误差抽样误差sampling测量误差测量误差measurement系统误差系统误差n在实际观测过程中,由受试对象、研究者、仪器设备、在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为性或规律性的误差。流行病学称之为偏倚偏倚(bias)n特点:观察值有系统性、方向性、周期性的偏离真值特点:观察值有系统性、方向性、周期性的偏离真值n可以通过严格的实验设计和技术措施消除。可以通过严格的实验设计和技术措施消除。随机误差随机误差n排除上述误差后尚存的误差,受多种无法控制排除上述误差后尚存的误差,受多种无法控制的因素的影响。的因素的影响。n特点:大小方向不一的随机变化特点:大小方向不一的随机变化n随机测量误差随机测量误差random measurement error:不:不可避免,提高操作者熟练程度可以减少这种误可避免,提高操作者熟练程度可以减少这种误差差n随机抽样误差随机抽样误差 random sampling error:由抽样:由抽样造成的样本统计量和总体参数间的差异,不可造成的样本统计量和总体参数间的差异,不可避免,但有一定的分布规律,可估计避免,但有一定的分布规律,可估计频率和概率频率和概率n频率频率 Frequency :在:在n次随机试验中,事件次随机试验中,事件A发生发生了了m次,则比值次,则比值 称为事件称为事件A在这在这n次试验中出现的频率次试验中出现的频率频率和概率频率和概率抛硬币试验在概率的统计学定义上的诠释抛硬币试验在概率的统计学定义上的诠释试验者试验者投掷次数投掷次数出现出现“正面正面”次数次数频率频率X X202012120.60000.6000BuffonBuffon40404040204820480.50690.5069K.PearsonK.Pearson1200012000601960190.50160.5016K.PearsonK.Pearson240002400012012120120.50050.5005频率和概率频率和概率n概率的统计学定义:概率的统计学定义: 数理统计学中的大数定理表明:当观察次数数理统计学中的大数定理表明:当观察次数n越来越大,频率越来越大,频率f的波动幅度越来越小,并最终的波动幅度越来越小,并最终趋向于一个常数趋向于一个常数p:随机事件:随机事件A发生的发生的概率概率 (Probability)。n概率描述了随机事件发生的可能性的大小,是概率描述了随机事件发生的可能性的大小,是一种参数;频率作为概率的估计值,是统计量一种参数;频率作为概率的估计值,是统计量n0P 1 小概率事件小概率事件n小概率事件小概率事件 医医学学研研究究中中,将将概概率率小小于于等等于于0.05或或0.01的的事件称为小概率事件。事件称为小概率事件。n小概率原理小概率原理 小小概概率率事事件件并并不不表表示示不不可可能能发发生生,但但在在某某一一次次试试验验中中,由由于于其其发发生生的的可可能能性性十十分分小小,近近似似认为是不会发生的。认为是不会发生的。 三、统计工作的步骤(了解)三、统计工作的步骤(了解)n研究设计:正确、周密的设计是研究成败的关键研究设计:正确、周密的设计是研究成败的关键n资料收集:准确可靠。资料收集:准确可靠。n来源:统计报表、工作记录、专题调查或实验来源:统计报表、工作记录、专题调查或实验n资料整理:原始资料的核对、清理、录入、检查资料整理:原始资料的核对、清理、录入、检查n资料分析:资料分析:n统计描述和统计推断,由样本估计总体,由样本统计统计描述和统计推断,由样本估计总体,由样本统计量估计总体参数;量估计总体参数;n阐明事物的内在联系和规律,合理呈现阐明事物的内在联系和规律,合理呈现四、医学统计学的学习要求四、医学统计学的学习要求n1984年对中华医学类杂志年对中华医学类杂志595篇论文调查:相对篇论文调查:相对数误用数误用11.2、抽样误差误用、抽样误差误用15.9、统计图表、统计图表误用误用11.7n1996年对年对4586篇申报科技成果的论文调查:数篇申报科技成果的论文调查:数据分析方法误用达据分析方法误用达55.7n20012002年对国内外的医学论著调查:误用年对国内外的医学论著调查:误用情况中所占比例最大的来自于常用的基本统计情况中所占比例最大的来自于常用的基本统计学方法学方法四、医学统计学的学习要求四、医学统计学的学习要求n医学统计学,重在医学应用医学统计学,重在医学应用n建立统计观念,培养统计逻辑建立统计观念,培养统计逻辑n多作练习多作练习n多阅读参考文献多阅读参考文献
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号