医学统计学及其软件包-

医学统计学及其软件包上海第二医科大学生物统计教研室第一章绪论第一节第一节医学统计学医学统计学数学统计学医学统计学第一节第一节医学统计学医学统计学1.1.统计学统计学 (statistics) (statistics)：收集，整理和分：收集，整理和分析析带有随机性带有随机性的数据。的数据。2.2.医学统计学医学统计学 (medical statistics) (medical statistics)：统：统计学的原理和方法在医学和生物学中的计学的原理和方法在医学和生物学中的应用。应用。第一节第一节医学统计学医学统计学医学统计学的主要内容有： 1.统计研究设计 2.统计描述 3.统计推断 4.研究联系 5.研究分类，鉴别 6.研究检测统计研究设计统计研究设计1.估计研究对象的数量（样本大小估计）2.跟据研究目的确定对照的类型3.保证随机化和双盲原则的贯彻4.跟据研究目的确定主要和次要考核指标5.如何收集和汇总数据以保证数据质量6.如何进行统计分析统计研究设计统计研究设计1调查研究或观察性研究(observationalstudy）2实验研究（experimentalstudy）统计描述统计描述（statisticaldiscription）统计描述指用统计指标、统计表、统计图等方法，对资料的数量特征及其分布规律进行测定和描述。统计推断统计推断(statisticalinference)统计推断指用样本推断总体。总体(population)：一个统计问题所研究对象的全体。总体中每一个研究对象称为个体(individual)。有限总体：有确定的时间和空间范围，总体内观察单位是有限的。无限总体：没有时间和空间范围限制，因而观察单位数无限。样本(sample)：按随机的方式从总体中抽取若干个体构成一个样本。参数(parameter)：用于描述总体分布的数字特征的量。如：，统计量(statistics)：不包含总体中任何未知参数的样本指标和样本数据的函数。如：，S，P统计推断统计推断(statisticalinference)1.参数估计(estimationofparameter)根据总体中所抽得的样本，由样本统计量估计总体分布中的未知参数。可分为点估计和区间估计。1）点估计(pointestimation)：选择一个适当的样本统计量作为总体参数的估计值称为点估计。统计推断统计推断(statisticalinference)统计推断统计推断(statisticalinference)2）区间估计(intervalestimation)：根据一定的精确度要求，确定一个概率水平，由样本统计量计算出一个适当的区间作为未知总体参数真值所在的范围，称为区间估计。称此概率水平为可信度，或置信度，或可信水平，或置信水平(confidencelevel)。所估计的区间称为可信区间或置信区间(confidenceinterval)，区间的端点称为可信限(confidencelimit)，有上限，下限之分。例如，估计用某方法治疗某病的治愈率。从患某病的病人总体中随机抽得100例病人进行治疗，治愈50例，则可得样本治愈率为50%。总体治愈率的点估计为50%。总体治愈率区间估计，当可信度为95%时，总体治愈率的95%可信区间为40%60%。当可信度为99%时，总体治愈率的99%可信区间为37%63%。统计推断统计推断(statisticalinference)统计推断统计推断(statisticalinference)统计推断(statisticalinference)2.假设检验(hypothesistesting)又称显著性检验(significancetesting)。先对总体的参数或分布作出某种假设，例如总体为正态分布，两个总体均数相等，两总体率相等，然后检验这个假设成立的可能性大小，作出推断。统计推断(statisticalinference)统计推断(statisticalinference)无效假设（nullhypothesis）H0：12备择假设(alternativehypothesis)H1：12然后根据检验假设,1270%，成立的情况下，计算由于抽样误差得到目前样本及更极端情况的可能性大小。本例用卡方检验，得到检验统计量2=9.524，根据检验统计量的分布计算概率（可能性大小）P值，P=0.002，可能性很小。统计推断(statisticalinference)概率论认为：在一次试验中小概率事件不可能发生。在统计中，一般公认为P0.05为小概率。本例P=0.0020.05，因此可认为假如12，即使抽样误差也不可能得到目前样本，于是检验假设,12不成立；与检验假设对立的备择假设成立，即12，A药组的总体有效率不同于B药组的总体有效率，从本例情况，A药组的总体有效率大于B药组的总体有效率。统计推断(statisticalinference)如果本例用卡方检验，得到其可能性大小P=0.080.05，这个概率不是很小，有可能检验假设,12，成立的情况下，由于抽样误差得到目前样本，所以不能拒绝检验假设。总结假设性检验的过程。(1)建立H0，H1和确定显著性水准(significancelevel,用表示，常取0.05）(2)选择合适的统计检验方法，计算统计量。(3)根据检验统计量的分布计算概率P值,根据P值作出统计的推断结论。统计推断统计推断(statisticalinference)P值：根据H0规定的总体情况，作随机抽样，获得大于等于现有样本统计量值的概率。如果P0.05，则不拒绝H0；0.01P0.05，则在=0.05水平上，拒绝H0；P0.01则在=0.01水平上，拒绝H0。假设检验的特点：(1)反证法。(2)结论是概率性的，不是绝对的肯定或否定，有犯错误的可能性假设检验时应注意的问题1.要有严密的抽样研究设计保证样本的随机性组间的均衡性和可比性：除了对比的主要因素外其它影响结果的因素也应可比。或能在资料处理时消除其影响。2.选用的假设检验方法应符合其应用条件。研究变量的类型不同，设计类型不同，是大样本还是小样本等，所用假设检验的方法也不同。3.正确理解检验假设和备择假设以两样本均数差异的显著性检验为例。正确的写法： H0:两总体均数相等 H1:两总体均数不相等以下是错误的写法。 H0:两样本均数相等 H1:两样本均数不相等 H0:两总体均数无显著差异 H1:两总体均数有显著差异 H0:两样本均数无显著差异 H1:两样本均数有显著差异假设检验时应注意的问题假设检验时应注意的问题4.正确理解差别有无显著性的统计意义，写好统计结论过去习惯： P0.05，两样本均数无显著差异 P0.05，两样本均数有显著差异 P0.05，两样本均数的差异无统计学意义（ P0.05 ） P0.05，两样本均数的差异有统计学意义（ P0.05 ） P0.01，两样本均数的差异有统计学意义（ P0.01 ）最好给出具体的P值，如P 0.0345 注意： “两样本均数的差异”，而不是“两总体均数的差异”从两样本均数的差异有统计学意义（P 0.0345），可推断出两总体均数有差异，其结论错误的可能性为3.45 % 假设检验时应注意的问题两类误差两类误差第一类误差常是可控制的，=0.05，P0.05。第二类误差常未知。但也可根据样本数据计算得到。1-又称为检验的效能(PowerofTest)，H0不成立时拒绝H0的概率。检验效能(PowerofTest)影响效能的四要素(1)客观上两种药物效应差异越大,效能越大。(2)个体间标准差越小,效能越大。(3)样本量越大,效能越大。(4)第类误差的概率越大,效能越大。同时降低两类误差的唯一办法是加大样本。检验效能(PowerofTest)例：一项关于降血压药的临床试验分设两组随机样本,各含15例。一组服用常规药,另一组服用新药。如果新药的降压效果至少比常规药平均高出0.8kPa方可考虑在临床推广;据以往经验,不论常规药还是这种新药,个体降压值的标准差约为1kPa。经0.05水平的两组均数比较的统计检验,两组平均降压效果的差异尚无统计学意义,此事如何理解?检验效能(PowerofTest)经计算：0.2912,1-0.7088,可见,如果新药的降压效果比常规药高出0.8kPa,只有70.88%的机会被此检验认可;如果比常规药高出的数值还不如0.8kPa,则被埋没的机会更大,必须加大样本量。如取0.01,则得n59，即两组各含59例时，如果新药的降压效果比常规药高出0.8kPa,有99%的机会可检验出差异有统计学意义。如取0.10,则得n41如取0.20,则得n25检验效能(PowerofTest)例一项关于维生素C预防感冒作用的研究随机抽取两组正常人各30名,一组服用维生素C,另一组服用安慰剂,欲比较一定时期内发生感冒的频率。结果,安慰剂组有6人发生感冒,维生素C组有3人发生感冒,经0.05水平的检验,差异无统计学意义,此事如何理解?经计算：0.7071,1-0.2929检验效能(PowerofTest)可见,此项研究的效能只有29.29%。换言之,若维生素C能使发生感冒的机会减为10%,此项研究只有29.29%的机会发现这一差异性,约70%的机会给出阴性的结果。如取0.01,则得n461,此项研究需要每组各461名受试者。每组各30例是远远不够的。单侧检验和双侧检验单侧检验和双侧检验双侧检验(two-tailedtest)H0:1=2H1:12单侧检验(one-tailedtest)H0:1=2H1:12(或H1:12)单侧检验和双侧检验单侧检验和双侧检验单侧检验和双侧检验单侧检验和双侧检验单侧检验如果误认为是双侧的，就不易拒绝H0 双侧检验如误用单侧就较易拒绝H0 必须根据实际问题本身决定使用单侧还是双侧。通常进行的都为双侧检验；进行单侧检验时必须特别说明，要有充分的理由(另一侧为不可能），并且在实验设计阶段就要预先规定好。研究联系研究联系分类鉴别研究分类鉴别研究检测研究检测研究第二节第二节一些基本概念一些基本概念资料的类型资料的类型数值变量计量资料分类变量-二分类变量计数资料无序多分类变量有序多分类变量等级资料自由度自由度(degreeoffreedom）泛指事物在N维空间中能自由活动的维数。在数学上自由度是指能自由取值的变量个数。自由度自由度(degreeoffreedom）第三节第三节几种主要的分布几种主要的分布二项分布二项分布(binomialdistribution)二项分布常用于描述二分类变量的分布。二项分布主要用于率的统计推断，如总体率的估计，样本率与总体率的比较，两样本率的比较，还可用于两分类变量的统计分析，如logistic回归等。正态分布正态分布(normaldistribution)正态分布特征：呈钟形，以均数为中心，左右对称。正态分布(normaldistribution)均数：位置参数，增大，曲线向右移动。标准差：形状参数，增大，数据分散，曲线低平；减小，数据集中，曲线高尖。记为N(,2)，标准正态分布：uN(0，1)正态曲线下面积分布规律：（1.96）（1.96）占95%，双侧尾部各占2.5%。（2.58）（2.58）占99%，双侧尾部各占0.5%。正态分布(normaldistribution)正态分布的重要性1.正态分布是很多统计方法的理论基础，很多统计方法要求样本来自正态分布的总体。2.某些分布，如二项分布等的极限为正态分布，当样本量较大时可按正态近似的方法来处理。3.不少医学资料服从正态分布或近似正态分布，有的呈偏态分布的医学资料可经过变量变换转换为正态分布。4.正态曲线下面积分布规律可用于医学正常值范围和控制实验中的检测误差。2分布分布(2distribution)2分布是一种连续型分布，2变量是相互独立的标准正态变量u的平方和，即2=u12+u22+uv2其中df=。用途：检验资料的实际观察频数与按某种检验理论所算得的理论频数是否相符。t分布分布t分布(tdistribution)是一种连续型分布，随机变量t是标准正态分布变量与df=的2分布中的比值，即用途：t检验、回归系数及相关系数检验等。F分布分布F=F分布有二个自由度1和2，它们分别为分子的自由度与分母的自由度。用途：多个均数比较的方差分析，也用于回归分析中假设检验，以及方差齐性检验等。第四节第四节统计软件包简介统计软件包简介一一.SAS统计软件包（统计软件包（StatisticalAnalysisSystem）二二.BMDP统计软件包（统计软件包（BiomedicalComputerPrograms）三三.SPSS统统计计软软件件包包（StatisticalPackagefortheSocialScience）四四.SYSTAT统计软件包（统计软件包（theSystemforStatistics）五五.GLIM统计软件包统计软件包(GeneralizedLinearInteractiveModelSystem)第四节第四节统计软件包简介统计软件包简介六六 MINITAB统统计计软软件件包包（ MINITAB statisticalsoftware)七七 EPIINFO软软件件包包 (statistics program for epidemiologyonmicrocomputers)八八SLIDE软件包软件包九九STATPAL统统计计软软件件包包（astatisticalpackageformicrocomputers）第四节第四节统计软件包简介统计软件包简介十十.PEMS统统计计软软件件包包(packageforencyclopaediaofmedicalstatistics)十十一一.SASD统统计计软软件件包包(a package for statisticalanalysisofstochasticdata)十十二二.SPLM统统计计软软件件包包(statisticalprogram forlinearmodelling)十十三三.SDAS软软件件包包(statisticaldesignandanalysissystem)