资源预览内容
第1页 / 共58页
第2页 / 共58页
第3页 / 共58页
第4页 / 共58页
第5页 / 共58页
第6页 / 共58页
第7页 / 共58页
第8页 / 共58页
第9页 / 共58页
第10页 / 共58页
亲,该文档总共58页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章 计量资料的统计描述,卫生统计学教研室 任艳峰,Qualitative data analysis (ranked),Quantitative data analysis,Statistical description,Statistical Inference,Statistical Inference,Statistical description,Design,Collection of data,Sorting data,Statistical analysis,Statistical analysis,Statistical description,Statistical description,Statistical Inference,Statistical Inference,Parameter Estimation,Hypothesis Test,熟悉频数表的划记步骤,频数表的用途。 掌握集中趋势指标的定义、适用范围和计算。 掌握离散趋势指标的定义、适用范围和计算。,学习目标,定量资料进行描述时,如果样本量较大,需要对原始资料进行整理,列出频数分布表,通过频数表以显示资料的分布类型。,第一节 频数分布表与频数分布图,频数(frequency) 某数值在数据中出现的次数。 相对频数(frequency) 也叫频率,数值在总观察例数中所占的比例。 频数表(frequency table) 将所有“互相排斥的情形”的频数毫无遗漏地排列在一起。由频数与组段组成。,如1998年某山区96名孕妇产前检查次数资料: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7。 这是什么类型的资料?,一、离散型定量资料的频数分布,1998年某地96名孕妇产前检查次数分布,图中横坐标表示产前检查次数,纵坐标表示各检查次数的孕妇例数占总孕妇数的频率(比例)。从直条高度和分布情况看出,产前检查次数分布呈负偏态分布。,二、连续型定量资料的频数分布,1.找出最大值 和最小值,(一)频数分布表的编制方法,2.计算全距 (range,R)也叫极差,(1)根据数据多少,组段数一般515个左右(10); (2)根据(R/预计组段数)估计组距大小 (22.22/10=2.22); (3)确定组段数和组距; 两端的组段包含最大值和最小值; 尽量取整数作为组段的端点; 组距尽量取相等为宜。,3.确定组段数和组距(class interval),4.列表:根据下限X上限的原则确定每一例数据所归属的组段。,标 题,120名正常成年男子血清铁含量(mol/L)频数表,1.揭示资料的分布特征; (1)集中趋势:大部分数据向中间集中,中间数据居多。 (2)离散趋势:从中央到两侧,频数分布逐渐减少。 2 .揭示资料的分布类型; 正态分布:中间高两侧低、左右对称的单峰分布。 偏态分布:集中位置偏向一侧,分布不对称。 3.便于发现某些特大或特小的可疑值; 4.便于计算指标和统计分析。,(二)、频数分布表的用途,正偏态,正态分布,负偏态,120例健康成年男子血清铁含量分布,频数分布图,120例健康成年男子血清铁含量分布,频数分布图,频率密度 =频率/组距,第二节 集中趋势的描述,集中趋势指某计量资料大多数观察值所在的中心位置。常用指标有:1.算术均数(arithmetic mean),简称均数(mean)2.几何均数(geometric mean)3.中位数 (median),算术均数(mean),1.定义: 算术平均数是由所有数据之和除以数据个数所得的商数。反映一组同质的观察值在数量上的平均水平。 总体均数用希腊字母,样本均数用 表示。,2. 适用范围: (1)描述对称分布资料的集中趋势; (2)描述正态分布资料的集中趋势。,3.均数的计算公式:,(1)直接法:,(2)加权法,f 为组段的频数 X0为组段的组中值 X0=(上限+下限)/2,例:测得8只正常大鼠的血清中酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试计算算数均数。,几何均数(geometric mean),1. 定义: n个观察值的连乘积的n次方根,几何均数用G表示。 2. 适用范围: (1)成倍数关系或等比关系的资料 (2)对数正态分布资料,3. 计算公式:,(1)直接法:,(2) 加权法:,例:7名慢性迁延性肝炎患者的HBsAg滴度资料为:1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。,4.几何均数的特点:,(1) 观察值不能同时存在大于和小于0的数据,不能有等于0的数据。 (2)同一组资料所得几何均数小于等于均数。,中位数(median),1.中位数:将一组观察值按照从小到大,或者大到小的顺序排列,位次居中的观察值水平。中位数用M表示。 百分位数(percentile):一个位置指标,用Px表示。描述观察值序列在某百分位置的水平。,PX,理论上适用于任何分布类型 ; (2)尤其偏态分布资料; (3)开口资料; (4)分布类型不清的资料;,2.中位数的适用范围:,(1)直接法,3. 计算公式:,(2) 加权法:,Px :百分位数 L : Px所在组段的下限值 i : 组距 fx : Px所在组段的频数 n : 样本例数 f L : 该组段之前的累计频数,例: 某药厂观察9只小鼠口服山红景醇提物(RSAE)后在缺乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。,中位数实例,10例正常人的发汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2,对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人, 6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。 本资料属于“开口”资料。 本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。,例:试对下表资料求其中位数M。,M = P50,描述离散趋势的指标,第三节、离散趋势的描述,离散程度指某计量资料的所有观察值与中心位置的发散程度。,描述离散趋势的指标,极差(range),极差(range,R):又称全距,一组观察值中最大值和最小值的差。 2. 计算公式:,3. 特点,(1)简单明了,计算简单,应用广泛。 (2)只能反映最大值和最小值的变异,不能反映所有数据的变异。 (3)样本含量n变大时,R也会变大。 (4)样本含量不变时,R抽样误差也较大,不稳定。,4. 适用范围:任何分布类型资料,资料做粗略分析。,四分位间距,2. 计算公式:,1.四分位数(quartile):是特定的百分位数,下四分位数P25,记作QL;上四分位数P75,记作QU。上四分位数P75,与下四分位数P25之差即是四分位间距。,(1)避免了极差受极端值的影响; (2)样本含量n变大时,Q比R稳定; (3)只能反映中间50%的数据的变异,不能反映所有数据的变异; (4)去头弃尾,丢失大量的信息。,3. 特点,(1) 偏态分布资料;开口资料;分布类型不清的资料 (2) Q与M一起使用,描述偏态分布资料的集中趋势和离散趋势。,4. 适用范围,方差 (variance),1.方差 (variance,2/S2):总体(样本)内所有个体观察值与总体(样本)均值的离均差平方和(sum of square)的均值。,2. 计算公式:,自由度:df/ 表示随机变量能“自由”取值的个数 例如有一四个数据的样本,受到均数为5的条件的限制,在自由确定4、2、5三个数据后,第四个数据只能是9,=3 任何统计量自由度的个数为=n-限制条件的个数。,(1) 能够反映所有观察值之间的离散程度 (2) 考虑到每一个观察值,信息利用充分 (3) 对数据的变化反应灵敏,3. 特点,4. 适用范围: 正态分布资料或近似正态分布资料.,标准差 (standard deviation),1.标准差 (standard deviation,S ) :即方差的正平方根;其单位与原变量X的单位相同。 总体标准差: 样本标准差:S,2. 计算公式:,(1) 能够反映所有观察值之间的离散程度 (2) 考虑到每一个观察值,信息利用充分 (3)对数据的变化反应灵敏,3. 特点,(1) 正态分布资料或近似正态分布资料 (2) 标准差和均数相结合,描述正态分布资料的集中趋势和离散趋势,4. 适用范围,变异系数 (coefficient of variation),1.变异系数 (coefficient of variation,CV ):标准差与相应均数的比值;其意义是标准差为均数的多少倍,常用百分比表示。,2. 计算公式:,3. 适用范围 (1) 比较度量衡单位不同的多组资料变异度 (2) 比较均数相差悬殊的多组资料的变异度,均数差别较大的变量间变异度比较,不同年龄组男子身高(cm)的变异度,量纲不同变量间变异度的比较,计量资料的统计描述 图表描述 统计指标描述 集中趋势指标:均数、几何均数、中位数 离散趋势指标:标准差、四分位数间距、变异系数、极差,总 结,谢谢大家!,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号