资源预览内容
第1页 / 共44页
第2页 / 共44页
第3页 / 共44页
第4页 / 共44页
第5页 / 共44页
第6页 / 共44页
第7页 / 共44页
第8页 / 共44页
第9页 / 共44页
第10页 / 共44页
亲,该文档总共44页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
卫生统计学数值变量资料的统计卫生统计学数值变量资料的统计描述描述数值变量资料的分类o离散型资料(discrete data)o连续型资料(continuity data)o求全距(range,R) ,R129.5101.2=28.30(cm)o划分组段 u确定组数 u确定组距 u确定各组段的上下限 o列出频数表 图3-2 某市120名6岁女孩的身高分布 身高频数010203099102105108111114身高(cm)117120123126129身高频数o频数分布两个重要特征频数分布两个重要特征u集中趋势u离散趋势 o频数分布类型频数分布类型u对称分布:集中位置在中间,左右两则的频数基本对称。u偏态分布:集中位置偏向一侧,左右频数不对称。 正偏态:集中位置偏向数值小的一侧(左侧)负偏态:集中位置偏向数值大的一侧(右侧)正偏态(左偏态)负偏态(右偏态)第二节 集中趋势的描述 描述定量资料集中趋势常用的统计指标为平均数(average)。l 算术均数l 几何均数l 中位数/百分位数 一、算术均数(一、算术均数(meanmean)o适于描述正态分布或近似正态分布资料的集中趋势(, ) o方法u直接法u加权法直接法(直接法(direct method)例3-3 现有10名6岁女孩的身高值(cm)为110.9,120.4,108.2,121.2,112.3,121.8,117.0,111.4,117.2,108.3,试求其算术均数。加权法加权法(weight method)cm直接法:115.76 cm二、几何均数二、几何均数(geometric mean(geometric mean,G)G)o观察值呈倍数关系或其频数分布明显偏态,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。 o方法u直接法u加权法o例3-4 有5人接种某种疫苗后,测定抗体滴度分别为1:8,1:16,1:32,1:64,1:128,求几何均数。加权法加权法三、中位数三、中位数(median(median,M)M)和百分位数和百分位数(percentile(percentile,Px)Px)o中位数 :将一组观察值按大小顺序排列后,位于中间位置的观察值称中位数。全部观察值中,大于和小于中位数的观察值个数相等。中位数可用于各种分布的资料,在实际工作中主要用于偏态分布资料、两端无确切值或分布不明确的资料。 o资料为对称分布,Mo方法u直接法u频数表法直接法直接法频数表法频数表法百分位数百分位数 o将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为Px。对于样本含量过小的资料不宜计算百分位数。o一个百分位数Px将全部数据分为两个部分,有x的数据比Px小,有(100X)的数据比Px大,故百分位数是一个位置指标。o计算 例3-9 计算例38中表35的百分位数P25、P75、P90的值。o (mmol/L)o (mmol/L)o (mmol/L) 第三节 离散趋势的描述离散趋势的描述 例3-10 三组同性别、同年龄儿童的体重(kg)资料如下:甲组 16 18 20 22 24乙组 14 17 20 23 26丙组 16 19 20 21 24o描述离散趋势的常用指标有描述离散趋势的常用指标有极差四分位数间距方差标准差变异系数 一、极差(一、极差(rangerange,R R)o 极差亦称全距,即一组观察值中最大值与最小值之差。极差大,说明变异度大;反之,说明变异度小o极差可用于反映各种分布资料的变异程度,简单明了,但也存在缺点u只涉及最大值和最小值,不能反映组内其他数据的变异程度u样本较大时,抽样误差大,因此抽到最大值和最小值的可能性也越大,故样本例数相差较大时,不宜比较其极差二、四分位数间距(二、四分位数间距(quartile rangequartile range,Q/ Q/ Q Qu u- Q- Ql l )oP25 P75 o四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度,其值越大,表示观察值分布的离散程度越大,反之越小。o四分位数间距与极差相比,相对比较稳定,但它只反映了居中间的50%数据的变异情况,仍未考虑到每个观察值的变异情况,不能代表全部观察值的离散程度。三、方差三、方差(variance)(variance)o方差是描述对称分布,特别是正态分布或近似正态分布资料离散程度的常用指标。 o自由度(degree of freedom, )的意义是随机变量在一定条件下能“自由”取值的变量值个数,若变量取值受k个条件的限制,其自由度为nk。 四、标准差四、标准差(standard deviation(standard deviation,S/SD)S/SD)o标准差是在统计中应用最多的变异指标。标准差是方差的算术平方根,与变量值的单位相同。标准差适于描述对称分布定量资料的离散程度。 o计算方法u直接法u加权法直接法加权法五、变异系数五、变异系数(coefficient of (coefficient of variationvariation,CV)CV)o变异系数(亦称离散系数)为相对数,没有单位,便于资料间的比较。它常用于比较测量单位不同,或均数相差悬殊的几组资料的离散程度 不同单位几组资料离散程度的大小比较均数相差悬殊的几组资料间比较不同分布类型数值变量资料集中、离散趋势的统计描述不同分布类型数值变量资料集中、离散趋势的统计描述 作业oP27o1o4: i=1cm, 第1组: 58;o5o7Happy National Day and Mid-Autumn Festival to You!结束语结束语谢谢大家聆听!谢谢大家聆听!44
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号