资源预览内容
第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
第9页 / 共25页
第10页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章第二章第二章第二章 计量资料的统计计量资料的统计计量资料的统计计量资料的统计描述描述描述描述 刘树仁刘树仁刘树仁刘树仁 教授教授教授教授第一节第一节 数值变量资料数值变量资料 一、频数表一、频数表频数表(频数表(frequency table):用来表示样用来表示样本数据各观察值在不同取值区间的出现本数据各观察值在不同取值区间的出现的频繁程度(频数)。的频繁程度(频数)。 制作连续型数据频数表一般步骤如下:1.求数据的全距(range,R),也称为极差,就是最大值与最小值之差。 2.根据极差选定适当“组段”数。 3.确定组距和组段。 4.写出组段,逐一划记。 见书上例4-2-1频数表和频数分布图的用途频数表和频数分布图的用途 :1描述频数分布的类型 (1)对称分布 (2)偏态分布 2描述频数分布的特征3便于发现一些特大或特小的可疑值。4便于进一步做统计分析。 二、描述集中趋势的指标二、描述集中趋势的指标 常用的有:算术均数、几何均数和中位数。 (一)算术均数(一)算术均数 算术均数简称均数(算术均数简称均数(mean),), 适用于反映一适用于反映一组呈组呈对称分布对称分布的变量值在数量上的平均水平或的变量值在数量上的平均水平或者说是集中位置的特征值。适用于者说是集中位置的特征值。适用于对称分布对称分布,特别是特别是正态分布正态分布资料。总体均数用资料。总体均数用表示,样表示,样本均数用本均数用 表示。表示。 1直接计算法,直接用原始观测值计算。计算公式如下: (公式4-2-1) X1,X2,和Xn为所有观察值,n为样本含量,(希腊字母,读作sigma)为求和的符号。 例例4-2-2:测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。算术均数=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.9075 (U/L) 2加权法加权法,也称频数表法,就是利用频数表得,也称频数表法,就是利用频数表得到的数据来计算均数。计算公式如下到的数据来计算均数。计算公式如下 : (公式4-2-2) k表示频数表的组段数表示频数表的组段数, f1,f2,f3,fk表示各组段表示各组段的频数,的频数,X1,X2,和和Xk表示各组段的组中值(组表示各组段的组中值(组中值一般用组上限和组下限的均数)。中值一般用组上限和组下限的均数)。 例例4-2-3:利用表4-2-1计算某社区101名正常成年女子的血总胆固醇的均数。(二)几何均数(二)几何均数几何均数(几何均数(geometric mean G)适用于观适用于观察值变化范围跨越多个数量级的资料。察值变化范围跨越多个数量级的资料。几何均数适用于几何均数适用于成等比级数成等比级数的资料,特别是的资料,特别是对数正态分布对数正态分布资料。资料。 1.直接计算法直接计算法 计算公式为 (公式4-2-3) 例例4-2-4:某社区有7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64, 1:64,1:128,1:512。试计算其几何均数。 2.加权法 计算公式为 例例4-2-5:2004年某社区52例慢性肝炎患者的HBsAg滴度数据如表4-2-3。试计算滴度的几何均数。 (三)中位数(三)中位数中位数(中位数(median M)是将变量值从小到大排列,位置居于中间的那个变量值,称为中位数。可用于各种分布的定量资各种分布的定量资料料,特别是偏态分布资料和开囗资料偏态分布资料和开囗资料(一端或两端无确切数值的资料)。 变量值个数变量值个数n是是奇数奇数时,中位数的计算公式为时,中位数的计算公式为 :变量值个数变量值个数n是是偶数偶数时,中位数的计算公式为时,中位数的计算公式为 (公式4-2-5) (公式4-2-6) 例例4-2-6:某社区医院有7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。本例n=7,为奇数 例例4-2-7:某社区中学8名学生食物中毒的潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。本例n=8,为偶数 (四四) 百分位数百分位数将频数等分为十或一百的分位数称十分位将频数等分为十或一百的分位数称十分位数或百分位数数或百分位数 。百分位数的符号为Px,X代表第X百分位。一个百分位数Px将全部变量值分为两部分,在不包含Px的全部变量值中有x%的变量值比它小,(100-x)%变量值比它大。 1直接计算法 设有x个原始数据从小到大排列,第x百分位数的计算公式为:当nX%的值带有小数位时: trunc(nX%)是和nX%的值最近似的整数。(trunc为取整函数) 当nX%的值为整数时:2频数表法 计算公式如下: (公式4-2-9) 其中LX、iX和fX分别为第X百分位数所在组段的下限、组距和频数,fL为小于某组段的累计频数,n为总例数。 (五)运用平均数的注意事项(五)运用平均数的注意事项 1同质的事物或现象才能求平均数2用分组平均数补充总平均数3根据资料的分布选用适当的平均数三、描述离散趋势的指标三、描述离散趋势的指标描述计量资料的离散趋势的常用指标有极差、四分位数间距、方差、标准差和变异系数等。(一)极差(一)极差极差:计量资料中最大值与最小值之差,是变异指标中最简单的一种。 极差计算简便,但只考虑了最小、最大值,因此易受个别极端值的影响,且随例数的多少而变动,不稳定。仅用于粗略地说明变量值的变动范围。 (二)四分位数间距(二)四分位数间距四分位数间距:四分位数间距: P75与与P25之差。之差。用于描述用于描述偏态分布偏态分布资料的变异程度。资料的变异程度。 (三)方差(三)方差 总体方差用2表示,样本方差用S2表示,其计算公式分别为: (公式4-2-10) 是总体均数,N是总体中观察单位的个数。 (公式4-2-11) (四)标准差(四)标准差标准差(标准差(standard deviation)是方差的平方根,使用是方差的平方根,使用的单位与原来资料中变量的单位相同,适用于的单位与原来资料中变量的单位相同,适用于正态分正态分布及近似正态分布布及近似正态分布的资料,是计量资料中反映离散趋的资料,是计量资料中反映离散趋势的最为常用指标,总体标准差用势的最为常用指标,总体标准差用表示,样本标准表示,样本标准差用差用S 表示,其计算公式分别为:表示,其计算公式分别为: 或当利用频数表计算样本标准差时,计算公式 (五)变异系数(五)变异系数变异系数(变异系数(coefficient of variation CV):):多用于观察指标单位不同时及当观察指标单位多用于观察指标单位不同时及当观察指标单位相同而均数相差较大时的变异程度的比较。相同而均数相差较大时的变异程度的比较。 (公式4-2-15) S为标准差,为标准差, 为均数。为均数。 (六)运用变异指标的注意事项(六)运用变异指标的注意事项1变异指标表示变量值的变异程度或离散趋势,常与集中指标平均数结合运用,说明变量值集中的位置与离散程度。2变异指标种类虽多,但任一变异指标,其值大表示变异大,数值参差不齐;值小表示变异小,数值比较集中在平均数周围。比较两个或几个同类事物的变异,要用同一变异指标。3正态分布资料宜用均数与标准差描述集中与离散趋势。有了均数与标准差就可根据正态分布理论将频数分布描绘出来。偏态分布资料宜用中位数及四分位数间距、极差等描述其集中趋势和变异程度。4. 比较几组资料的变异程度,若各组资料的单位不全相同,或均数相差悬殊时,宜用变异系数描述其变异程度。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号