资源预览内容
第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
第9页 / 共10页
第10页 / 共10页
亲,该文档总共10页全部预览完了,如果喜欢就下载吧!
资源描述
第二章 计量资料的统计描述一、教学大纲要求一掌握内容1. 频数分布表与频数分布图1频数表的编制。2频数分布的类型。3频数分布表的用途。2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。算术均数、几何均数、中位数。3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。二熟悉内容连续型变量的频数分布图:等距分组、不等距分组。二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表图;另一类是选用适当的统计指标。一频数分布表的编制频数表frequency table用来表示一批数据各观察值或在不同取值区间的出现的频繁程度频数。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由假设干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下:1.求数据的极差range。 2-12.根据极差选定适当“组段数通常810个。确定组段和组距。每个组段都有下限L和上限U,数据归组统一定为LU 。3.写出组段,逐一划记。频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。二描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。1.算术均数对称分布算术均数arithmetic mean简称均数,描述一组数据在数量上的平均水平。总体均数用表示,样本均数用表示,其计算方法如下:1直接法:直接用原始观测值计算。 2-22加权法:在频数表根底上计算,其中为组中值,为频数。 2-32.几何均数常用于免疫学的指标)几何均数geometric mean用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。其计算公式为:(1)直接法 2-42加权法 2-53.中位数尤其适合偏态分布资料和一端或两端无确切数值的资料中位数median将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。为奇数时 2-6为偶数时 2-72-1 常用平均数的意义及其应用场合平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数平均增减倍数等比资料;对数正态分布中位数位次居中的观察值水平偏态分布;分布不明;分布末端无确定值一反映数据变异程度大小的变异指标变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。1.极差极差range亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 2-12.百分位数与四分位数间距1百分位数percentile是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。 百分位数用Px表示,0x100,如25%位数表示为P25。在频数表上,百分位数的计算公式为: 2-82四分位数间距inter-quartile range是由第3四分位数Q3= P75和第1四分位数Q1= P25相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。其计算公式: (2-9)3.方差方差variance表示一组数据的平均离散情况,其计算公式为: (2-10)4.标准差标准差standard deviation是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为: (2-11)5.变异系数变异系数coefficient of variation用于观察指标单位不同或均数相差较大时两组资料变异程度的比拟。用CV表示,计算公式为: (2-12)平均指标和变异指标分别反映资料的不同特征,作为资料的总结性统计量,两类指标要求一起使用。如常用或MQR。三、典型试题分析1.名词解释:平均数答案:平均数average是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。评析此题考察平均数的概念。平均数是一类统计指标,并不单纯指算术均数。2.描述一组偏态分布资料的变异度,以 指标较好。答案:D评析标准差和变异系数均用于描述正态分布资料的变异度,全距和四分位数间距可用于任何资料,而四分位数间距更为稳定,应选D。3.用均数和标准差可以全面描述 资料的特征。答案:C评析此题考察均数和标准差的应用条件。4.同一资料的标准差是否一定小于均数?答案:均数和标准差是两类不同性质的统计指标。标准差用于描述数据的变异程度,变异程度大,那么该值大,变异程度小,那么该值小。标准差可大于均数,也可小于均数。5.试述极差、四分位数间距、标准差及变异系数的适用范围。答案:这三个指标均反映计量资料的离散程度。极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比拟。四、习 题一名词解释二单项选择题1.各观察值均加或减同一数后 。 A.均数不变,标准差改变 B.均数改变,标准差不变2.比拟身高和体重两组数据变异度大小宜采用 。 A.变异系数 3.以下指标中 可用来描述计量资料的离散程度。A.算术均数 B.几何均数 4.偏态分布宜用 描述其分布的集中趋势。C.中位数 D.四分位数间距 描述其变异程度5.各观察值同乘以一个不等于0的常数后, 不变。A算术均数 6. 分布的资料,均数等于中位数。A.对称 7.对数正态分布是一种 分布。C.左偏态 D.右偏态 8.最小组段无下限或最大组段无上限的频数分布资料,可用 描述其集中趋势。 9. 小,表示用该样本均数估计总体均数的可靠性大。C. 标准误 10.血清学滴度资料最常用来表示其平均水平的指标是 。 D. 平均数CV的数值 。A. 一定大于1 C. 可大于1,也可小于1 12.数列8、-3、5、0、1、4、-1的中位数是 。A. 2 B. 0 13.关于标准差,那项是错误的 。 D.不会小于算术均数14.中位数描述集中位置时,下面那项是错误的 。A. 适合于偏态分布资料 D.分布末端无确定值时,只能用中位数15. 5人的血清滴度为 1:20、1:40、1:80、1:160、1:320描述平均滴度,用那种指标较好 。A平均数 D. 中位数16.数列0、48、49、50、52、100的标准差为 。 17.一组变量的标准差将 。n的增大而增大n的增加而减小18.频数表计算中位数要求 。 D.没有条件限制19.一组数据中20%为3,60%为2,10%为1,10%为0,那么平均数为 。 D. 不知道数据的总个数,不能计算平均数20.某病患者8人的潜伏期如下:2、3、3、3、4、5、6、30那么平均潜伏期为 。A.均数为7天,很好的代表了大多数的潜伏期C.中位数为4天D.中位数为3.5天,不受个别人潜伏期长的影响21.某地调查20岁男大学生100名,身高标准差为4.09cm,体重标准差为4.10kg,比拟两者的变异程度,结果 。A. 体重变异度大D.由单位不同,两者标准差不能直接比拟三判断正误并简述理由1.均数总是大于中位数。( x )2.均数总是比标准差大。( x)3.变异系数的量纲和原量纲相同。( x )4.样本均数大时,标准差也一定会大。( x )5.样本量增大时,极差会增大。( )四计算题1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示: mg/m3 : 1 2 3 4 5 ug/m3 : 1000 2000 3000 4000 5000分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。2.尸检中测得北方成年女子80人的肾上腺重量g如下,试1编制频数表,2求中位数、均数和标准差。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号