资源预览内容
第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
第5页 / 共37页
第6页 / 共37页
第7页 / 共37页
第8页 / 共37页
第9页 / 共37页
第10页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第3章 统计数据的整理与显示 3.1 数据整理的意义及程序 3.2 统计分组3.3 频数分布 3.4 数据整理的组织和技术 3.5 统计表和统计图3.1 数据整理的意义及程序 3.1.1 数据整理的意义 统计数据整理就是指根据统计研究目的,将统计 调查所得的原始数据进行科学的分类汇总,或对 已经加工的次级资料进行再加工,为统计分析准 备系统化、条理化的综合资料的工作过程。 从统计工作的全过程来讲,统计数据整理是统计 工作过程的第三阶段。它在统计工作中起着承前 启后的作用。 因此,统计整理的正确与否,将直接影响到对现 象总体数量特征描述的准确性。 3.1.2 数据整理的程序 统计数据整理中必须遵循的原则是: 要在对所研究的社会经济现象进行深 刻分析的基础上,抓住最基本、最能 说明问题本质特征的统计分组和统计 指标对统计资料进行加工整理。数据整理的基本程序如下:1. 设计和编制统计数据的整理方案 2. 对调查获得的数据进行审核(1) 对原始数据进行审核(2)对二手数据进行审核 (3) 数据筛选 3. 按照一定的组织方式和方法对调查所得数据进 行分组、编码、汇总和计算 4. 对整理好的统计数据再次进行审核,及时更正 汇总过程中产生的各种差错 5. 将汇总整理的结果编制成统计表或绘制统计图 ,简明扼要地表明现象的数量特征 6. 积累、公布和管理统计数据 3.2 统计分组3.2.1 统计分组的意义 1统计分组的概念 统计分组是指根据事物内在的特点和统计研究的 需要,将统计总体按照一定的标志区分为若干组 成部分的一种统计方法。 其目的是把同质总体中的具有不同性质的单位分 开,把性质相同的单位合在一起,保持各组内统 计资料的一致性和组间资料的差异性,以便进一 步运用各种统计方法研究现象的数量表现和数量 关系,从而正确地认识事物的本质及其规律。 2统计分组的原则 (1)穷尽原则 穷尽原则就是使总体中的每一个单位都有组可归 ,或者说各分组的空间足以容纳总体所有的单位 。 (2)互斥原则 互斥原则就是在特定的分组标志下,总体中任何 一个单位只能归属于某一组,而不能同时或可能 归属于几个组。 3统计分组的作用 (1)可以区分现象质的差别 统计分组的根本作用在于区分现象质的差别。 (2)可以分析总体内部结构和总体结构特征 当研究目的在于探讨总体在某一标志上的构成, 而将总体划分为若干组成部分以显示所研究标志 的结构时,这种分组称为结构分组。 (3)可以揭示现象之间的依存关系 当研究目的在于探讨同一总体范围内两个可变标 志的依存关系时,可以将其中一个可变标志(自 变量)作为分组标志,以观察另一标志(因变量 )相应的变动情况。这种分组称为分析分组,它 可以揭示现象之间的依存关系。 4统计分组的种类 (1)品质分组(或称属性分组) 即按品质标志进行分组。一般地,对于类 别数据,采用品质分组。 (2)数量分组(或称变量分组) 即按数量标志分组,数量标志的变异性体 现在它不断变动的数量上,故也称为变量 分组。 品质分组所形成的数列称为品质数列,变 量分组所形成的数列称为变量数列。 3.2.2 统计分组体系 1简单分组与平行分组体系 简单分组就是对研究现象按一个标志进行分组, 它只能从某一方面说明和反映事物的分布状况和 内部结构。对同一个总体选择两个或两个以上的 标志分别进行简单分组,就形成平行分组体系。 2复合分组体系 复合分组就是用两个或两个以上标志层叠起来进 行分组,即先按一个标志分组,在此基础上再按 第二个标志分小组,又再层叠地按第三个标志分 成更小的组。复合分组所形成的分组体系叫做复 合分组体系。 3.2.3 分组标志的选择 统计分组中关键的问题在于选择分组标志和各组 界限的划分,而选择分组标志则是统计分组的核 心问题。 分组标志就是将统计总体区分为各个性质不同的 组的标准或根据。 为确保分组后的各组能够正确反映事物内部的规 律性,选择分组标志时应遵循以下原则:1根据统计研究的目的与任务选择分组标志2在若干个标志中要抓住具有本质性或主要的 标志作为分组依据 3根据现象所处的历史条件或经济条件来选择标 志 3.2.4 统计分组的方法 1品质分组的方法 按品质标志分组法分组就是选择反映事物 属性差异的品质标志为分组标志,在品质 标志的变异范围内划定各组界限,将总体 划分成为若干个性质不同的组成部分。 在选择分组标志时,一般情况下不会发生 困难,所出现的问题是各级界限的具体确 定。在统计实践中,为了保证各种分类的 统一性和完整性,国家对某些重要的现象 制定了统一的分类目录,如工业部门分 类目录、产品分类目录等。 2数量分组的方法 按数量标志分组就是按反映事物数量差异 的数量标志为分组标志,并在数量标志的 变异范围内,将总体划分为性质不同的若 干组成部分。 应该指出,在选择数量标志以后,分组过 程中对于总体应分为多少组,各组的界限 怎样确定,这是一个比较复杂的问题。 分组不恰当,一方面不能反映出事物本身 所具有的内在结构,另一方面也不能反映 事物的本质和规律,这就要求组数和组限 的确定要恰当、科学。3.3 频数分布 3.3.1 频数分布的概念 在统计分组的基础上,将总体中所有单位 按组归类整理,形成总体中各个单位数在 各组间的分配,叫做频数分布。 分布在各组中的个体单位数叫做次数或频 数,频数大小决定该组标志值作用的强度 。 各组次数与总次数之比叫做比率或频率, 频率表明各组值的相对作用强度。将各组别与次数按一定的次序排列所形成 的数列称作频数分布数列,简称分布数列 ,又称分配数列或频数分配。 任何分布数列都必须满足两个条件:各 组频率都是介于0和1之间的一个分数; 各组的频率总和等于1(或100)。 分布数列反映了所研究的总体中所有的单 位数在各组内的分布状态和总体的分布特 征,并据以研究总体某一标志的平均水平 及其变动的规律。按品质标志分组编制的分布数列叫做品质 分布数列或属性分布数列,简称为品质数 列。 品质数列由组的名称和各组的次数两个要 素构成。品质数列的编制程序一般比较简 单,其步骤见图3-1。原始数据分组归类组归类合计计(形成次数分布)制作统计统计 表 制作统计统计 表图图3-1 品质质数列的编编制程序3.3.2 变量数列 变量数列是依据数量标志分组编制的分布 数列,它是一种区分事物数量差别的分布 数列,反映了总体在一定时间上的量变状 态或量变过程,并从这种量的差别中来反 映事物质的差别。 按数量标志分组应注意如下两个问题: 分组时各组数量界限必须能反映事物质的 差别。应根据被研究的现象总体的数量 特征,采用适当的分组形式,确定适当的 组距、组限。 1单项式分组与组距式分组 单项式分组就是用一个变量值作为一组, 形成单项式变量数列。 单项式分组一般适用于离散型变量且变量 变动范围不大的场合。 组距式分组就是将变量依次划分为几段区 间,一段区间表现为“从到”的距 离,把一段区间内的所有变量值归为一组 ,形成组距式变量数列。 对于连续型变量或者变动范围较大的离散 型变量,适宜采用组距式分组。 2间断组距式分组和连续组距式分组 在组距式分组中,每组包含了许多变量值 ,每一组变量值中,其最小值为下限,最 大值为上限,组距是上下限之间的距离, 相邻两组的界限称为组限。 凡是组限不相连的,称为间断组距式分组 。例如,儿童按年龄可分为:1岁以下, l2岁,35岁,611岁,1214岁。 凡是组限相连(或称相重叠的),即以同 一数值作为相邻两组的共同界限,称为连 续组距式分组。例如学生按其成绩分为: 60分以下,6070分,7080分, 8090分,90l00分。3等距分组与异距分组 按数量标志进行组距式分组,还可分为等 距分组和异距(或称不等距)分组。等距 分组就是标志值在各组保持相等的组距, 即各组的标志值变动都限于相同的范围。 异距分组就是标志值在各组的组距不全相 等。 凡是在标志值变动比较均匀的情况下,都 可采用等距分组。等距分组有很多好处, 它便于计算,便于绘制统计图。 在下列场合下,必须考虑采用异距分组。 (1)标志值分布很不均匀的场合 (2)标志值变动相等的量具有不同意义的场合 (3)标值按一定比例发展变化的场合 对于异距分组,由于各组次数的多少还受到组距 不同的影响,各组的频数可能会随着组距的扩大 而增加,随着组距的缩小而减少。 为消除异距分组所造成的这种影响,须计算频数 密度(或称次数密度)和频率密度,其计算公式 如下:(3-1)4组距、组数、组限与组中值的计算 组距就是各组上下限之间的距离。组距的 大小应适度,以符合分组的要求为原则。 组距与分组的组数有密切的关系,它们实 质上是一个问题的两个方面。组距大,则 分成的组数就相应地少;组距小,则分成 的组数就多。 组数过少,容易把不同质的单位归并在一 个组内;组数过多,又容易把同质的单位 分散于许多组中,两者都不能很好地达到 分组的基本要求。 决定组数的多少并无规则可言,必须凭借经验和 所研究问题的性质做出判断。这里介绍一个确定 组数和组距的经验公式,这一公式是美国学者斯 特杰斯(H.A.Sturges)创用的,称为斯特杰斯 经验公式,即:(3-2)(3-3) 式中:k为组数;N为总体单位数;d为组距;R 为全距,即最大变量值xmax与最小变量值xmin之 差。上下限之间的中点数值称为组中值,组中 值的计算公式为:(3-4) 在计算平均指标或进行其他统计分析时, 常以组中值来代表各组标志值的平均水平 。当各组标志值均匀分布时,组中值代表各组标志值的水平的代表性就高。 在编制组距数列时,为避免出现空白组, 同时又能使个别特大或特小的变量值不致 无组可归,往往在首末两组使用开口组。 一般假定开口组的组距等于相邻组的组距 。因此,首组和末组的组中值计算公式为 :(3-7)(3-8) 组距变量数列的编制程序见图3-2。计算全距确定组数、组距确定组限合计(形成次数分布)制作统计表分组归类图3-2 组距变量数列的编制程序 原始数据序列化3.3.3 累计频数与累计频率 向上累计是指将各组频数和频率由变量值小 的组向变量值大的组累计,表明累计到该组 上限以下各组的总次数和所占的总比重; 向下累计是指将各组频数和频率由变量值大 的组向变量值小的组累计,表明累计到该组下限以上各组的总次数和所占的总比重。 3.4 数据整理的组织和技术 3.4.1 数据整理的组织形式 统计汇总的组织形式基本有三种:集中汇总逐级汇总综合汇总 3.4.2 数据整理的技术 手工汇总 电子计算机数据处理技术3.5 统计表和统计图 3.5.1 统计表 1. 统计表的概念 狭义的统计表专指分析表和容纳各种统计 资料的表格,也就是通常所说的统计表, 它清楚地、有条理地显示统计资料,直观 地反映统计分布特征。2统计表的构成 (1)从形式上统计表由总标题、横行标题 、纵栏标题和指标数值四部分组成 (2)从内容上统计表由主词栏和宾词栏两 部分组成 3统计表的分类 (1)按主词的结构分类,根据主词是否分 组和分组的程度,分为简单表、分组表和 复合表 (2)按宾词的设计分类,可分为宾词简单 排列、分组平行排列和分组层叠排列三种3统计表的设计 (1)标题设计 (2)线条的绘制 (3)合计栏的设置 (4)指标数值 (5)计量单位 (6)注解或资料来源3.5.2 统计图 1定类数据的图示 (1)条形图(bar chart) (2)饼图(pie chart) 2定序数据的图示 上面介绍的定类数据的图示方法,也都适 用于定序数据。 (1)累计频数分布图。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号