资源预览内容
第1页 / 共96页
第2页 / 共96页
第3页 / 共96页
第4页 / 共96页
第5页 / 共96页
第6页 / 共96页
第7页 / 共96页
第8页 / 共96页
第9页 / 共96页
第10页 / 共96页
亲,该文档总共96页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第三章第三章 统计资料整理统计资料整理 统计资料整理 教学目的与要求:教学目的与要求: 本章阐述统计整理的理论与方法,包括统计分本章阐述统计整理的理论与方法,包括统计分组、汇总和统计表的设计。组、汇总和统计表的设计。 学习本章的要求:学习本章的要求: 1. 1.了解对原始资料进行加工的基本方法。了解对原始资料进行加工的基本方法。 2.2.掌握分组方法和汇总技术。掌握分组方法和汇总技术。 3. 3.掌握次数分布表的编制。掌握次数分布表的编制。 4. 4.学会统计表的编制和统计图的绘制,并能学会统计表的编制和统计图的绘制,并能熟练运用。熟练运用。 统计资料整理第一节第一节 统计整理的基本问题统计整理的基本问题一、统计整理的概念和作用一、统计整理的概念和作用1 1、定义:根据统计研究的目的要求,对统计调查、定义:根据统计研究的目的要求,对统计调查 所得的各项资料进行科学的分组和汇总所得的各项资料进行科学的分组和汇总 的工作过程。的工作过程。2 2、意义:、意义: 是是对对现现象象的的认认识识从从感感性性认认识识到到理理性性认认识识的的开开始,在统计研究工作中发挥着承前启后的作用。始,在统计研究工作中发挥着承前启后的作用。 统计资料整理二、统计整理的基本步骤二、统计整理的基本步骤1 1、制定统计整理方案、制定统计整理方案2 2、原始资料的审核、筛选与排序、原始资料的审核、筛选与排序3 3、进行统计分组和统计汇总、进行统计分组和统计汇总4 4、编制统计图表、编制统计图表统计资料整理三、数据的预处理三、数据的预处理(1 1)资料的完整性和及时性)资料的完整性和及时性 调调查查单单位位或或填填报报单单位位是是否否齐齐全全,规规定定项项目目是是否否有有不不报报、漏漏报报、缺缺报报现现象象,应应报报资资料料的的份份数数是是否符合规定等。否符合规定等。 (2 2)资料的正确性)资料的正确性 检查所填报资料是否准确可靠。检查所填报资料是否准确可靠。n方法有:方法有:逻辑检查;逻辑检查;计算检查计算检查1 1、数据的审核、数据的审核统计资料整理审核数据准确性的方法审核数据准确性的方法n逻辑检查逻辑检查n从定性角度,审核数据是否符合逻辑,内容从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾是否合理,各项目或数字之间有无相互矛盾的现象的现象n计算检查计算检查n检查调查表中的各项数据在计算结果和计算检查调查表中的各项数据在计算结果和计算方法上有无错误方法上有无错误统计资料整理(3 3)二手数据的审核)二手数据的审核 审核适用性和时效性审核适用性和时效性2 2、数据筛选、数据筛选(1 1)将某些不符合要求的数据或有明显错误的数据)将某些不符合要求的数据或有明显错误的数据予以剔除予以剔除(2 2)将符合某种特定条件的数据筛选出来,而不符)将符合某种特定条件的数据筛选出来,而不符合特定件的数据予以剔出合特定件的数据予以剔出3 3、数据排序、数据排序统计资料整理第二节第二节 质量数据的整理与展示质量数据的整理与展示一、定类数据的整理与显示一、定类数据的整理与显示(一)频数和频数分布(一)频数和频数分布 频数(次数):落在某一特定类别中的数据个数频数(次数):落在某一特定类别中的数据个数 频数分布(次数分布):频数分布(次数分布): 把各个类别及其相应的把各个类别及其相应的 频数全部列出来频数全部列出来 频率(比重):某一类别数据占全部数据的比值频率(比重):某一类别数据占全部数据的比值(二)定类数据的图示(二)定类数据的图示统计资料整理1、条形图(柱形图、条形图(柱形图)(1)什么是条形图?)什么是条形图? 以长方形的以长方形的高低高低或或长短长短来反来反映统计资料的一种统计图形。映统计资料的一种统计图形。统计资料整理(2)绘制柱形图的规则 1)横轴(基线)和纵轴,尺度均需从)横轴(基线)和纵轴,尺度均需从0开始;开始; 2)尺度的最大数值要)尺度的最大数值要略大于略大于资料中的最大值资料中的最大值 3)尺度上数值应整齐且)尺度上数值应整齐且间隔相等间隔相等; 4)所绘图形的宽度要)所绘图形的宽度要均匀均匀,条与条之间的距,条与条之间的距离要相等;离要相等; 5)复合条形图,复合条形应用)复合条形图,复合条形应用不同线条不同线条或或不不同颜色同颜色的条形来绘制;的条形来绘制; 6)写标题、标目、图号、文字说明等。)写标题、标目、图号、文字说明等。统计资料整理例:例:统计资料整理2 2、饼形图:、饼形图:是用圆形及圆内扇形的面积来表示数值大小的是用圆形及圆内扇形的面积来表示数值大小的图形。主要用于表示总体中各组成部分所占的比例,图形。主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。对于研究结构性问题十分有用。方法:方法:在绘制圆形图时,总体中各部分所占的百分在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占度,是按各部分百分比占3603600 0的相应比例确定的。的相应比例确定的。统计资料整理例题例题 为为研研究究广广告告市市场场的的状状况况,一一家家广广告告公公司司在在某某城城市市随随机机抽抽取取200200人人就就广广告告问问题题做做了了邮邮寄寄问问卷卷调调查查,其其中中的的一一个个问问题题是是“您您比比较较关关心心下下列列哪哪一一类广告?类广告?” 1 1商商品品广广告告;2 2服服务务广广告告;3 3金金融融广广告告;4 4房房地地产产广广告告;5 5招招生生招招聘聘广广告告;6 6其其他他广广告。告。某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告服务广告服务广告金融广告金融广告房地产广告房地产广告招生招聘广告招生招聘广告其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100统计资料整理例如,关注服务广告的人数占总人数的百分比为例如,关注服务广告的人数占总人数的百分比为25.5%25.5%,那么其扇形的中心角度就应为那么其扇形的中心角度就应为3603600 025.5%25.5%91.891.80 0,其余,其余类推类推 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成统计资料整理15%6%9%8%33%29%饮食饮食教育教育娱乐娱乐旅游旅游交通交通服装服装饼饼形形图图某城市居民消费支出构成图某城市居民消费支出构成图统计资料整理二、定序数据的整理与显示二、定序数据的整理与显示除了可用定类数据的整理和显示方法外,还可除了可用定类数据的整理和显示方法外,还可以计算累计频数和累计频率。以计算累计频数和累计频率。1 1、累计频数和累计频率、累计频数和累计频率将各类别的次数和频率逐组连续相加而得到的将各类别的次数和频率逐组连续相加而得到的累计数。累计数。种类:种类:以下累计(向上累计):由低以下累计(向上累计):由低高逐组累计高逐组累计以上累计(向下累计):由高以上累计(向下累计):由高低逐组累计低逐组累计 统计资料整理 例题例题例题例题 在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“ “您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况况况况是是是是否满意?否满意?否满意?否满意? 1 1非非非非常常常常不不不不满满满满意意意意;2 2不不不不满满满满意意意意;3 3一一一一般般般般;4 4满满满满意;意;意;意;5 5非常满意。非常满意。非常满意。非常满意。 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累计向上累计向下累计向下累计户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0统计资料整理 50 50名学生成绩次数分布表名学生成绩次数分布表按成绩按成绩分组分组人人数数频率频率(%)以下累计以下累计以上累计以上累计次数次数 频率频率(%)次数次数 频率频率(%)差差363650100中中13 2616324794良良24 4840803468优优10 20501001020合合计计50 100统计资料整理2 2、顺序数据的显示、顺序数据的显示(1 1)环形图)环形图(2 2)累计分布图)累计分布图统计资料整理243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向下累积向下累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向上累积向上累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布统计资料整理第三节第三节 数值数据的整理与展示数值数据的整理与展示一、统计分组的概念一、统计分组的概念根根据据社社会会经经济济现现象象的的特特点点和和统统计计研研究究的的目目的的要要求求,按照某种重要标志把总体分成若干部分的科学分类。按照某种重要标志把总体分成若干部分的科学分类。 两方面含义:两方面含义:(1 1)对总体而言:是)对总体而言:是“分分”,即将总体分为若干性质相,即将总体分为若干性质相 异的部分异的部分(2 2)对总体单位而言:是)对总体单位而言:是“合合”,即将性质相同的个体,即将性质相同的个体 组合起来组合起来组内同质性,组间差异性组内同质性,组间差异性统计资料整理二、统计分组的作用二、统计分组的作用1 1、划分现象的不同类型、划分现象的不同类型2 2、研究现象的内部结构、研究现象的内部结构3 3、分析现象之间的依存关系、分析现象之间的依存关系三、统计分组的种类三、统计分组的种类1、按分组标志个数不同、按分组标志个数不同(1 1)简单分组:把总体只按一个标志分组。)简单分组:把总体只按一个标志分组。(2 2)复合分组)复合分组 对同一总体选择两个或两个以上标志层叠起来对同一总体选择两个或两个以上标志层叠起来进行分组。进行分组。例如:同时选择学科、学制、例如:同时选择学科、学制、 性别三个标志对某学性别三个标志对某学院全体在校学生这个总体进行分组。院全体在校学生这个总体进行分组。(3 3)并列分组)并列分组 统计资料整理例例:对学生的分类对学生的分类按学科、学制、性别分组按学科、学制、性别分组文科文科本科本科专科专科男生男生女生女生男生男生女生女生男生男生女生女生男生男生女生女生本科本科专科专科理科理科学学 生生统计资料整理例例:对工业企业的分类对工业企业的分类按轻重工业、企业规模、盈亏状况分组按轻重工业、企业规模、盈亏状况分组重工业重工业大型大型中型中型小型小型盈利盈利亏损亏损盈利盈利亏损亏损盈利盈利亏损亏损盈利盈利亏损亏损盈利盈利亏损亏损盈利盈利亏损亏损大型大型中型中型小型小型轻工业轻工业工业企业工业企业统计资料整理2、按分组标志性质不同、按分组标志性质不同(1 1)品质分组)品质分组(2 2)数量分组)数量分组 A A、单项式分组:一个变量值表示一个组的分组。、单项式分组:一个变量值表示一个组的分组。适用于离散型变量且变量的取值不多。适用于离散型变量且变量的取值不多。例如:职工家庭人口数,其取值不可例如:职工家庭人口数,其取值不可 能很多,且每一个取值都可视能很多,且每一个取值都可视 为一种类型为一种类型 。 按家庭人口数分组按家庭人口数分组 1 1人人 2 2人人 3 3人人 4 4人人 5 5人人 6 6人人统计资料整理B B、组距式分组、组距式分组 凡是用一定范围内的两个变量值表示一个组的分组。凡是用一定范围内的两个变量值表示一个组的分组。 要点:要点: 将变量值的一个区间作为一组将变量值的一个区间作为一组 适合于连续变量适合于连续变量 也适合于虽为离散型变量但变量值较多的情况也适合于虽为离散型变量但变量值较多的情况 必须遵循必须遵循“不重不漏不重不漏”的原则的原则 可采用等距分组,也可采用不等距分组可采用等距分组,也可采用不等距分组 统计资料整理组距式分组举例:组距式分组举例: 1 1)连续型变量的组距式分组)连续型变量的组距式分组 如对商店按销售额进行分组如对商店按销售额进行分组 : 按按销售额分组销售额分组( (万元万元) )5050以下以下5020050200200400200400400600400600600800600800800800以上以上统计资料整理2 2)离散型变量的组距式分组)离散型变量的组距式分组n 如对某企业的如对某企业的2020生产小组按人数分组:生产小组按人数分组: 生产小组生产小组 按人数分组(人)按人数分组(人)110110112011202130213031403140注意:注意:离散变量相邻两组的上下限既可以间断,也可以离散变量相邻两组的上下限既可以间断,也可以 重叠;连续变量相邻两组的上下限只能重叠。重叠;连续变量相邻两组的上下限只能重叠。统计资料整理四、分组标志的选择四、分组标志的选择1 1、要符合统计研究的目的和要求、要符合统计研究的目的和要求2 2、必须选择最重要的标志作为分组依据、必须选择最重要的标志作为分组依据例如,例如, 要要研研究究各各地地区区的的经经济济发发展展水水平平时时,可可供供选选择择的的分分组组标标志志有有国国内内生生产产总总值值、国国民民收收入入、社社会会总总产产值值、人人均均国国内内生生产产总值等总值等 研研究究企企业业经经济济效效益益好好坏坏,可可供供选选择择的的分分组组标标志志有有工工业业总总产值、利润总额、净产值、利税总额、人均利税额等产值、利润总额、净产值、利税总额、人均利税额等3 3、要考虑到社会经济现象所处的具体历史条件、要考虑到社会经济现象所处的具体历史条件 统计资料整理穷尽原则(总体中的每一个单位都有组可归)穷尽原则(总体中的每一个单位都有组可归)互斥原则(总体中任何一个单位只能归属于某一组)互斥原则(总体中任何一个单位只能归属于某一组)五、统计分组的原则与方法五、统计分组的原则与方法(一)原则(一)原则(二)品质分组的方法(二)品质分组的方法 品质分组比较简单,分组标志一经确定,组的品质分组比较简单,分组标志一经确定,组的名称和组数也随之确定。名称和组数也随之确定。如人口按性别分组、企业按所有制分组等如人口按性别分组、企业按所有制分组等 组数由研究对象的特点和统计研究的任务决定。组数由研究对象的特点和统计研究的任务决定。统计资料整理N15242544458990179180359n56789n组数:即将总体分为几组。组数:即将总体分为几组。 n组数的确定:组数的确定:(1 1)全距(总体最大最小值差额)全距(总体最大最小值差额)(2 2)组距(各组最大值)组距(各组最大值( (上限上限)-)-最小值(下限)。最小值(下限)。n 组数组数= =全距全距/ /组距组距n组数的确定无统一固定原则,可参考美国学者斯特杰组数的确定无统一固定原则,可参考美国学者斯特杰斯(斯(Sturges)的经验公式)的经验公式: n=1+3.3lgN,d=R/n: n=1+3.3lgN,d=R/n ( n n组数,组数,N N总体单位数,总体单位数,d d组距,组距,R R全距全距 ) 1 1、组数与组距、组数与组距(三)数量分组的方法(三)数量分组的方法统计资料整理2 2、组限、组限n组限:指每组两端数值。组限:指每组两端数值。n分上限和下限分上限和下限n上限:每组的终点数值(最大值)上限:每组的终点数值(最大值)n下限:每组的起点数值(最小值)下限:每组的起点数值(最小值)n组限的形式:组限的形式:组限重合式组限重合式: :相邻两组,前一组上限等于下一组下限相邻两组,前一组上限等于下一组下限组限不重合组限不重合: :相邻两组,前一组上限不等于下一组下相邻两组,前一组上限不等于下一组下限,但紧密相连限,但紧密相连n组距组距: :本组上限本组上限- -本组下限本组下限统计资料整理3 3、组中值、组中值n组中值:组中值:各组上下限之间的中点值,各组上下限之间的中点值,本组变量的一本组变量的一 般水平或代表值。般水平或代表值。计算公式:计算公式:n组中值组中值= =(上限下限)(上限下限)2 (2 (重合式组限重合式组限) )n组中值组中值=(=(本组下限本组下限+ +下组下限下组下限) 2) 2 ( (不重合式组限)不重合式组限)统计资料整理开口组开口组n开口组开口组: :形如形如“以上以上”、“以下以下”的组。的组。n计算公式:计算公式:n缺下限开口组组中值缺下限开口组组中值= =上限上限- -邻组组距邻组组距/2/2n缺上限开口组组中值缺上限开口组组中值= =下限下限+ +邻组组距邻组组距/2/2例:例:成绩分组成绩分组60以下以下60707080809090以上以上组中值组中值5565758595统计资料整理1 1、统计汇总:在统计分组的基础上,将总体中的所有、统计汇总:在统计分组的基础上,将总体中的所有 单位按组归类整理。单位按组归类整理。 遵循遵循“上限不在内上限不在内”原则原则2 2、次数分布数列、次数分布数列 指反映总体单位在各组的分布状况的一系列数字。它是指反映总体单位在各组的分布状况的一系列数字。它是在统计分组的基础上将总体的所有单位按组归类,并把所有在统计分组的基础上将总体的所有单位按组归类,并把所有的组及其单位数按一定顺序排列而成。的组及其单位数按一定顺序排列而成。 基本要素:各组的名称(各组变量值)基本要素:各组的名称(各组变量值) “x” “x” 各组单位数(次数)各组单位数(次数) “f” “f” 六、统计汇总和分布数列六、统计汇总和分布数列统计资料整理(2 2)按分组形式不同分:)按分组形式不同分:单项式数列:每组只有一具体变量值单项式数列:每组只有一具体变量值组距式数列:用组距代表一个组组距式数列:用组距代表一个组n(分等距数列和不等距数列)(分等距数列和不等距数列)次数分布数列的种类次数分布数列的种类(1 1)按分组标志不同分:品质数列和变量数列)按分组标志不同分:品质数列和变量数列统计资料整理(3 3)按次数分布特征分:)按次数分布特征分:钟形分布:钟形分布:-特征是特征是“两头小,中间大两头小,中间大”,即靠近中间的变量值分布的次即靠近中间的变量值分布的次数多,靠近两边的变量分布次数多,靠近两边的变量分布次数少,形若古钟。数少,形若古钟。分为:正态分布、左偏分布和右偏分布分为:正态分布、左偏分布和右偏分布统计资料整理形分布:形分布:-其特征与钟型分布正相反,靠近其特征与钟型分布正相反,靠近中间的变量值分布的次数少,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成两端的变量值分布次数多,形成“两两头大,中间小头大,中间小”的字型分布。的字型分布。JJ形分布:形分布:统计资料整理七、变量分布数列的编制七、变量分布数列的编制(1 1)单项式分布数列(变动范围不大的离散型变量)单项式分布数列(变动范围不大的离散型变量)要点:要点: 将一个变量值作为一组将一个变量值作为一组 适合于离散变量适合于离散变量 适合于变量值较少的情况适合于变量值较少的情况1 1、简单次数分布数列的编制、简单次数分布数列的编制日产量日产量 工人数工人数 9 5 10 12 11 23 12 7 13 3单单 项项 数数 列列统计资料整理适适用用于于变变动动范范围围大大且且变变量量数数值值多多的的连连续续型型变变量量或或离散型变量离散型变量 要点:要点: 将变量值的一个区间作为一组将变量值的一个区间作为一组 必须遵循必须遵循“不重不漏不重不漏”的原则的原则 可采用等距分组,也可采用不等距分组可采用等距分组,也可采用不等距分组(2 2)组距式分布数列)组距式分布数列统计资料整理n步骤:步骤:按大小排列,计算出全距;按大小排列,计算出全距; 确定组距和组数确定组距和组数 (组距一般选(组距一般选1010或或5 5的倍数);的倍数); 确定组限及表示方法;确定组限及表示方法; 计算各组次数和频率。计算各组次数和频率。 遵循遵循“上限不在内上限不在内”原则原则统计资料整理举例:分布数列的编制举例:分布数列的编制例如,某生产车间例如,某生产车间5050名工人日加工零件数如下:名工人日加工零件数如下: 117 122 124 129 139 107 117 122 124 129 139 107 117 130 122 125 108 131 117 130 122 125 108 131 125 117 122 133 126 122 125 117 122 133 126 122 118 108 110 118 123 126 118 108 110 118 123 126 133 134 127 123 118 112 133 134 127 123 118 112 112 134 127 123 119 113 112 134 127 123 119 113 120 123 127 135 137 114 120 123 127 135 137 114 120 128 124 115 139 128 120 128 124 115 139 128 124 121124 121统计资料整理 编制过程编制过程n首先,对上面的数据进行排序首先,对上面的数据进行排序 107 108 108 110 112 112 113 107 108 108 110 112 112 113 114 115 117 117 117 118 118 114 115 117 117 117 118 118 118 119 120 120 121 122 122 118 119 120 120 121 122 122 122 122 123 123 123 123 124 122 122 123 123 123 123 124 124 124 125 125 126 126 127 124 124 125 125 126 126 127 127 127 128 128 129 130 131 127 127 128 128 129 130 131 133 133 134 134 135 137 139 133 133 134 134 135 137 139 139139n第二步,全距第二步,全距1391391071073232,定组距,定组距=10=10n确定组数确定组数 组数组数=3210=32103.2 3.2 组数组数4 4n第三步,确定组限,计算各组次数、频率及累计次数第三步,确定组限,计算各组次数、频率及累计次数 统计资料整理 50 50名工人日产零件数次数分布表名工人日产零件数次数分布表按零件数分组(件)按零件数分组(件)次数次数(人)(人)频率频率(%)10011036110120132612013024481301401020合合计计50100统计资料整理思考:思考:某地区对其所属某地区对其所属5050家国有企业按生产计划完成家国有企业按生产计划完成 程度进行分组,正确的应为:程度进行分组,正确的应为:第一种分组:第一种分组:90%90%以下以下 第二种分组:第二种分组:100%100%以下以下 90.1%-100% 100%-110% 90.1%-100% 100%-110% 100.1%-110% 110% 100.1%-110% 110%以上以上 110.1% 110.1%以上以上第三种分组:第三种分组: 85% 85%以下以下 85%-95% 85%-95% 95%-105% 95%-105% 105% 105%以上以上统计资料整理2 2、累计次数分布数列、累计次数分布数列 为为了了知知道道截截止止某某一一变变量量值值以以上上或或以以下下的的分分配配次次数数是多少,则需要把次数进行累计相加。是多少,则需要把次数进行累计相加。 将将变变量量数数列列各各组组的的次次数数和和频频率率逐逐组组连连续续相相加加而而得到的累计数进行排列得到的累计数进行排列(2 2)种类:)种类: 以下累计(向上累计):由低以下累计(向上累计):由低高逐组累计高逐组累计 表示该组表示该组上限以下上限以下的次数(频率)有多少的次数(频率)有多少 以上累计(向下累计):由高以上累计(向下累计):由高低逐组累计低逐组累计 表示该组表示该组下限以上下限以上的次数(频率)有多少的次数(频率)有多少统计资料整理5050名工人日产零件数次数分布表名工人日产零件数次数分布表按零件数按零件数分组分组次次数数频率频率(%)以下累计以下累计以上累计以上累计次数次数 频率频率(%)次数次数 频率频率(%)1001103 6365010011012013 261632479412013024 484080346813014010 20501001020合合计计50 100统计资料整理 某班学生考试成绩次数分布表某班学生考试成绩次数分布表按按成绩分组成绩分组(分)(分)学生学生人数人数(人)(人)频率频率(%)以下累计以下累计以上累计以上累计次次数数频率频率(%)次数次数频率频率(%)6060分以下分以下 2 23.702 23.70545410060-7060-70151527.78171731.48525296.3070-8070-80191935.19363666.67373768.5280-9080-909090分以上分以上15153 327.785.565151545494.4410018183 333.335.56合合计计54100 -想一想:第四组的累计结果说明什么问题?想一想:第四组的累计结果说明什么问题?统计资料整理八、次数分布数列的表示八、次数分布数列的表示(一)列表法(一)列表法 性性 别别 人人 数(人)数(人) 频频 率率(% %) 男男 732 732 57.14 57.14 女女 549 549 42.86 42.86 合合 计计 1281 1281 100.00 100.001 1、某高校学生性别分布表、某高校学生性别分布表统计资料整理2 2、某厂工人日产量分布表、某厂工人日产量分布表按日产量分组(件)按日产量分组(件) 工人数(人)工人数(人) 比比 率率(% %) 9 9 12 12 4.00 4.00 10 10 38 38 12.67 12.67 11 11 65 65 21.67 21.67 12 12 85 85 28.33 28.33 13 13 60 60 20.00 20.00 14 14 30 30 10.00 10.00 15 15 10 10 3.33 3.33 合合 计计 300 300 100.00 100.00统计资料整理3 3、某班学生按考试成绩分组、某班学生按考试成绩分组 按成绩分组按成绩分组(分)(分) 人数(人)人数(人) 比率比率(% %) 60 60以下以下 7 7 8.8 8.8 6070 6070 21 21 26.2 26.2 7080 7080 25 25 31.2 31.2 8090 8090 19 19 23.8 23.8 90 90以上以上 8 8 10.0 10.0 合合 计计 80 80 100.0 100.0统计资料整理( (二二) )图示法图示法 1 1、直方图、直方图用直方形的宽度和高度来表示次数分布的图形。用直方形的宽度和高度来表示次数分布的图形。直方图的制作方法:直方图的制作方法:在直角坐标中,用横轴表示数据分组,纵轴在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。有个矩形,即直方图。有单式、复式等形式。单式、复式等形式。统计资料整理资料:资料: 5050名工人日产零件数次数分布表名工人日产零件数次数分布表按零件数分组(件)按零件数分组(件)次数(人)次数(人)105110110115115120120125125130130135135140358151063合合计计50直方图的绘制直方图的绘制统计资料整理直方图的绘制直方图的绘制频频频频频频数数数数数数( ( (人人人人人人) ) )151512129 96 63 3105105 110110 115115 120120125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数( (个个个个个个) )某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图我一眼就看出来了,我一眼就看出来了,我一眼就看出来了,我一眼就看出来了,大多数人的日加工大多数人的日加工大多数人的日加工大多数人的日加工零件数在零件数在零件数在零件数在120120125125之间之间之间之间! !统计资料整理单式柱形图单式柱形图例:例:20052005年我国旅客周转量年我国旅客周转量( (亿人公里亿人公里) )统计资料整理复式柱形图复式柱形图1998200219982002年我国进出口总额年我国进出口总额( (亿美元亿美元) )统计资料整理2 2、折线图、折线图折线图是在直方图的基础上,把直方图顶部的中点折线图是在直方图的基础上,把直方图顶部的中点( (组中值组中值) )用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是:折线图的两个终点要与横轴相交,具体的做法是: 第一个矩形的顶部中点通过竖边中点(即该组频数第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴其竖边中点连接到横轴统计资料整理151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数( (个个个个个个) )频频频频频频数数数数数数( (人人人人人人) )折线图下的面积折线图下的面积与直方图的面积与直方图的面积相等!相等!折线图的绘制折线图的绘制某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图统计资料整理3 3、曲线图、曲线图对折线图的折线平滑化,得到曲线图对折线图的折线平滑化,得到曲线图统计资料整理第四节第四节 统计资料的显示统计资料的显示一、统计表一、统计表(一)统计表的概念和结构(一)统计表的概念和结构1 1、概念:集中而有序地表现统计资料的表格。、概念:集中而有序地表现统计资料的表格。 作用:它清楚地、有条理地显示统计资料,直观地反映统作用:它清楚地、有条理地显示统计资料,直观地反映统 计分布特征,便于计算、分析,是统计分析的一种重要工具。计分布特征,便于计算、分析,是统计分析的一种重要工具。 2 2、结构:、结构: 外形结构:总标题、横行和纵栏标题、数字资料外形结构:总标题、横行和纵栏标题、数字资料 内容结构:主词、宾词内容结构:主词、宾词统计资料整理(二)统计表的结构(二)统计表的结构 我国我国20072007年国内生产总值年国内生产总值( (总标题)总标题)按三次产业分按三次产业分 国内生产总值国内生产总值 (亿元)(亿元)比上年增长比上年增长率率(%(%) 第一产业第一产业 28 910 28 910 3.7 3.7 第二产业第二产业 121 381 121 381 13.4 13.4 第三产业第三产业 96 328 96 328 11.4 11.4 合合 计计 246 619 246 619 11.6 11.6横横行行标标题题纵纵栏栏标标题题数数字字资资料料主词主词宾词宾词统计资料整理(三)统计表的种类(三)统计表的种类1 1、按用途的不同分:、按用途的不同分:(1 1)调查表)调查表(2 2)汇总表)汇总表(3 3)分析表)分析表2 2、按主词的分组情况分:、按主词的分组情况分:统计资料整理(1 1)简单表)简单表例例1 1: 城城 市市 人口数人口数( (人人) ) 较较19821982年年7 7月月1 1日零时增长日零时增长% % 北京市北京市 10819407 10819407 17.21 17.21 天津市天津市 8785402 8785402 13.15 13.15 上海市上海市 13341896 13341896 12.50 12.50 我国三个城市的人口数我国三个城市的人口数 (1990 (1990年年7 7月月1 1日零时日零时) )统计资料整理例例2 2 : 年份年份 固定电话固定电话 移动电话移动电话 1998 1998 8742 8742 2386 2386 1999 1999 10872 10872 4330 4330 2000 2000 14483 14483 8453 8453 2001 2001 18037 18037 14522 14522 2002 2002 21442 21442 20662 20662 我国我国1998-20021998-2002年拥有电话户数年拥有电话户数( (万户万户) )统计资料整理(2 2)分组表)分组表例例1 1:学生成绩分布表:学生成绩分布表例例2 2: 某地区农户拥有电视机情况某地区农户拥有电视机情况按农户收入分组按农户收入分组(元)(元)农户数(户)农户数(户) 拥有电视机数拥有电视机数(台)(台)800800元以下元以下800-1200800-12001200-16001200-16001600-20001600-200020002000元以上元以上44044048048056056032032020020034348888140140118118120120合计合计20002000510510统计资料整理(3 3)复合表)复合表 某年末某地区人口资料某年末某地区人口资料 按城乡及性按城乡及性别分组别分组人口数(万人)人口数(万人)增长率()增长率()(与上年比)(与上年比)城镇人口城镇人口男性人口男性人口女性人口女性人口50030020022.51.5农村人口农村人口男性人口男性人口女性人口女性人口3001801203.22.62合计合计8002.9统计资料整理(四)宾词指标的设计(四)宾词指标的设计1 1、平行设计、平行设计(1 1)对宾词不作任何分组)对宾词不作任何分组 城城 市市 人口数人口数( (人人) ) 较较19821982年年7 7月月1 1日零时增长日零时增长% % 北京市北京市 10819407 10819407 17.21 17.21 天津市天津市 8785402 8785402 13.15 13.15 上海市上海市 13341896 13341896 12.50 12.50例:我国三个城市的人口数例:我国三个城市的人口数(1990(1990年年7 7月月1 1日零时日零时) )统计资料整理(2 2)对宾词进行并列分组)对宾词进行并列分组例:例:某个企业车间人员情况统计表某个企业车间人员情况统计表车车间间人数人数(人)(人)性别性别教育程度教育程度男男女女初中初中高中高中大学大学第一车间第一车间第二车间第二车间第三车间第三车间1672546554963011315835599235881322220308合合计计48618030618624258统计资料整理2 2、叠列设计、叠列设计将宾词按两个或两个以上标志进行复合分组将宾词按两个或两个以上标志进行复合分组统计资料整理(五)编制统计表的原则(五)编制统计表的原则 1 1、格式要规范,统一、格式要规范,统一 一般一般 “ “上、下粗线,中间细线,两边开口上、下粗线,中间细线,两边开口” 2 2、内容简明扼要,项目排列合理、内容简明扼要,项目排列合理 3 3、字迹清楚规范,数字整齐、字迹清楚规范,数字整齐 表表中中的的数数据据一一般般是是右右对对齐齐,有有小小数数点点时时应应以以小小数数点点对齐,而且小数点的位数应统一对齐,而且小数点的位数应统一 4 4、使用正确的计量单位、使用正确的计量单位 5 5、对于没有数字的表格单元,一般用、对于没有数字的表格单元,一般用“”“”表示表示 6 6、必要时可在表的下方加上注释、必要时可在表的下方加上注释统计资料整理练习:练习:设甲、乙两个企业某年末有关资料如下所示:设甲、乙两个企业某年末有关资料如下所示:要求:设计一张主词按甲、乙企业分组,宾词作复合设计的要求:设计一张主词按甲、乙企业分组,宾词作复合设计的统计表,表明甲、乙企业的职工数和不同工龄中男、女人统计表,表明甲、乙企业的职工数和不同工龄中男、女人数。数。工龄工龄分组分组(年)(年)甲企业甲企业乙企业乙企业人数人数(人)(人)男男女女人数人数(人)(人)男男女女1以下以下1-55以上以上8233543840184298421511401202376336104428413321合计合计855522333420182238统计资料整理甲、乙企业职工人数及分布表甲、乙企业职工人数及分布表单位:人单位:人企企业业职工职工总人总人数数工工龄龄1年以下年以下15年年5年以上年以上男男女女合合计计男男女女合合计计男男女女合合计计甲甲乙乙合合计计8554201275403676428412682120202184104288151133284335237572298423401402116143863501统计资料整理二、统计图二、统计图(一)含义(一)含义 通过几何图形或具体事物的形象和符号来通过几何图形或具体事物的形象和符号来表现统计资料的方式。表现统计资料的方式。(二)优点(二)优点 鲜明直观鲜明直观 形象生动形象生动 通俗易懂通俗易懂 一目了然一目了然 易读易记易读易记 印象深刻印象深刻(三)统计图的分类(三)统计图的分类分为分布图和形象图两大类。分为分布图和形象图两大类。统计资料整理统计图的构成统计图的构成1 图题图题 图图8某国各地降水量某国各地降水量降降水水量量(毫毫米米)2 图号图号3 图目图目4 图尺图尺5 图形图形6 图注图注图题图号图目图尺图形图注图目统计资料整理1 1、饼形图:、饼形图:是用圆形及圆内扇形的面积来表示数值大小的是用圆形及圆内扇形的面积来表示数值大小的图形。主要用于表示总体中各组成部分所占的比例,图形。主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。对于研究结构性问题十分有用。方法:方法:在绘制圆形图时,总体中各部分所占的百分在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占度,是按各部分百分比占3603600 0的相应比例确定的。的相应比例确定的。统计资料整理例如,关注服务广告的人数占总人数的百分比为例如,关注服务广告的人数占总人数的百分比为25.5%25.5%,那么其扇形的中心角度就应为那么其扇形的中心角度就应为3603600 025.5%25.5%91.891.80 0,其余,其余类推类推 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成统计资料整理15%6%9%8%33%29%饮食饮食教育教育娱乐娱乐旅游旅游交通交通服装服装饼饼形形图图某城市居民消费支出构成图某城市居民消费支出构成图统计资料整理2、柱形图、柱形图(条形图)(条形图)(1)什么是柱形图?)什么是柱形图? 以长方形的以长方形的高低高低或或长短长短来反来反映统计资料的一种统计图形。映统计资料的一种统计图形。统计资料整理(2)绘制柱形图的规则 1)横轴(基线)和纵轴,尺度均需从)横轴(基线)和纵轴,尺度均需从0开始;开始; 2)尺度的最大数值要)尺度的最大数值要略大于略大于资料中的最大值资料中的最大值 3)尺度上数值应整齐且)尺度上数值应整齐且间隔相等间隔相等; 4)所绘图形的宽度要)所绘图形的宽度要均匀均匀,条与条之间的距,条与条之间的距离要相等;离要相等; 5)复合条形图,复合条形应用)复合条形图,复合条形应用不同线条不同线条或或不不同颜色同颜色的条形来绘制;的条形来绘制; 6)写标题、标目、图号、文字说明等。)写标题、标目、图号、文字说明等。统计资料整理例:例:统计资料整理(1)曲线图:)曲线图:是以线条的连续升降来表示现象动态及现象间的依存是以线条的连续升降来表示现象动态及现象间的依存关系的统计图形。关系的统计图形。3 3、线形图:、线形图:统计资料整理(2)折线图:)折线图:统计资料整理4 4、茎叶图茎叶图用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由由数数字字组成的组成的以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别A A、直直方方图图可可大大体体上上看看出出一一组组数数据据的的分分布布状状况况,但但没没有给出具体的数值有给出具体的数值B B、茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个原始数值,保留了原始数据的信息个原始数值,保留了原始数据的信息统计资料整理举例:举例:资料:某班资料:某班4040名学生英语考试成绩如下:名学生英语考试成绩如下: 68 89 88 84 86 87 75 73 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87 83 81 78 77 72 61 70 87 要求:绘制茎叶图要求:绘制茎叶图 统计资料整理树茎树茎树茎树茎 树叶树叶树叶树叶4784780145880145880122235566667890122235566667891123456778991123456778995 56 67 78 8数据个数数据个数数据个数数据个数3 36 615151212茎叶图的图示茎叶图的图示 学生成绩的茎叶图学生成绩的茎叶图学生成绩的茎叶图学生成绩的茎叶图9 91 2 5 91 2 5 94 4统计资料整理5、面积图:、面积图:统计资料整理6、象形图:、象形图:日本美国欧共体有关指标比较土土地地面面积积人口密度人口密度人口密度人口密度日本日本美国美国欧共体欧共体统计资料整理 这个资料适合这个资料适合绘制线形图吗绘制线形图吗?1998年末深圳、香港、新加坡人口比较年末深圳、香港、新加坡人口比较 单位:万人单位:万人 一想想统计资料整理深圳、香港、新加坡人口比较深圳、香港、新加坡人口比较 单位:万人单位:万人香港香港新加坡新加坡深圳深圳7006005004003002001000人人口口数数(万万人人)统计资料整理统计资料整理一、判断题:一、判断题:1 1、统计表的主词栏是说明总体各种统计指标的。(、统计表的主词栏是说明总体各种统计指标的。( )2 2、统计分组的关键问题是确定组距和组数。(、统计分组的关键问题是确定组距和组数。( )3 3、组中值是根据各组上限和下限计算的平均值,所以它代表了、组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分布次数。(每一组的平均分布次数。( )4 4、分布数列的实质是把总体单位总量按照总体所分的组进行分、分布数列的实质是把总体单位总量按照总体所分的组进行分配。(配。( )5 5、连续型变量和离散型变量在进行组距式分组时,均可采用相、连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(邻组组距重叠的方法确定组限。( )6 6、某企业职工按文化程度分组形成的分配数列是一个单项式分、某企业职工按文化程度分组形成的分配数列是一个单项式分布数列。(布数列。( )7.7.统计分组以后,掩盖了各组内部各单位的差异,而突出了各组统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(之间单位的差异。( )统计资料整理二、选择题二、选择题1 1、 下列分组中属于按品质标志分组的是(下列分组中属于按品质标志分组的是( )。)。、学生按考试分数分组、学生按考试分数分组 、产品按品种分组、产品按品种分组、企业按计划完成程度分组、企业按计划完成程度分组 、家庭按年收入分组、家庭按年收入分组2 2、 有一个学生考试成绩为分,在统计分组中,有一个学生考试成绩为分,在统计分组中,这个变量值应归入(这个变量值应归入( )。)。、60-7060-70分这一组分这一组 、70-8070-80分这一组分这一组、60-7060-70分或分或70-8070-80分两组都可以分两组都可以、单独列一组、单独列一组统计资料整理3 3、统计分组是(、统计分组是( )。)。、在统计总体内进行的一种定性分类、在统计总体内进行的一种定性分类、在统计总体内进行的一种定量分类、在统计总体内进行的一种定量分类、将同一总体区分为不同性质的组、将同一总体区分为不同性质的组、把总体划分为一个个性质不同的、范围更小的、把总体划分为一个个性质不同的、范围更小的 总体总体、将不同的总体划分为性质不同的组、将不同的总体划分为性质不同的组4 4、某连续型变量数列,其最末组为、某连续型变量数列,其最末组为500500以上,又知其邻以上,又知其邻组的组中值为组的组中值为480480,则最末组的组中值为(,则最末组的组中值为( )。)。A A、520 B520 B、510 C510 C、530 D530 D、540540统计资料整理5 5、下列分组哪些是按品质标志分组(、下列分组哪些是按品质标志分组( )。)。、职工按工龄分组、职工按工龄分组 B B、科技人员按职称分组、科技人员按职称分组C C、人口按民族分组、人口按民族分组 、企业按经济类型分组、企业按经济类型分组E E、人口按地区分组、人口按地区分组6 6、下面哪些分组是按数量标志分组(、下面哪些分组是按数量标志分组( )。)。、企业按销售计划完成程度分组、企业按销售计划完成程度分组 B B、学生按健康状况分组、学生按健康状况分组C C、工人按产量分组、工人按产量分组 D D、职工按工龄分组、职工按工龄分组E E、企业按隶属关系分组、企业按隶属关系分组统计资料整理7 7、影响次数分布的因素是(、影响次数分布的因素是( )。)。A A、变量值的大小、变量值的大小 B B、总体单位数的多少、总体单位数的多少C C、选择的分组标志、选择的分组标志 D D、组距、组距 E E、组限、组限8 8、变量数列中,(、变量数列中,( )。)。A A、各组频率大于、各组频率大于0 B0 B、各组频率大于、各组频率大于1 1 C C、各组频率之和等于、各组频率之和等于1 1 D D、总次数一定时频数与频率成正比、总次数一定时频数与频率成正比E E、总次数一定时频数与频率成反比、总次数一定时频数与频率成反比统计资料整理9.9.下列数列属于(下列数列属于( )。)。 按生产计划完成程度分组按生产计划完成程度分组(%) 企业数企业数 8090 15 90100 30 100110 5 合合 计计 50 、品质分配数列、品质分配数列 、变量分配数列、变量分配数列 、组距式变量分配数列、组距式变量分配数列 、等距变量分配数列、等距变量分配数列 、次数分配数列、次数分配数列统计资料整理
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号