资源预览内容
第1页 / 共29页
第2页 / 共29页
第3页 / 共29页
第4页 / 共29页
第5页 / 共29页
第6页 / 共29页
第7页 / 共29页
第8页 / 共29页
第9页 / 共29页
第10页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第三章 统计数据的整理与显示第一节第一节数据的预处理数据的预处理n一、数据的审核与筛选一、数据的审核与筛选n1.原始数据的审核:原始数据的审核:n(1)完整性)完整性(2)准确性)准确性n2.二手数据的审核:二手数据的审核:n(1)完整性)完整性n(2)准确性)准确性n n(3)适用性和实效性)适用性和实效性n二、数据的排序:升序、降序二、数据的排序:升序、降序第二节 品质数据的整理与显示例:一家评估机构为调查不同品牌例:一家评估机构为调查不同品牌饮料的市场占有率,对随机抽取饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员的一家超市进行了调查。调查员在某天对照在某天对照50名顾客购买饮料的名顾客购买饮料的品牌进行了记录,如果一个顾客品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。下面饮料的品牌名字记录一次。下面的表的表31是记录的原始数据是记录的原始数据。顾客购买饮料的品牌名称 表3-1n旭日升旭日升露露露露旭日升旭日升可口可乐可口可乐百事可乐百事可乐可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐露露露露可口可乐可口可乐 可口可乐可口可乐旭日升旭日升可口可乐可口可乐百事可乐百事可乐露露露露旭日升旭日升旭日升旭日升百事可乐百事可乐可口可乐可口可乐旭日升旭日升旭日升旭日升可口可乐可口可乐可口可乐可口可乐旭日升旭日升露露露露旭日升旭日升可口可乐可口可乐露露露露百事可乐百事可乐百事可乐百事可乐汇源果汁汇源果汁露露露露百事可乐百事可乐可口可乐可口可乐百事可乐百事可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁露露露露可口可乐可口可乐旭日升旭日升百事可乐百事可乐露露露露汇源果汁汇源果汁可口可乐可口可乐百事可乐百事可乐露露露露旭日升旭日升购买饮料的频数分布 表32饮料名称饮料名称频数频数(人次人次)可口可乐可口可乐旭日升冰茶旭日升冰茶百事可乐百事可乐露露露露汇源果汁汇源果汁其其他他15119960合合计计50品质标志品质标志品质数据的图示n条形图n圆形图条形图是用宽度相同的条形的高条形图是用宽度相同的条形的高度或长短来描述已概括成频数、相对度或长短来描述已概括成频数、相对频数或百分比频数分布的品质数据。频数或百分比频数分布的品质数据。条形图可以横置或纵置,纵置时也称条形图可以横置或纵置,纵置时也称为柱形图。图为柱形图。图31是是50名顾客购买饮料名顾客购买饮料的频数分布的条形图(柱形图),图的频数分布的条形图(柱形图),图形非常直观地显示了可口可乐和旭日形非常直观地显示了可口可乐和旭日升冰茶是顾客的偏好。升冰茶是顾客的偏好。 购买饮料数据的条形图 图3-1旭日升旭日升露露露露饼图也称圆形图,是用圆形及圆饼图也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形。内扇形的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题分所占的比例,对于研究结构性问题十分有用。绘制一个饼图,首先画一十分有用。绘制一个饼图,首先画一个圆圈,然后利用相对频数将圆圈划个圆圈,然后利用相对频数将圆圈划分成几个部分,每一部分对应一个组分成几个部分,每一部分对应一个组的相对频数。的相对频数。 购买饮料数据饼图 第三节第三节数量数据的整理与显示数量数据的整理与显示一、统计分组与变量数列的编制一、统计分组与变量数列的编制例例:某生产车间某生产车间50名工人日加工零件数如下名工人日加工零件数如下(单位单位:个个)n117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121统计分组的关键是统计分组的关键是正确选择分组标正确选择分组标志和准确划分各组界限。志和准确划分各组界限。第一步,对统计数据进行排序n107108108110112113114115117117117118118118119120120121122122122122123123123123124124124125125125126126127127127128128129130131133133134134135137139139第二步,确定变量数列的形式按按数量标志进行分组的方法主数量标志进行分组的方法主要有两种:要有两种:一、单项式分组(即一个变量一、单项式分组(即一个变量值为一组)值为一组)二、组距式分组二、组距式分组(一)单项式分组(一)单项式分组这种方法通常只适用于离散型变量且变量值较这种方法通常只适用于离散型变量且变量值较少的情况。对例题中的数据进行分组的结果如下:少的情况。对例题中的数据进行分组的结果如下:零件数零件数频数频数零件数零件数频数频数零件数零件数频数频数107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112(二)组距式分组(二)组距式分组n第一步、确定全距第一步、确定全距RR=最大值最大值-最小值最小值=139-107=32n第二步、确定组数第二步、确定组数k=1+3.322lgn=6.64n第三步、确定组距第三步、确定组距组距(组距(i)=全距(全距(R)/组数组数(k)=4.82n第四步、确定组限第四步、确定组限n第五步、计量各组单位数,并整理成表格形式第五步、计量各组单位数,并整理成表格形式某车间某车间50名工人日加工零件分组表名工人日加工零件分组表表表3-3按按零件数分组零件数分组频数(人)频数(人)频率(频率(%)组中值组中值105110110115115120120125125130130135135140358141064610162820128107.5112.5117.5122.5127.5132.5137.5合计合计50100上限上限下限下限组距组距i=上限上限-下限下限ff/fx组距分组时要注意的问题组距分组时要注意的问题:一定要遵循“不重不漏不重不漏”的原则。1.“不重不重”指一项数据只能分在其中的某一组,指一项数据只能分在其中的某一组,不能在其他组中重复出现。习惯上规定不能在其他组中重复出现。习惯上规定“上上限不在本组内,应归入到下一组限不在本组内,应归入到下一组”的原的原则进行处理;则进行处理;2.“不漏不漏”即所有数据都能分在其中的某一组,即所有数据都能分在其中的某一组,不能遗漏。因此,如果数据中的最大值和最小不能遗漏。因此,如果数据中的最大值和最小值与其他数据相差悬殊,可采用值与其他数据相差悬殊,可采用“*以下以下”及及“*以上以上”。例、例、87户居民户的人均拥有住宅面积数据的分布户居民户的人均拥有住宅面积数据的分布二、列表法显示统计数据二、列表法显示统计数据次数(频率)密度次数(频率)密度=次数(频率)次数(频率)/组组距距尤其适用于异距分组尤其适用于异距分组累计次数(频率)的计算累计次数(频率)的计算87户居民户的人均拥有住宅面积数据的累计频率分布户居民户的人均拥有住宅面积数据的累计频率分布从变量值较大的次数为起点,从变量值较大的次数为起点,逐项累计,表示该组变量值下逐项累计,表示该组变量值下限以上累计次数或频率限以上累计次数或频率从变量值较小的次数为起点,从变量值较小的次数为起点,逐项累计,表示该组变量值上逐项累计,表示该组变量值上限限以下累计次数或频率限限以下累计次数或频率三、图示法三、图示法(一)直方图(一)直方图(Histogram)直方图是用矩形的宽度和高度来表示频直方图是用矩形的宽度和高度来表示频数分布的图形。绘制直方图时,将所研数分布的图形。绘制直方图时,将所研究的变量放在横轴上,频数、相对频数究的变量放在横轴上,频数、相对频数或百分比频数放在纵轴上。每组的频数、或百分比频数放在纵轴上。每组的频数、相对频数或频率在图上就是一个长方形,相对频数或频率在图上就是一个长方形,长方形的底在横轴上,宽度是组距,长长方形的底在横轴上,宽度是组距,长方形的高就是对应的频数。方形的高就是对应的频数。 (二)折线图(二)折线图折线图也称频数多边形图(折线图也称频数多边形图(Frequencypolygon)。)。在直方图的基础上,把直方图顶在直方图的基础上,把直方图顶部的中点(即组中值)用直线连接起来,再部的中点(即组中值)用直线连接起来,再把原来的直方图抹掉就是折线图。需要注意,把原来的直方图抹掉就是折线图。需要注意,折线图的两个终点要与横轴相交,具体的做折线图的两个终点要与横轴相交,具体的做法是将第一个矩形的顶部中点通过竖边中点法是将第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横后一个矩形顶部中点与其竖边中点连接到横轴。这样才会使折线图下所围成的面积与直轴。这样才会使折线图下所围成的面积与直方图的面积相等,从而使二者所表示的频数方图的面积相等,从而使二者所表示的频数分布一致。分布一致。 (三)曲线图当上述变量数列的组数无限增多时,折线就近似地表现为曲线。主要分布曲线有以下几种:(1)钟型分布曲线(2)U型分布曲线(3)J型分布曲线第四节第四节统计表统计表n统计表的构成统计表的构成某车间按加工零件分组某车间按加工零件分组表表3-5按按零件数分组(件)零件数分组(件)频数(人)频数(人)频率(频率(%)组中值组中值105110110115115120120125125130130135135140358141064610162820128107.5112.5117.5122.5127.5132.5137.5合计合计50100宾词宾词主词主词指标数值指标数值横行标题横行标题纵栏标题纵栏标题总标题总标题统计表的设计要求统计表的设计要求:1统计表的总标题应该简明地概括所要统计表的总标题应该简明地概括所要反映的内容,以及资料所属的空间、时间反映的内容,以及资料所属的空间、时间范围,即标题内容应符合范围,即标题内容应符合3W(When,Where,What)原则。原则。 2表中主词各行和宾词各栏的次序,一般表中主词各行和宾词各栏的次序,一般应当根据自然顺序合理编制,如时间顺序、应当根据自然顺序合理编制,如时间顺序、数量大小等。若各项目之间存在着一定客数量大小等。若各项目之间存在着一定客观联系,应根据事物之间的客观联系合理观联系,应根据事物之间的客观联系合理编排,通常总计列在各项目之后。编排,通常总计列在各项目之后。3表中必须注明数字资料的计量单位。表中必须注明数字资料的计量单位。全表只有一种单位,就写在表的右上角;全表只有一种单位,就写在表的右上角;有多种计量单位,或专设计量单位一栏,有多种计量单位,或专设计量单位一栏,或在每个指标后用小字加以注明。或在每个指标后用小字加以注明。4统计表数字上下位置要对齐。相同数统计表数字上下位置要对齐。相同数字应全部写上,不能用字应全部写上,不能用“同上同上”等方法表等方法表示。无数字的空格一般用示。无数字的空格一般用“”表示,表示,以免漏填。以免漏填。5统计表的实际材料,应注明出处。资统计表的实际材料,应注明出处。资料不齐或另行推算的,应在表下注明。料不齐或另行推算的,应在表下注明。第三章 统计整理思考题n1 1、统计分组的关键是什么?统计分组的关键是什么?n2 2、什么是分组标志?选择分组标志的原则是什么?什么是分组标志?选择分组标志的原则是什么?n3 3、确定组间界限时,应遵循什么原则?确定组间界限时,应遵循什么原则?n4 4、什么情况下,采用单项式分组或组距式分组?什么情况下,采用单项式分组或组距式分组?n5 5、什么情况下,采用组距分组或异距分组?什么情况下,采用组距分组或异距分组?n6 6、累计频数和累计频率的应用意义如何?累计频数和累计频率的应用意义如何?n7 7、社社会会经经济济现现象象中中常常见见的的次次数数分分布布有有哪哪些些主主要要类类型型?分分布布特特征征如何?如何? 8 8、某某车车间间同同一一工工种种的的4040名名工工人人每每人人完完成成生生产产定定额额的的程程度度()如下:如下:n97 88 123 115 119 158 112 146 117 108 97 88 123 115 119 158 112 146 117 108 n105105110 107 137 120 136 125 127 142 118110 107 137 120 136 125 127 142 118n8787103103115 114 117 124 129 138 100 103 115 114 117 124 129 138 100 103 n92929595126 107 108 105 119 127 104 11126 107 108 105 119 127 104 11 要要求求:根根据据上上述述资资料料,编编制制分分配配数数列列、累累计计频频数数和和累累计计频频率率数数列,并绘制相应的分布图。列,并绘制相应的分布图。编制分配数列:属于数量标志分配数列编制分配数列:属于数量标志分配数列首先,进行排序首先,进行排序878892959710010310310410510510710710810811011211114115115117117118119119120123124125126127127129136137138142146158然后,依次确定与分组相关的数据然后,依次确定与分组相关的数据第一步、确定全距第一步、确定全距RR=最大值最大值-最小值最小值=158-87=71第二步、确定组数第二步、确定组数k=1+3.322lgn=1+3.322lg40=6.322第三步、确定组距第三步、确定组距组距(组距(i)=全距(全距(R)/组数(组数(k)=71/6.322=11.23组距应该取整,故组距应该取整,故i=10第四步、确定组限,如第四步、确定组限,如“90-100”第五步、计量各组单位数(频数和频率),并整理成表。第五步、计量各组单位数(频数和频率),并整理成表。最后,完成一个规范的统计表,注意表的各部分名称和写法。最后,完成一个规范的统计表,注意表的各部分名称和写法。按按生产定额的程度生产定额的程度分组(分组(%)频数频数(人人)频率频率(%)较小制累计较小制累计频数频数(人人)频率频率(%)809090100100110110120120130130140140以上以上2310118335.07.525.027.520.07.57.52515263437405.012.537.565.085.092.5100.0合计合计40100.0
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号