资源预览内容
第1页 / 共24页
第2页 / 共24页
第3页 / 共24页
第4页 / 共24页
第5页 / 共24页
第6页 / 共24页
第7页 / 共24页
第8页 / 共24页
第9页 / 共24页
第10页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2.2.12.2.1用样本的用样本的频率分布估计总体分布频率分布估计总体分布 我国是世界上严重缺水的国家之一,我国是世界上严重缺水的国家之一,城市缺水问题较为突出。城市缺水问题较为突出。20002000年全国主要城市中缺水情况排在前年全国主要城市中缺水情况排在前1010位的城市位的城市引入引入政府为了节约生活用水,计划在本市试行居民生活政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准用水定额管理,即确定一个居民月用水量标准a , a , 用水量不超过用水量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的部分按的部分按议价收费。议价收费。 如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a a定为多少比较合理呢定为多少比较合理呢? 为了较合理地确定这个标准,你认为需要做为了较合理地确定这个标准,你认为需要做 哪些工作?哪些工作?3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.6.1.23.71.50.53.83.32.82.32.21.71.23.61.70.64.13.22.92.42.31.81.33.51.90.84.33.02.92.42.41.91.41.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.31.21.50.52.42.52.62.32.11.61.41.01.70.82.42.82.52.22.01.51.01.21.80.62.2100位居民的月均用水量位居民的月均用水量(单位单位:t)从表中只能看出从表中只能看出:最小值是最小值是0.2t,最大值是最大值是4.3t,其他的在其他的在0.2-4.3t之间之间.分析数据的基本方法分析数据的基本方法: 1.图图(频率分布直方图频率分布直方图) 2.表表(频率分布表频率分布表)1.1.求极差(即一组数据中最大值与最小值的差)求极差(即一组数据中最大值与最小值的差) 2.2.决定组距与组数决定组距与组数 3.3.将数据分组(左闭右开)将数据分组(左闭右开)0 0,0.50.5 ) ),0.50.5,1 1 ) ),4 4,4.54.5 组距与组数的确定没有固定的标准,是一个尝试选择的过程。当数据不超过100个时,按数据多少常分5-12组。将数据分组时,样本容量越大,所分组数越多。组距:指每个小组的两个端点的距离。组数:若极差/组距为整数,则极差/组距=组数;否则极差/组距+1=组数4.4.列频率分布表列频率分布表分组分组频数累计频数累计频数频数频率频率0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.5合计合计48152225146420.040.080.150.220.250.140.060.041001.00频率频率= =样本容量样本容量频数频数频频率率分分布布表表一一般般分分“分分组组”,“频频数数累累计计”(可可省省),“频频数数”,“频频率率”, , “频频率率/ /组组距距”五五列列,最最后后一一行行是合计是合计注注意意频频数数的的合合计计应应是是样样本本容容量量,频频率率合合计计应是应是1 10.02频率频率/ /组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04小矩形的面积小矩形的面积组距组距频率频率组距组距频率频率= = =分组分组频数频数频率频率频率频率/组距组距0,0.5)40.040.080.5,1)80.080.161,1.5)150.150.301.5,2)220.220.442,2.5)250.250.502.5,3)140.140.283,3.5)60.060.123.5,4)40.040.084,4.520.020.04合计合计1005. 5. 画画频率频率分布直方图分布直方图( (与条形图区别与条形图区别):):用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234请计算每个小矩形的面积请计算每个小矩形的面积,它代表什么它代表什么?所有小矩形的面积的和是多少所有小矩形的面积的和是多少?1 1注意纵坐标是频率/组距用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234频率分布直方图频率分布直方图,显示了样本数据落在各个小组显示了样本数据落在各个小组的比例的大小的比例的大小,图中最高的小矩形说明了什么图中最高的小矩形说明了什么?大部分居民的月均用水量都大部分居民的月均用水量都集中在什么之间集中在什么之间? 居民的月均用水量的分布呈居民的月均用水量的分布呈“山峰山峰”状的状的,而且是而且是“单峰单峰”的的另外还有一定的另外还有一定的对称性对称性.月均用水量在月均用水量在2,2.5)2,2.5)内的居民最多内的居民最多. .在在1,3)1,3)之间之间. .用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234频率分布直方图的特征:频率分布直方图的特征:优点:从频率分布直方图可以清楚地看出数据分布的总体趋势优点:从频率分布直方图可以清楚地看出数据分布的总体趋势缺缺点点:从从频频率率分分布布直直方方图图得得不不出出原原始始的的数数据据内内容容,把把数数据据表表示示成成直直方图后,原有的具体数据就被抹掉了方图后,原有的具体数据就被抹掉了如果当地政府希望如果当地政府希望85%85%以上的居民每月的用水量不超出以上的居民每月的用水量不超出标准标准, ,根据频率分布表和频率分布直方图根据频率分布表和频率分布直方图, ,你能对制定你能对制定月用水量提出建议吗月用水量提出建议吗? ?用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234居民月用水量标准应定为居民月用水量标准应定为3t.3t.分组分组频数频数频率频率累积频率累积频率0,0.5)40.040.5,1)80.081,1.5)150.151.5,2)220.222,2.5)250.252.5,3)140.143,3.5)60.063.5,4)40.044,4.5)20.02合计合计1001.000.040.120.270.490.740.880.940.981.00思考思考 你认为3吨这个标准一定能够保证85以上的居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别? 同样一组数据,如果组距不同,得到的图同样一组数据,如果组距不同,得到的图的形状也会不同。不同的形状给人以不同的印的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。象,这种印象有时会影响我们对总体的判断。四、四、频率分布折率分布折线图顺次次连接接频率分布直方率分布直方图中各个矩形的上端的中点,中各个矩形的上端的中点,就得到就得到频率分布折率分布折线图。0.50.40.30.20.10 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量(t)五、五、总体的密度曲体的密度曲线如果如果样本容量本容量较大,所分大,所分组数越多,数越多,样本的本的频率分布越接近率分布越接近总体的体的频率分布,随着率分布,随着样本容量的增加,作本容量的增加,作图时所分所分组数增加,数增加,组距减小,相距减小,相应的的频率折率折线图会越来会越来越接近于一条越接近于一条光滑的曲光滑的曲线,统计中称中称这条曲条曲线为总体密度体密度曲曲线。六、茎叶六、茎叶图1、概念:茎叶、概念:茎叶图也是也是统计中表示数据的一种方式,茎指的中表示数据的一种方式,茎指的是中是中间的一列数,叶指的是从茎旁的一列数,叶指的是从茎旁边生在出来的数,常用生在出来的数,常用来来记录两位数的数据。两位数的数据。2、茎叶、茎叶图的制作步的制作步骤第一步,将数据分第一步,将数据分为“茎茎”“”“叶叶”两个部分。若数据是两位两个部分。若数据是两位数,一般将两位数的十位数作数,一般将两位数的十位数作为茎,个位数作茎,个位数作为叶。叶。第二步,将所有的茎按大小第二步,将所有的茎按大小顺序(一般是由小到大的序(一般是由小到大的顺序)序)自上而下排成一列,茎相同的共用一个茎,即剔除重复的数自上而下排成一列,茎相同的共用一个茎,即剔除重复的数字,再画上一条字,再画上一条竖线作作为分界分界线,区分茎和叶。,区分茎和叶。第三步,将各个数据的第三步,将各个数据的“叶叶”按一定按一定顺序在分界序在分界线的另一的另一侧对应茎茎处同行列出。例如,将数据同行列出。例如,将数据21、32、42、22、27、35、38、47、51用茎叶用茎叶图表示。表示。3、茎叶、茎叶图的特征的特征(1)用茎叶)用茎叶图表示数据有两个表示数据有两个优点:点:一是从一是从统计图上没有原始数据信息的上没有原始数据信息的损失,所有失,所有数据信息都可以从茎叶数据信息都可以从茎叶图中得到;二是茎叶中得到;二是茎叶图中的数据可中的数据可以随以随时记录、随、随时添加,方便添加,方便记录与表示。与表示。23451 2 72 5 82 71(2)茎叶图中的数据只便于表示两位数的数据,对于位数多的数)茎叶图中的数据只便于表示两位数的数据,对于位数多的数据不太容易操作;对于两位数以上的数能记录但是没有记录两位据不太容易操作;对于两位数以上的数能记录但是没有记录两位数据那么数据那么直观、清晰直观、清晰。(3)对重复出现的数据要)对重复出现的数据要重复记录重复记录,不能遗漏不能遗漏。表示样本分布的方表示样本分布的方法法优点优点缺点缺点频率分布表频率分布表在数量表示上比较确切在数量表示上比较确切不够直观、形象,损失了样本不够直观、形象,损失了样本的一些信息,分析数据分布的的一些信息,分析数据分布的总体态势不够方便总体态势不够方便频率分布直方图频率分布直方图能够很容易的表示大量数据,能够很容易的表示大量数据,非常直观地表示数据分布的情非常直观地表示数据分布的情况,能看到在分布表中看不清况,能看到在分布表中看不清楚的数据楚的数据从直方图本身不能得出原始的从直方图本身不能得出原始的数据内容,吧数据表示成直方数据内容,吧数据表示成直方图后,原有的数据信息被抹掉。图后,原有的数据信息被抹掉。频率分布折线图频率分布折线图反映了数据变化趋势反映了数据变化趋势原有的具体数据信息被抹掉原有的具体数据信息被抹掉茎叶图茎叶图由所有样本数据构成,没有由所有样本数据构成,没有原始信息的损失;原始信息的损失;便于记录便于记录和表示;和表示;能够展示数据的分能够展示数据的分布情况布情况只方便记录两组数据,当样本只方便记录两组数据,当样本数据较多时,茎叶图就显得不数据较多时,茎叶图就显得不方便方便七、几种表示样本分布方法的比较七、几种表示样本分布方法的比较例例1 1 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 4242,3838,2929,3636,4141,4343,5454,4343,3434,4444, 4040,5959,3939,4242,4444,5050,3737,4444,4545,2929, 4848,4545,5353,4848,3737,2828,4646,5050,3737,4444, 4242,3939,5151,5252,6262,4747,5959,4646,4545,6767, 5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少. .(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组. . 分分 组组 频数频数 频率频率 2727,3232) 3 0.063 0.06 32 32,3737) 3 0.063 0.06 37 37,4242) 9 0.189 0.18 42 42,4747) 16 0.3216 0.32 47 47,5252) 7 0.147 0.14 52 52,5757) 5 0.105 0.10 57 57,6262) 4 0.084 0.08 62 62,6767) 3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7, 故故年龄在年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.1. 右图是容量为右图是容量为100的的样本的频率分布直方图样本的频率分布直方图,试根据图中的数据填空试根据图中的数据填空:(1)样本数据落在范围样本数据落在范围6,10)内的频率为内的频率为_;(2)样本数据落在范围样本数据落在范围10,14)内的频数为内的频数为_;O2610 14 180.020.030.080.09样本样本数据数据频率频率组距组距0.32362 2、为了了解某地高一年级男生的身高情况,从、为了了解某地高一年级男生的身高情况,从其中的一个学校选取容量为其中的一个学校选取容量为6060的样本(的样本(6060名男名男生的身高,单位:生的身高,单位:cmcm),分组情况如下:),分组情况如下:分组分组151.5158.5158.5165.5165.5172.5172.5179.5频数频数621m频率频率a0.1则表中的则表中的m= , a=m= , a=60.45273.(2006年重庆卷年重庆卷)为了了解某地区高三学生的为了了解某地区高三学生的体重情况,抽查了该地区体重情况,抽查了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重(kg) ,得到频率分布直方图得到频率分布直方图如下:如下:根据上图可得这根据上图可得这100名学生中体重在名学生中体重在56.5,64.5的学生人数是的学生人数是( )A. 20 B. 30 C. 40 D. 500.030.050.07体重体重(kg)频率频率/组距组距54.5 58.5 62.5 66.5 70.5 74.5 频率分布直方图频率分布直方图应用应用步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表5.5.画频率分布直方图画频率分布直方图频率分布直方图各小长方形的面积表示相应各组频率分布直方图各小长方形的面积表示相应各组的频率的频率. .这样,频率分布直方图就以面积的形式这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小反映了数据落在各个小组的频率的大小. .
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号