资源预览内容
第1页 / 共36页
第2页 / 共36页
第3页 / 共36页
第4页 / 共36页
第5页 / 共36页
第6页 / 共36页
第7页 / 共36页
第8页 / 共36页
第9页 / 共36页
第10页 / 共36页
亲,该文档总共36页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
9.2 用样本估计总体9.2.1总体取值规律的估计9.2.2总体百分位数的估计一个统计小故事的启示一个统计小故事的启示1.1.结合实例,能用样本估计总体的取值规律结合实例,能用样本估计总体的取值规律2.2.会列频率分布表,画频率分布直方图会列频率分布表,画频率分布直方图3.3.能根据频率分布表和频率分布直方图观测数据的分布规律能根据频率分布表和频率分布直方图观测数据的分布规律4.4.理解百分位数的统计含义,会求样本数据的第理解百分位数的统计含义,会求样本数据的第p p百分位数百分位数.1 1直观想象:频率分布直方图的绘制与应用;直观想象:频率分布直方图的绘制与应用;2 2数学抽象:百分位数的统计含义;3 3数学运算:频率分布直方图中的相关计算问题,数学运算:频率分布直方图中的相关计算问题,求第p百分位数.体会课堂探究的乐趣,体会课堂探究的乐趣,汲取新知识的营养,汲取新知识的营养,让我们一起让我们一起 吧!吧!进进走走课课堂堂微课微课1 频率分布直方图频率分布直方图思考思考1 1我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准民月均用水量标准a,a,用水量不超过用水量不超过a a的部分按平价收费,超出的部分按平价收费,超出a a的部分按议价收费的部分按议价收费.如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你你认为需要做哪些工作?认为需要做哪些工作?9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.52.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.92.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6如果将这组数据从小到如果将这组数据从小到大排序,容易发现,这大排序,容易发现,这组数据的最小值是组数据的最小值是1.3t,最大值是最大值是28.0t,其他在其他在1.3t至至28.0t之间之间.如果想得到更多的信息,如果想得到更多的信息,可以如何做可以如何做思考:如何画频率分布直方图思考:如何画频率分布直方图1.求极差求极差:极差为一组数据中最大值与最小值的差极差为一组数据中最大值与最小值的差.样本观测数据的最小值是样本观测数据的最小值是1.3t,最大值是最大值是28.0t,极差为极差为28.0-1.3=26.7这说明样本观测数据的变化范围是这说明样本观测数据的变化范围是26.7t.2.决定组距与组数决定组距与组数:数据分组的组数与数据的个数有关,一般数据的数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多个数越多,所分组数也越多,当样本容量不超过当样本容量不超过100时,常分成时,常分成512组组.为方便起见为方便起见,一般取等长组距一般取等长组距,并且组并且组距应力求距应力求“取整取整”分组时可以先确定组距,也可以先确定组数,如果我们取所分组时可以先确定组距,也可以先确定组数,如果我们取所有组距为有组距为3,则则 即可将数据分为即可将数据分为9组组3.将数据分组将数据分组:由于组距为由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值,例如,可以取区间为最小值,最后一组的右端点略大于数据中的最大值,例如,可以取区间为1.2,28.2,按如下方式把样本观测数据以组距按如下方式把样本观测数据以组距3分为分为9组:组:1.2,4.2),4.2,7.2),.,25.2,28.2.4.列频率分布表列频率分布表计算各小组的频率,例如第一小组的频率计算各小组的频率,例如第一小组的频率作出频率分布表作出频率分布表4.列频率分布表列频率分布表计算各小组的频率,作出频率分布表计算各小组的频率,作出频率分布表月均用水量月均用水量/t0.020.040.060.080.101.24.27.210.2 13.2 16.2 19.2 22.2 25.2 28.2 00.12频率频率/组距组距小长方形的面小长方形的面积积=?5.画频率分布直方图画频率分布直方图根据频率分布表画出如图所示的频率分布直方图根据频率分布表画出如图所示的频率分布直方图 思考:思考:观察频率分布表和频率分布直方图观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?信息?你能从图表中发现居民用户月均用水量的哪些分布规律?(2)从从频率分布直方图频率分布直方图能能直观的表明数据分布的形状和总体趋势直观的表明数据分布的形状和总体趋势.从上图容易从上图容易看出,居民用户月均用水量的样本观测数据的分布是不对称的看出,居民用户月均用水量的样本观测数据的分布是不对称的,图形的左边图形的左边高、右边低高、右边低,右边有一个较长的右边有一个较长的“尾巴尾巴”,这表明,这表明大部分居民用户的月均用大部分居民用户的月均用水量集中在一个较低值区域水量集中在一个较低值区域,尤其在区间尤其在区间1.2,7.2)最为集中最为集中,少数居民用户的少数居民用户的月均用水量偏多月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势而且随着月均用水量的增加,居民用户数呈现降低趋势.(1)从从频率分布表频率分布表中可以清楚地看出,中可以清楚地看出,样本观测数据落在各个小组的比例大样本观测数据落在各个小组的比例大小小,例如,月均用水量在区间,例如,月均用水量在区间4.2,7.2)内的居民用户最多,在区间内的居民用户最多,在区间1.2,4.2)内的次之,而月均用水量超过内的次之,而月均用水量超过16.2的各区间内数据所占比例较小,的各区间内数据所占比例较小,等等等等.思考:分别以思考:分别以3和和27为组数为组数,对数据进行等距分组对数据进行等距分组,画出画出100户居民用户月均用户居民用户月均用水量的频率分市直方图水量的频率分市直方图.观察图形观察图形,你发现不同的组数对于直方图呈现数据分市你发现不同的组数对于直方图呈现数据分市规律有什么影响规律有什么影响?例例1 1 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:4242,3838,2929,3636,4141,4343,5454,4343,3434,4444,4040,5959,3939,4242,4444,5050,3737,4444,4545,2929,4848,4545,5353,4848,3737,2828,4646,5050,3737,4444,4242,3939,5151,5252,6262,4747,5959,4646,4545,6767,5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例约是多少岁的知识分子所占的比例约是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 2727,3232)3 0.063 0.06 32 32,3737)3 0.063 0.06 37 37,4242)8 0.168 0.16 42 42,4747)16 0.3216 0.32 47 47,5252)8 0.168 0.16 52 52,5757)5 0.105 0.10 57 57,6262)4 0.084 0.08 62 62,67 4 0.0867 4 0.08 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.16+0.32+0.16=0.70.06+0.16+0.32+0.16=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.【变式练习变式练习】频率分布直方图如下:频率分布直方图如下:思考思考:根据市政府的要求确定居民用户月均用水量标准根据市政府的要求确定居民用户月均用水量标准,就是要寻找就是要寻找一个数一个数a,a,使全市居民用户月均用水量中不超过使全市居民用户月均用水量中不超过a a的占的占80%80%,大于,大于a a的占的占20%.20%.你能给市政府提出确定居民用户月均用水量标准的建议吗?你能给市政府提出确定居民用户月均用水量标准的建议吗?把把100100个样本数据按从小到大排序,得到第个样本数据按从小到大排序,得到第8080个和第个和第8181个数据分别为个数据分别为13.613.6和和13.8.13.8.可以发现,区间可以发现,区间(13.6,13.8)(13.6,13.8)内的任意一个数内的任意一个数,都能把样本数据分成符都能把样本数据分成符合要求的两部分合要求的两部分.一般地一般地,我们取这两个数的平均数我们取这两个数的平均数(13.6(13.6+13.8)13.8)2=2=13.713.7,并称此数为这组数据的第并称此数为这组数据的第8080百分位数或百分位数或80%80%分位数分位数.定义定义:一般地,一组数据的第一般地,一组数据的第p p百分位数是这样一个值,它使得这组数据百分位数是这样一个值,它使得这组数据中至少有中至少有p%p%的数据小于或等于这个值,且至少有的数据小于或等于这个值,且至少有(100-p)%(100-p)%的数据大于的数据大于或等于这个值或等于这个值.第第p百分位数的定义百分位数的定义思考思考:计算一组计算一组n n个数据的第个数据的第p p百分位数的步骤百分位数的步骤可以通过下面的步骤计算一组可以通过下面的步骤计算一组n个数据的第个数据的第p百分位数百分位数:第第1 1步,按从小到大排列原始数据步,按从小到大排列原始数据.第第2 2步,计算步,计算i=ni=np%.p%.第第3 3步,若步,若i i不是整数,而大于不是整数,而大于i i的比邻整数为的比邻整数为j,j,则第则第p p百分位数为百分位数为 第第j j项数据;若项数据;若i i是整数,则第是整数,则第p p百分位数为第百分位数为第i i项与第项与第(i+1)(i+1)项数据的平均数项数据的平均数.163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号