资源预览内容
第1页 / 共34页
第2页 / 共34页
第3页 / 共34页
第4页 / 共34页
第5页 / 共34页
第6页 / 共34页
第7页 / 共34页
第8页 / 共34页
第9页 / 共34页
第10页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
用样本的用样本的频率分布频率分布估计总体分布估计总体分布 ( (一一) )(1)(1)统计的核心问题统计的核心问题: : 如何根据样本的情况对总体的情况作出推断如何根据样本的情况对总体的情况作出推断复习引入: 简单随机抽样简单随机抽样 系统抽样系统抽样 分层抽样分层抽样(3 3)通过抽样方法收集数据的目的是什么?)通过抽样方法收集数据的目的是什么?从中寻找所包含的信息,用样本去估计总体从中寻找所包含的信息,用样本去估计总体(2)(2)随机抽样的几种常用方法随机抽样的几种常用方法 : : 我国是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理,即确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢合理呢 ?探究探究:你认为,为了较为你认为,为了较为合理地确定出这个合理地确定出这个标准,需要做哪些标准,需要做哪些工作?工作? 我国是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理,即确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢合理呢 ?探究探究:采用抽样调查的方采用抽样调查的方式获得样本数据式获得样本数据分析样本数据来估分析样本数据来估计全市居民用水量的计全市居民用水量的分布情况分布情况下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种基本方法是用图将它们画出来,或者分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式供解释数据的新方式讨论:如何分讨论:如何分析数据?析数据?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗? ?为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析一一频率分布的概念:频率分布的概念:频率分布频率分布是指一个样本数据在各个小范围是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方内所占比例的大小。一般用频率分布直方图反映样本的频率分布图反映样本的频率分布 二二画画频率分布直方图频率分布直方图其其一般步骤一般步骤为:为:(1 1)计算一组数据中最大值与最小值的差,)计算一组数据中最大值与最小值的差,即求极差即求极差(2 2)决定组距与组数)决定组距与组数(3 3)将数据分组)将数据分组(4 4)列频率分布表)列频率分布表(5 5)画频率分布直方图)画频率分布直方图第一步第一步: : 求极差求极差: ( (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) ) 最大值最大值= 4.3 = 4.3 最小值最小值= 0.2 = 0.2 所以极差所以极差= 4.3-0.2 = 4.1= 4.3-0.2 = 4.1第二步第二步: : 决定组距与组数决定组距与组数: : (强调取整)(强调取整) 当样本容量不超过当样本容量不超过100100时时, , 按照数据的多少按照数据的多少, , 常常分成分成512512组组. .为方便组距的选择应力求为方便组距的选择应力求“取整取整”. . 本题如果组距为本题如果组距为0.5(t). 0.5(t). 则则 第三步第三步: : 将数据分组:将数据分组:( ( 给出组的界限给出组的界限) ) 所以将数据分成所以将数据分成9 9组较合适组较合适. . 0, 0.5), 0.5, 1), 1, 1.5),4, 4.5) 共共9组组. 第四步第四步: : 列频率分布表列频率分布表. . 分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5第第五五步步: : 画画出出频频率率分分布布直直方方图图. 频率频率/ /组距组距 月均用水量月均用水量/t/t ( (组距组距=0.5)=0.5) 0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水量最月均用水量最多的在哪个区多的在哪个区间间? ?请大家阅读第请大家阅读第6868页页, ,直方图有直方图有哪些优点和缺哪些优点和缺点点? ?频率分布直方图的特征:频率分布直方图的特征:从频率分布直方图可以清楚的看出从频率分布直方图可以清楚的看出数据分布的总体趋势。数据分布的总体趋势。从频率分布直方图得不出原始的数从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。原有的具体数据信息就被抹掉了。思考思考:1.频率分布表与频率分布直方图的区别?频率分布表与频率分布直方图的区别?频率分布表频率分布表列出的是在各个不同区间内取值的频列出的是在各个不同区间内取值的频率。率。频率分布直方图频率分布直方图是用小长方形面积的大小来表示是用小长方形面积的大小来表示在各个区间内取值的频率在各个区间内取值的频率。2.2.如果当地政府希望使如果当地政府希望使85%85%以上的居民每月的以上的居民每月的用水量不超出标准,根据频率分布表用水量不超出标准,根据频率分布表2-22-2和频和频率分布直方图率分布直方图2.2-12.2-1,你能对制定月用水量标准提出建议吗你能对制定月用水量标准提出建议吗 ?3.将组距确定为将组距确定为1 1,作出教材,作出教材P66P66页页 居民月均居民月均用水量的频率分布直方图用水量的频率分布直方图 4.谈谈两种组距下,你对图的印象?同一个样谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?本数据,绘制出来的分布图是唯一的吗? (同样一组数据,如果组距不同,横轴、纵(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断时会影响我们对总体的判断 ) 练练 习习:1.1.有一个容量为有一个容量为5050的样本数据的分组的频数的样本数据的分组的频数如下:如下:12.5, 15.512.5, 15.5) 3 315.5, 18.515.5, 18.5) 8 818.5, 21.518.5, 21.5) 9 921.5, 24.521.5, 24.5) 111124.5, 27.524.5, 27.5) 101027.5, 30.527.5, 30.5) 5 530.5, 33.530.5, 33.5) 4 4(1)(1)列出样本的频率分布表列出样本的频率分布表; ;(2)(2)画出频率分布直方图画出频率分布直方图; ;(3)(3)根据频率分布直方图估计根据频率分布直方图估计, ,数据落在数据落在15.5, 15.5, 24.524.5)的百分比是多少)的百分比是多少? ? 解解: :组距为组距为3 3 分组分组 频数频数 频率频率 频率频率/ / 组距组距12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070练习练习: :2 .2 .投掷一枚均匀骰子投掷一枚均匀骰子44次的记录是次的记录是:32415134565425313414516331242634661622526543现对这些数据进行整理,试画出频数分布直方图现对这些数据进行整理,试画出频数分布直方图第一步:写出样本可能出现的一切数值,即:第一步:写出样本可能出现的一切数值,即:1,2,3,4,5,6 1,2,3,4,5,6 共共6 6个数个数( (数据分组数据分组) )第二步:列出频率分布表:第二步:列出频率分布表:样本样本频数频数7 77 78 88 87 77 7频率频率0.160.160.160.160.180.180.180.180.160.160.160.16组距组距=1=1第三步第三步: : 画频率分布直方图画频率分布直方图探究探究1 1:频率分布折线图与总体密度曲线:频率分布折线图与总体密度曲线 思考思考1 1:在城市居民月均用水量样本数据在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均的频率分布直方图中,各组数据的平均值大致是哪些数?值大致是哪些数? 月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考思考2 2:在频率分布直方图中,依次连接各小在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条长方形上端的中点,就得到一条折线,这条折线称为折线称为频率分布折线图频率分布折线图. . 你认为频率分布你认为频率分布折线图能大致反映样本数据的频率分布吗?折线图能大致反映样本数据的频率分布吗? 月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考思考3 3:当总体中的个体数很多时(如抽样调当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发少,你能想象出相应的频率分布折线图会发生什么变化吗?生什么变化吗? 月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量月均用水量/t频率频率组距组距a bO总体密度曲线思考思考4 4:在上述背景下,相应的频率分布折线在上述背景下,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这图越来越接近于一条光滑曲线,统计中称这条光滑曲线为条光滑曲线为总体密度曲线总体密度曲线. .那么图中阴影部那么图中阴影部分的面积有何实际意义?分的面积有何实际意义? 总体在区间总体在区间(a a,b b)内取)内取值的百分比值的百分比. . 探究(二):茎叶图探究(二):茎叶图 频率分布表、频率分布直方图和折频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布线图的主要作用是表示样本数据的分布情况,此外,我们还可以用情况,此外,我们还可以用茎叶图茎叶图来表来表示样本数据的分布情况示样本数据的分布情况. 【问题问题】 某赛季甲、乙两名篮球运动员每场比赛某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:的得分情况如下: 甲运动员得分:甲运动员得分:1313,5151,2323,8 8,2626,3838,1616,3333,1414,2828,3939; 乙运动员得分:乙运动员得分:4949,2424,1212,3131,5050,3131,4444,3636,1515,3737,2525,3636,39.39.助教在比赛中将这些数据记录为如下形式:助教在比赛中将这些数据记录为如下形式: 甲甲 乙乙 8 84 6 3 4 6 3 3 6 83 6 83 8 9 3 8 9 1 10 01 12 23 34 45 52 2 5 55 5 4 41 1 6 1 6 6 1 6 7 97 94 4 9 90 0甲甲 乙乙 8 84 6 3 4 6 3 3 6 83 6 83 8 9 3 8 9 1 10 01 12 23 34 45 52 2 5 55 5 4 41 1 6 1 6 6 1 6 7 97 94 4 9 90 0思考思考1 1:你能理解这个图是如何记录这些数你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?挥更稳定吗? 甲运动员得分:甲运动员得分:1313,5151,2323,8 8,2626,3838,1616,3333,1414,2828,3939;乙运动员得分:乙运动员得分:4949,2424,1212,3131,5050,3131,4444,3636,1515,3737,2525,3636,39.39.思考思考2 2:在统计中,上图叫做在统计中,上图叫做茎叶图茎叶图,它也是,它也是表示样本数据分布情况的一种方法,其中表示样本数据分布情况的一种方法,其中“茎茎”指的是哪些数,指的是哪些数,“叶叶”指的是哪些数?指的是哪些数?甲甲 乙乙 8 84 6 3 4 6 3 3 6 83 6 83 8 9 3 8 9 1 10 01 12 23 34 45 52 2 5 55 5 4 41 1 6 1 6 6 1 6 7 97 94 4 9 90 0思考思考3 3:对于样本数据:对于样本数据:3.13.1,2.5,2.02.5,2.0,0.80.8,1.51.5,1.01.0,4.34.3,2.72.7,3.13.1,3.53.5,用茎叶,用茎叶图如何表示?图如何表示? 思考思考4 4:一般地,画出一组样本数据的茎叶图一般地,画出一组样本数据的茎叶图的步骤如何?的步骤如何? 第一步,将每个数据分为第一步,将每个数据分为“茎茎”(高位)和(高位)和“叶叶”(低位)两部分;(低位)两部分;第二步,将最小的茎和最大的茎之间的数按第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;大小次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎第三步,将各个数据的叶按大小次序写在茎右(左)侧右(左)侧. .思考思考5 5:用茎叶图表示数据的分布情况是一种用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?好方法,你认为茎叶图有哪些优点? (1 1)保留了原始数据,没有损失样本信息;)保留了原始数据,没有损失样本信息;(2 2)数据可以随时记录、添加或修改)数据可以随时记录、添加或修改. . 知识迁移知识迁移 例例1 1 在某小学在某小学500500名学生中随机抽样得到名学生中随机抽样得到100100人的身高如下表人的身高如下表( (单位单位cm) cm) : 4 4 6 6 10 10 15 15人人 数数154154,158158)150150,154154)146146,150150)142142,146146)身高区身高区间 28 28 18 18 9 9 8 8 2 2人人 数数138138,142142)134134,138138)130130,134134)126126,130130)122122,126126)身高区身高区间(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计该校学生身高小于估计该校学生身高小于134cm134cm的人数约的人数约为多少?为多少? (1 1)频率分布表:)频率分布表: 分分 组组 频数频数 频率频率 122122,126126) 2 2 126126,130130) 8 8 130130,134134) 9 9 134134,138138) 18 18 138138,142142) 28 28 142142,146146) 15 15 146146,150150) 10 10 150150,154154) 6 6 154154,158158) 4 4 合合 计计 1001001.001.000.020.020.080.080.090.090.180.180.280.280.150.150.100.100.060.060.040.04(2 2)频率分布直方图:)频率分布直方图: 身高身高/cm0.080.080.070.070.060.060.050.050.040.040.030.030.020.020.010.01 122 126 130 134 138 142 146 150 154 158 122 126 130 134 138 142 146 150 154 158 频率频率组距组距O(3 3)()(0.02+0.08+0.090.02+0.08+0.09)500=95500=95(人)(人) 例例2 2 为了了解高一学生的体能情况,某校随机为了了解高一学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出了频率分布直方图据整理后,画出了频率分布直方图. .图中从左到右图中从左到右各小长方形的面积之比为各小长方形的面积之比为2 2:4 4:1717:1515:9 9:3 3,第,第二小组的频数为二小组的频数为12.12.(1 1)第二小组的频)第二小组的频率是多少?率是多少?(2 2)样本容量是多)样本容量是多少?少?(3 3)若次数在)若次数在110110以以上(含上(含110110次)为达次)为达标,试估计该校全体标,试估计该校全体高一学生的达标率约高一学生的达标率约是多少?是多少?90 100 110 120 130 140 15090 100 110 120 130 140 150次数次数o o0.0040.0040.0080.0080.0120.0120.0160.0160.0200.0200.0240.0240.0280.028频率频率/组距组距0.0320.0320.0360.036小结小结: : 画频率分布直方图的步骤画频率分布直方图的步骤: : 第一步第一步: 求极差求极差: (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) 第二步第二步: 决定组距与组数决定组距与组数: (强调取整)(强调取整) 第三步第三步: 将数据分组将数据分组 ( 给出组的界限给出组的界限) 第四步第四步: 列频率分布表列频率分布表. (包括分组、频数、频率(包括分组、频数、频率、频、频率率/组距组距) 第五步第五步: 画频率分布直方图画频率分布直方图(在频率分布表的基础上(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率绘制,横坐标为样本数据尺寸,纵坐标为频率/组距组距.) 组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。注意注意(2)纵坐标为纵坐标为:
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号