资源预览内容
第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
第9页 / 共25页
第10页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2.2 2.2 用样本估计总体用样本估计总体.2.1.2.1用样本的频率分布估计总体分布用样本的频率分布估计总体分布第一课时第一课时 问题提出问题提出1.1.随机抽样有哪几种基本的抽样方法?随机抽样有哪几种基本的抽样方法?2.2.随机抽样是收集数据的方法,如何通随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们基本特征,即用样本估计总体,是我们需要进一步学习的内容需要进一步学习的内容. .简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样. 3. 3.高一某班有高一某班有5050名学生,在数学必名学生,在数学必修修结业考试后随机抽取结业考试后随机抽取1010名,其考试名,其考试成绩如下:成绩如下: 8282, 7575, 6161, 9393, 6262, 5555, 7070, 6868, 8585, 78.78. 如果要求我们根据上述抽样数据,如果要求我们根据上述抽样数据,估计该班对数学模块估计该班对数学模块的总体学习水平,的总体学习水平,就需要有相应的数学方法作为理论指导,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估本节课我们将学习用样本的频率分布估计总体分布计总体分布. . 知识探究(一):频率分布表知识探究(一):频率分布表 【问题【问题】 我国是世界上严重缺水的国家我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居居民生活用水定额管理,即确定一个居民月用水量标准民月用水量标准a a,用水量不超过,用水量不超过a a的部的部分按平价收费,超出分按平价收费,超出a a的部分按议价收费的部分按议价收费. .通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的年的月均用水量如下表(单位:月均用水量如下表(单位:t t):):3.1 2.5 2.0 2.03.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.23.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.43.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.02.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考思考1 1:上述上述100100个数据中的最大值和最个数据中的最大值和最小值分别是什么?由此说明样本数据的小值分别是什么?由此说明样本数据的变化范围是什么?变化范围是什么?思考思考2 2:样本数据中的最大值和最小值样本数据中的最大值和最小值的差称为的差称为极差极差. .如果将上述如果将上述100100个数据个数据按组距为按组距为0.50.5进行分组,那么这些数据进行分组,那么这些数据共分为多少组?共分为多少组? 0.20.24.34.3(4.3-0.24.3-0.2)0.5=8.20.5=8.2思考思考3 3:以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个数据共分为个数据共分为9 9组,各组数据的取值范围组,各组数据的取值范围可以如何设定?可以如何设定?思考思考4 4:如何统计上述如何统计上述100100个数据在各组个数据在各组中的频数?如何计算样本数据在各组中中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出的频率?你能将这些数据用表格反映出来吗?来吗?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5. 分分 组组 频数累计频数累计 频数频数 频率频率 00,0.50.5) 4 0.044 0.04 0.5 0.5,1 1) 正正 8 0.088 0.08 1 1,1.51.5) 正正 正正 正正 15 0.1515 0.15 1.5 1.5,2 2) 正正 正正 正正 正正 22 0.2222 0.22 2 2,2.52.5) 正正 正正 正正 正正 正正 25 0.2525 0.25 2.5 2.5,3 3) 正正 正正 14 0.1414 0.14 3 3,3.53.5) 正正 一一 6 0.066 0.06 3.5 3.5,4 4) 4 0.044 0.04 4 4,4.5 2 0.024.5 2 0.02 合计合计 100 1.00100 1.00思考思考5 5:上表称为样本数据的上表称为样本数据的频率分布表频率分布表,由此可以推测该市全体居民月均用水量由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了用水量标准提供参考依据,这里体现了一种什么统计思想?一种什么统计思想? 用样本的频率分布估计总体分布用样本的频率分布估计总体分布. .思考思考6 6:如果市政府希望如果市政府希望85%85%左右的居民每月左右的居民每月的用水量不超过标准,根据上述频率分布表,的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即你对制定居民月用水量标准(即a a的取值)的取值)有何建议?有何建议?88%88%的居民月用水量在的居民月用水量在3t3t以下,可建议取以下,可建议取a=3. a=3. 思考思考7 7:在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以以上的居民用水不超标吗?哪些环节可能会导上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?致结论出现偏差?分组时,组距的大小可能会导致结论出现偏分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的差,实践中,对统计结论是需要进行评价的. . 思考思考8 8:对样本数据进行分组,其组数对样本数据进行分组,其组数是由哪些因素确定的?是由哪些因素确定的?思考思考9 9:对样本数据进行分组,组距的确定没对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况我们了解数据的分布情况. .数据分组的组数与数据分组的组数与样本容量有关,一般样本容量越大,所分组样本容量有关,一般样本容量越大,所分组数越多数越多. .按统计原理,若样本的容量为按统计原理,若样本的容量为n n,分,分组数一般在(组数一般在(1+3.3lg1+3.3lgn n)附近选取)附近选取. .当样本容当样本容量不超过量不超过100100时,按照数据的多少,常分成时,按照数据的多少,常分成5 51212组组. .若以若以0.10.1或或1.51.5为组距对上述为组距对上述100100个样个样本数据分组合适吗?本数据分组合适吗?思考思考1010:一般地,列出一组样本数据的频率一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?分布表可以分哪几个步骤进行?第一步,求极差第一步,求极差. .(极差(极差= =样本数据中最大值与最小值的差)样本数据中最大值与最小值的差)第二步,决定组距与组数第二步,决定组距与组数. .(设(设k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数=k=k,否则,组数,否则,组数=k+1=k+1) 第三步,确定分点,将数据分组第三步,确定分点,将数据分组. .第四步,统计频数,计算频率,制成表格第四步,统计频数,计算频率,制成表格. . (频数(频数= =样本数据落在各小组内的个数,样本数据落在各小组内的个数, 频率频率= =频数频数样本容量)样本容量)知识探究(二):频率分布直方图知识探究(二):频率分布直方图 思考思考1 1:为了直观反映样本数据在各组中为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:的有关信息用下面的图形表示: 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O上上图称为图称为频率分布直方图频率分布直方图,其中横轴表,其中横轴表示月均用水量,纵轴表示频率示月均用水量,纵轴表示频率/ /组距组距. . 频率分布直方图中各小长方形的和高度频率分布直方图中各小长方形的和高度在数量上有何特点?在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:宽度:组距组距高度:高度:频率频率组距组距思考思考2 2:频率分布直方图中各小长方形的频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和面积表示什么?各小长方形的面积之和为多少?为多少?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O各小长方形的面积各小长方形的面积= =频率频率各小长方形的面积之和各小长方形的面积之和= =1 1思考思考3 3:频率分布直方图非常直观地表明频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来但原始数据不能在图中表示出来. .你能根你能根据上述频率分布直方图指出居民月均用据上述频率分布直方图指出居民月均用水量的一些数据特点吗?水量的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等. .思考思考4 4:样本数据的频率分布直方图是根样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?分布直方图的作图步骤如何? 第一步,画平面直角坐标系第一步,画平面直角坐标系. . 第二步,在横轴上均匀标出各组分点,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度. .第三步,以组距为宽,各组的频率与第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的组距的商为高,分别画出各组对应的小长方形小长方形. .思考思考5 5:对一组给定的样本数据,频率分对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以在居民月均用水量样本中,你能以1 1为组为组距画频率分布直方图吗?距画频率分布直方图吗? 与分组数(或组距)及坐标系的单位长与分组数(或组距)及坐标系的单位长度有关度有关. .月均用水量月均用水量/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O理论迁移理论迁移 例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 4242,3838,2929,3636,4141,4343,5454,4343,3434,4444, 4040,5959,3939,4242,4444,5050,3737,4444,4545,2929, 4848,4545,5353,4848,3737,2828,4646,5050,3737,4444, 4242,3939,5151,5252,6262,4747,5959,4646,4545,6767, 5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少. .(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组. . 分分 组组 频数频数 频率频率 2727,3232) 3 0.063 0.06 32 32,3737) 3 0.063 0.06 37 37,4242) 9 0.189 0.18 42 42,4747) 16 0.3216 0.32 47 47,5252) 7 0.147 0.14 52 52,5757) 5 0.105 0.10 57 57,6262) 4 0.084 0.08 62 62,6767) 3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7, 故故年龄在年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.小结作业小结作业1.1.频率分布是指一个样本数据在各个小范围频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值内所占比例的大小,总体分布是指总体取值的频率分布规律的频率分布规律. .我们通常用样本的频率分我们通常用样本的频率分布表或频率分布直方图去估计总体的分布布表或频率分布直方图去估计总体的分布. .2.2.频率分布表和频率分布直方图,是对相同频率分布表和频率分布直方图,是对相同数据的两种不同表达方式数据的两种不同表达方式. .用紧凑的表格改变用紧凑的表格改变数据的排列方式和构成形式,可展示数据的数据的排列方式和构成形式,可展示数据的分布情况分布情况. .通过作图既可以从数据中提取信息,通过作图既可以从数据中提取信息,又可以利用图形传递信息又可以利用图形传递信息. .3.3.样本数据的频率分布表和频率分布直方样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况分布情况,并由此估计总体的分布情况. .作业:作业:P71P71练习:练习:1.1.(1 1). . P81P81习题习题2.2A2.2A组:组:2.2.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号