资源预览内容
第1页 / 共24页
第2页 / 共24页
第3页 / 共24页
第4页 / 共24页
第5页 / 共24页
第6页 / 共24页
第7页 / 共24页
第8页 / 共24页
第9页 / 共24页
第10页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二课时统计的基本思想方法:用样本估计总体,即通常不直接去研究 总体,而是通过从总体中抽取一个样本,根 据样本的情况去估计总体的相应情况. 统计的核心问题:如何根据样本的情况对总体的情况作出 一种推断. 这里包括两类问题: 一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、 分析, 对总体的情况作出推断.用样本的有关情况去估计总体的相应 情况,这种估计大体分为两类,一类是用 样本频率分布估计总体分布,一类是用样 本的某种数字特征(例如平均数、方差等 )去估计总体的相应数字特征。 整体介绍:将一批数据按要求分为若干个组,各组 内数据的个数,叫做该组的频数。频率:每组数据的个数除以全体数据个 数的商叫做该组的频率。n根据随机抽取样本的大小,分别计算某 一事件出现的频率,这些频率的分布规 律(取值状况),就叫做样本的频率分 布。说明:样本频率分布与总体频率分 布有什么关系?通过样本的频数分布、频率分布可 以估计总体的频率分布.典例回放:某市政府为了节约生活用水, 计划在本市试行居民生活用水定额管理,即 确定一个居民月用水量标准a , 用水量不超过 a的部分按平价收费,超过a的部分按议价收 费。如果希望大部分居民的日常生活不受影 响,那么标准a定为多少比较合理呢?为了较合理地确定这个标准,你认为需 要做哪些工作?思考:由上表,大家可以得到什么信息? 通过抽样,我们获得了100位居民某年的月平均用 水量(单位:t) ,如下表: 1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、 将数据分组(8.2取整,分为9组)复习:画频率分布直方图的步骤4、列出频率分布表.(学生填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。1.求极差:步骤:频率分布直方图2.决定组距与组数: 组数=4.3 - 0.2 = 4.14.1 0.5= 8.2组距极差=3.将数据分组0,0.5 ),0.5,1 ),4,4.5 4.列频率分布表100位居民月平均用水量的频率分布表频率/组距月平均用水量/t0.500.40 0.30 0.20 0.1000.5 1 1.5 2 2.5 3 3.5 4 4.5 5.画频率分布直方图探究:同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同。不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断。分 别以1和0.1为组距重新作图,然后谈谈你对图的印象。 一、求极差,即数据中最大值与最小值的差二、决定组距与组数 :组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间 , 最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以 按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率组距)频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中 各小长方形上端的中点 ,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那 么频率分布直方图就会无限接近于一条光滑曲线 总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其 频率分布直方图的情况会有什么变化?假如增至 10000呢?总体密度曲线频率组距月均用 水量/t ab(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.总体密度曲线茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(1)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图甲乙0123452 55 41 6 1 6 7 94 9 084 6 33 6 83 8 91叶就是从茎的旁边 生长出来的数,表示得 分的个位数。茎是指中间的一列 数,表示得分的十位 数茎叶图不仅能够保留原始数据,而且能够 展示数据的分布情况。从运动员的成绩的分布来看,乙运动员的 成绩更好;从叶在茎上的分布情况来看,乙运 动员的得分更集中于峰值附近,说明乙运动员 的发挥更稳定。在样本数据较少时,用茎叶图表示数据的 效果较好。它不但可以保留所有信息,而且可 以随时纪录,这对数据的纪录和表示都能带来 方便。但当样本数据较多时,茎叶图就显得不 太方便。因为每一个数据都要在茎叶图中占据 一个空间,如果数据很多,枝叶就会很长。一般地,画出一组样本数据的茎叶图的 步骤如下:第一步,将每个数据分为“茎”(高位 )和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的 数按大小次序排成一列,写在中间;第三步,将各个数据的叶按大小次序写 在茎右(左)侧.用茎叶图表示数据的分布情况是一种好方法 ,茎叶图有以下优点:(1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改. 问题1:比较茎叶图和频率分布表,茎叶图 中“茎”和“叶”的数目分别与频率分布 表中哪些数目相当? 问题2:对任意一组样本数据,是否都适合 用茎叶图表示?为什么? 不适合样本容量很大或茎、叶不分明的样 本数据. :为了了解高一学生的体能情况,某校 随机抽取部分学生进行一分钟跳绳次数测试 ,将所得数据整理后,画出了频率分布直方 图.图中从左到右各小长方形的面积之比为2 :4:17:15:9:3,第二小组的频数为12. (1)第二小组的频率是多少?(2)样本容量是多少?(3)若次数在110以上(含110次)为达 标,试估计该校全体高一学生的达标率约 是多少?90 100 110 120 130 140 150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号