资源预览内容
第1页 / 共38页
第2页 / 共38页
第3页 / 共38页
第4页 / 共38页
第5页 / 共38页
第6页 / 共38页
第7页 / 共38页
第8页 / 共38页
第9页 / 共38页
第10页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2.2.2 用样本的数字特征估计 总体的数字特征1.1.对一个未知总体,我们常用样本的频率分布对一个未知总体,我们常用样本的频率分布来来估估计总体的分布,其中表示样本数据的频率分布的基计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?本方法有哪些?图、表、表、总体数据的数字特征体数据的数字特征 2.2.下图是某赛季东、西部球队数据,那么如何比较东下图是某赛季东、西部球队数据,那么如何比较东部赛区与西部赛区的优劣呢?部赛区与西部赛区的优劣呢?如果要求我们根据上面的数据,估计、比较某赛季如果要求我们根据上面的数据,估计、比较某赛季东部赛区与西部赛区的优劣,就得有相应的数据作东部赛区与西部赛区的优劣,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进为比较依据,即通过样本数据对总体的数字特征进行研究,行研究,用样本的数字特征来估计总体的数字特征用样本的数字特征来估计总体的数字特征. . 1.1.正确理解样本数据标准差的意义和作用,学会计算正确理解样本数据标准差的意义和作用,学会计算数据的标准差数据的标准差. .2.2.理解用样本的基本数字特征来估计总体的基本数字理解用样本的基本数字特征来估计总体的基本数字特征特征. .(难点)(难点)3.3.会应用相关知识会应用相关知识来来解决简单的统计问题解决简单的统计问题. .( (重点)重点)1.1.众数的定义众数的定义: : 在一组数据中,出现次数最多的数在一组数据中,出现次数最多的数据叫做这一组数据的众数据叫做这一组数据的众数. .2.2.中位数的定义中位数的定义: : 将一组数据按大小顺序依次排列,将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或两个数据的平均把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数数)叫做这组数据的中位数. .3.3.平均数的定义平均数的定义: :一组数据的和除以数据的个数所一组数据的和除以数据的个数所得到的数得到的数. .思考思考1 1:怎样将各个样本数据汇总为一个数值,:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的并使它成为样本数据的“中心点中心点”? ?众数、中位数、平均数众数、中位数、平均数【课堂探究课堂探究1 1】月均用水量月均用水量/t/t频率频率/组距组距0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.50.5 1 1.5 2 2.5 3 3.5 4 4.5 O取最高矩形下端中点的取最高矩形下端中点的横坐标横坐标2.252.25作为众数作为众数. . 思考思考2 2:在城市居民月均用水量样本数据的频率分布:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?计总体的众数是什么? 思考思考3 3:在频率分布直方图中,每个小矩形的面积:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有表示什么?中位数左右两侧的直方图的面积应有什么关系?什么关系?每个小矩形的面每个小矩形的面积即即为所在所在组的的频率,中位率,中位数左数左边和右和右边的直方的直方图的面的面积应该相等相等从左至右各个小矩形的面从左至右各个小矩形的面积分分别是是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.0.5-0.04-0.08-0.15-0.22=0.01,0.5(0.010.25)=0.02,所以中位数是,所以中位数是2.02. 月均用水量月均用水量/t0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o o频率频率/组距组距思考思考4 4:平均数是频率分布直方图的:平均数是频率分布直方图的“重心重心”,将将频率分布直方图中每个小矩形的面积与小矩形底频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估计边中点的横坐标之积相加,就是样本数据的估计平均数平均数. 由此估计总体的平均数是什么?由此估计总体的平均数是什么?月均用水量月均用水量/t0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o o频率频率/组距组距0.250.04+0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.250.06+3.750.04+4.250.02=2.02(t). 所以平均数是所以平均数是2.02 t. 平均数与中位数相等,是必然还是巧合?平均数与中位数相等,是必然还是巧合?巧合巧合各小矩形底各小矩形底边中点的横坐中点的横坐标为:0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.各小矩形的面各小矩形的面积为:0.04,0.08,0.15,0.22,0.25,0.14,0.06, 0.04,0.02.思考:从居民月均用水量样本数据可知,该样本的思考:从居民月均用水量样本数据可知,该样本的众数是众数是2.32.3,中位数是,中位数是2.02.0,平均数是,平均数是1.9731.973,这与我,这与我们从样本频率分布直方图得出的结论有偏差,你能解们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?释一下原因吗? 频率分布直方率分布直方图损失了一些失了一些样本数据,得到的是一个本数据,得到的是一个估估计值,且所得的估,且所得的估计值与数据分与数据分组有关有关.注注:在只有在只有样本本频率分布直方率分布直方图的情况下,我的情况下,我们可以可以按上述方法估按上述方法估计众数、中位数和平均数,并由此估众数、中位数和平均数,并由此估计总体特征体特征.思考:一组数据的中位数一般不受少数几个极思考:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解数说明什么问题?你怎样理解“我们单位的收入我们单位的收入水平比别的单位高水平比别的单位高”这句话的含义?这句话的含义? 如:如:样本数据收集有个本数据收集有个别差差错不影响中位数;大学不影响中位数;大学毕业生凭工生凭工资中位数找中位数找单位可能收入位可能收入较低低. 平均数大于(或小于)中位数,平均数大于(或小于)中位数,说明明样本数据中本数据中存在存在许多多较大(或大(或较小)的极端小)的极端值. 这句句话具有模糊性甚至蒙具有模糊性甚至蒙骗性,其中收入水平是性,其中收入水平是员工工工工资的某个中心点,它可以是众数、中位数或的某个中心点,它可以是众数、中位数或平均数平均数.反应数据特点的值还有什么?反应数据特点的值还有什么?思考思考1 1:在一次射击选拔赛中,甲、乙两名运动员:在一次射击选拔赛中,甲、乙两名运动员各射击各射击1010次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7甲、乙两人本次射击的平均成绩分别为多少环?甲、乙两人本次射击的平均成绩分别为多少环?标准差标准差【课堂探究课堂探究2 2】思考思考2 2:甲、乙两人射击的平均成绩相等,如图所:甲、乙两人射击的平均成绩相等,如图所示,你能说明其水平差异在哪里吗?示,你能说明其水平差异在哪里吗?甲的成甲的成绩比比较分散,极差分散,极差较大大; 乙的成乙的成绩相相对集中,比集中,比较稳定定.环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)O O思考思考3 3:对于样本数据:对于样本数据x x1 1,x x2 2,x xn n,设想通过,设想通过各数据到其平均数的平均距离来反映样本数据的各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?分散程度,那么这个平均距离如何计算? 含有含有绝对值,运算不方便,运算不方便.(1 1)定义:反映)定义:反映样本数据的分散程度的大小样本数据的分散程度的大小,最常用,最常用的统计量是的统计量是标准差标准差,一般用,一般用s s表示表示. .假设样本数据假设样本数据x x1 1,x x2 2,x xn n的平均数为的平均数为 ,则标准差的计算公,则标准差的计算公式是:式是:标准差标准差(2)特征:)特征:标准差描述一组数据围绕标准差描述一组数据围绕 波波动的大小,反映了一组数据变化的幅度和离散程度的动的大小,反映了一组数据变化的幅度和离散程度的大小标准差较大,数据的离散程度较大小标准差较大,数据的离散程度较 ;标准差;标准差较小,数据的离散程度较较小,数据的离散程度较_._.平均数平均数大大小小计算甲、乙两名运动员的射击成绩的标准差,比计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性较其射击水平的稳定性. . 甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7s甲甲=2,s乙乙 1.095. 由由s甲甲s乙乙,可估可估计乙比甲的射乙比甲的射击成成绩稳定定.例例1 1 画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明它们的异同点说明它们的异同点. .(1) (1) ,;,;(2) (2) ,;,;解:解:(1)(1)(2)(2)(3) (3) ,;,;(4) (4) ,. .(3)(3)(4)(4)例例2 2 甲乙两人同时生产内径为甲乙两人同时生产内径为25.40 mm25.40 mm的一种零件的一种零件. .为了对两人的生产质量进行评比,从他们生产的零为了对两人的生产质量进行评比,从他们生产的零件中各抽出件中各抽出2020件,量得其内径尺寸如下件,量得其内径尺寸如下(单位:(单位:mmmm):):甲:甲:25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.3925.44 25.40 25.42 25.35 25.41 25.39乙:乙:25.40 25.43 25.44 25.48 25.40 25.43 25.44 25.48 25.4825.48 25.47 25.49 25.47 25.49 25.4925.49 25.36 25.34 25.33 25.43 25.36 25.34 25.33 25.43 25.4325.43 25.32 25.32 25.47 25.31 25.32 25.47 25.31 25.32 25.3225.32 25.3225.32 25.48 25.48从生产零件内径的尺寸看,谁生产的零件质量较高?从生产零件内径的尺寸看,谁生产的零件质量较高? 甲生甲生产的零件内径更接近内径的零件内径更接近内径标准,且准,且稳定程度定程度较高,故甲生高,故甲生产的零件的零件质量量较高高. 说明:说明:生产质量可生产质量可 以从以从 总体的平均数与标准差两总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差准差估计总体的平均数与标准差.解:解:【变式练习】甲127138130137135131乙133129138134128136某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛 解析解析 设甲乙两人的平均数分别为设甲乙两人的平均数分别为 , ,则则 130130 ( (3 38 80 07 75 51)1)133133, 130130 (3(31 18 84 42 26)6)133133, (6)6)2 25 52 2( (3)3)2 24 42 22 22 2( (2)2)2 2 002 2( (4)4)2 25 52 21 12 2( (5)5)2 23 32 2 , 因此,甲与乙的平均数相同,由于乙的方差较小,因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适比较合适1.101.10名工人某天生产同一零件,生产的件数分别是名工人某天生产同一零件,生产的件数分别是1515,1717,1414,1010,1515,1919,1717,1616,1414,1212,则这,则这一天一天 1010名工人生产的零件的中位数是名工人生产的零件的中位数是( )( )A.14 B.16 C.15 D.17A.14 B.16 C.15 D.17【解析解析】选C.把件数从小到大排列把件数从小到大排列为10,12,14,14,15,15,16,17,17,19,可知中位数,可知中位数为15.C C3.3.抽样统计甲、乙两位射击运动员的抽样统计甲、乙两位射击运动员的5 5次训练成绩次训练成绩(单位:环),结果如下:(单位:环),结果如下:运动员运动员第第1 1次次第第2 2次次第第3 3次次第第4 4次次第第5 5次次甲甲87879191909089899393乙乙89899090919188889292则成绩较为稳定(方差较小)的那位运动员成绩的则成绩较为稳定(方差较小)的那位运动员成绩的方差为方差为_.解:解:答案:答案:2 4.4.现有现有1010个数,其平均数为个数,其平均数为3 3,且这,且这1010个数的平方和个数的平方和是是100100,那么这个数组的标准差是,那么这个数组的标准差是( () )A A1 1B B2 2C C3 3D D4 4 解解:由由s2(x12 x22 xn2)得得 s2100321.A A5.5.甲、乙两个班各随机选出甲、乙两个班各随机选出1515名同学进行测验,所得成名同学进行测验,所得成绩的茎叶图如图绩的茎叶图如图. .从图中看,从图中看,_班的平均成绩较高班的平均成绩较高. .【解析解析】结合茎叶合茎叶图中成中成绩的情况可知,乙班平均成的情况可知,乙班平均成绩较高高.答案:答案:乙乙6.6.统计某校统计某校1 0001 000名学生的数学会考成绩,得到样本名学生的数学会考成绩,得到样本频率分布直方图如图所示,规定不低于频率分布直方图如图所示,规定不低于6060分为及格,分为及格,不低于不低于8080分为优秀,则及格人数是分为优秀,则及格人数是_;优秀率为;优秀率为_._.【解析解析】由已知不低于由已知不低于60分及格,分及格,则及格的及格的频率率为0.02510+0.03510+0.0120=0.25+0.35+0.2=0.8.所以及格的人数所以及格的人数为1 0000.8=800.不低于不低于80分分为优秀,秀,则优秀的秀的频率率为0.0120=0.2.所以所以优秀率秀率为20%.答案:答案:800 20%样样本本的的数数字字特特征征众数众数中位数中位数平均数平均数标准差标准差频率分布直方图中最频率分布直方图中最高矩形下端的中点高矩形下端的中点中位数两边的直中位数两边的直方图的面积相等方图的面积相等频率分布直方图中每个小矩频率分布直方图中每个小矩形的面积乘以小矩形底边中形的面积乘以小矩形底边中点的横坐标之和点的横坐标之和 进步是从看到自己的落后开始的;高明是从解剖自己的弱点开始的.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号