资源预览内容
第1页 / 共30页
第2页 / 共30页
第3页 / 共30页
第4页 / 共30页
第5页 / 共30页
第6页 / 共30页
第7页 / 共30页
第8页 / 共30页
第9页 / 共30页
第10页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
(一)众数、中位数、平均数2.2.2 2.2.2 2.2.2 2.2.2 用用用用样样样样本的数字特征估本的数字特征估本的数字特征估本的数字特征估计计计计总总总总体的数字特征体的数字特征体的数字特征体的数字特征一一 众数、中位数、平均数的概念众数、中位数、平均数的概念中位数中位数:将一:将一组组数据按大小依次排列,把数据按大小依次排列,把处处在在最中最中间间位置的一个数据(或最中位置的一个数据(或最中间间两个数据的两个数据的平均数)叫做平均数)叫做这组这组数据的中位数数据的中位数. 众数众数:在一:在一组组数据中,出数据中,出现现次数最多的数据叫次数最多的数据叫做做这组这组数据的众数数据的众数 平均数平均数: 一一组组数据的算数据的算术术平均数平均数,即即 问题问题1:众数、中位数、平均数众数、中位数、平均数这这三个数三个数一般都会来自于同一个一般都会来自于同一个总总体或体或样样本,它本,它们们能表明能表明总总体或体或样样本的什么性本的什么性质质?平均数平均数:反映所有数据的平均水平反映所有数据的平均水平 众数众数:反映的往往是局部反映的往往是局部较较集中的数据信息集中的数据信息 中位数中位数:是位置型数,反映是位置型数,反映处处于中于中间间部位的部位的 数据信息数据信息 1、求下列各、求下列各组组数据的数据的众数众数(1)、1 ,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1 ,2,3,3,3,5,5,8,8,9,9众数是:32、求下列各、求下列各组组数据的数据的中位数中位数(1)、1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4 3、在一次中学生田径运、在一次中学生田径运动动会上,参加男子跳高的会上,参加男子跳高的17名名运运动员动员的成的成绩绩如下表所示:如下表所示:分分别别求求这这些运些运动员动员成成绩绩的众数,中位数与平均数的众数,中位数与平均数 。解:在解:在17个数据中,个数据中,1.75出出现现了了4次,出次,出现现的次数最多,的次数最多,即即这组这组数据的众数是数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大的个数据可看成是按从小到大的顺顺序排列序排列的,其中第的,其中第9个数据个数据1.70是最中是最中间间的一个数据,即的一个数据,即这组这组数数据的中位数是据的中位数是1.70;答:答:17名运名运动员动员成成绩绩的众数、中位数、平均数依次是的众数、中位数、平均数依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)。(米)。 这组这组数据的平均数是数据的平均数是 二、众数、中位数、平均数与众数、中位数、平均数与频频率率分布直方分布直方图图的关系的关系频频率率组组距距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 众数在众数在样样本数据的本数据的频频率分布直方率分布直方图图中,中,就是最高矩形的中点的横坐就是最高矩形的中点的横坐标标。如何在如何在频频率分布直方率分布直方图图中估中估计计众数众数可将众数看作直方可将众数看作直方图图中面中面积积最大最大长长方形的方形的“中心中心”2.250.52.521.5143.534.5频频率率组组距距0.040.080.150.220.250.140.060.040.02前四个小矩形的前四个小矩形的面面积积和和=0.49后四个小矩形的后四个小矩形的面面积积和和=0.262.02如何在如何在频频率分布直方率分布直方图图中估中估计计中位数中位数在在样样本中中位数的左右各有本中中位数的左右各有50%的的样样本数,本数,条形面条形面积积各各为为0.5,所以反映在直方所以反映在直方图图中位数中位数左右的面左右的面积积相等相等.,中位数中位数)可将中位数看作整个直方可将中位数看作整个直方图图面面积积的的“中心中心”(x-2)*0.5=0.1得思考思考讨论讨论以下以下问题问题:1、2.02这这个中位数的估个中位数的估计值计值,与,与样样本的中本的中位数位数值值2.0不一不一样样,你能解,你能解释释其中原因其中原因吗吗?答:答:2.02这这个中位数的估个中位数的估计值计值,与与样样本的中本的中位数位数值值2.0不一不一样样,这这是因是因为样为样本数据的本数据的频频率分布直方率分布直方图图,只是直,只是直观观地表明分布的形地表明分布的形状,但是状,但是从直方从直方图图本身得不出原始的数据本身得不出原始的数据内容,直方内容,直方图图已已经损经损失一些失一些样样本信息。本信息。所所以由以由频频率分布直方率分布直方图图得到的中位数估得到的中位数估计值计值往往与往往与样样本的本的实际实际中位数中位数值值不一致不一致.如何在如何在频频率分布直方率分布直方图图中估中估计计平均数平均数=2.02 =2.02平均数的估平均数的估计值计值等于等于频频率分率分布直方布直方图图中每个小矩形的面中每个小矩形的面积积乘以小矩形底乘以小矩形底边边中点的横中点的横坐坐标标之和。之和。 可将平均数看作整个直方可将平均数看作整个直方图图面面积积的的“重心重心” 思考思考讨论讨论以下以下问题问题:2、样样本中位数不受少数极端本中位数不受少数极端值值的影响,的影响,这这在某些情况下是一个在某些情况下是一个优优点,但它点,但它对对极端极端值值的不敏感有的不敏感有时时也会成也会成为为缺点。你能缺点。你能举举例例说说明明吗吗?答:答:优优点:点:对对极端数据不敏感的方法能极端数据不敏感的方法能够够有效地有效地预预防防错误错误数据的影响。数据的影响。对对极端极端值值不敏感有利的例子不敏感有利的例子:例如当例如当样样本数据本数据质质量比量比较较差,即存在一些差,即存在一些错误错误数据(如数据数据(如数据录录入入错错误误、测测量量错误错误等)等)时时,用抗极端数据,用抗极端数据强强的中位数的中位数表示数据的中心表示数据的中心值值更准确。更准确。 缺点:(缺点:(1)出)出现错误现错误的数据也不知道;的数据也不知道;(2)对对极端极端值值不敏感有弊的例子:不敏感有弊的例子:某人具某人具有初有初级计级计算机算机专业专业技技术术水平,想找一份收水平,想找一份收入好的工作。入好的工作。这时这时如果采用各个公司如果采用各个公司计计算算机机专业专业技技术术人人员员收入的中位数作收入的中位数作为选择为选择工工作的参考指作的参考指标标就会冒就会冒这样这样的的风险风险:很可能所很可能所选择选择公司的初公司的初级计级计算机算机专业专业技技术术水平水平人人员员的收入很低,其原因是中位数的收入很低,其原因是中位数对对极小的数极小的数据不敏感。据不敏感。这这里更好的方法是同里更好的方法是同时时用平均工用平均工资资和中位数作和中位数作为为参考指参考指标标,选择选择平均工平均工资较资较高且高且中位数中位数较较大的公司就大的公司就业业. 例例1、下表是七位、下表是七位评评委委给给某参某参赛选赛选手的打分,手的打分,总总分分为为10分,分,你你认为认为如何如何计计算算这这位位选选手的最后得分才手的最后得分才较为较为合理?合理?提提问问:1、电视电视里里评评委是怎委是怎样给选样给选手打分的?手打分的? 2、为为什么什么这这么做?直接取中位数和众数的么做?直接取中位数和众数的值值不好么?不好么?三、 众数、中位数、平均数的众数、中位数、平均数的简单应简单应用用例例2 某工厂人某工厂人员员及工及工资资构成如下:构成如下:(1)指出)指出这这个个问题问题中周工中周工资资的众数、中位数、平均数的众数、中位数、平均数(2)这这个个问题问题中,工中,工资资的平均数能客的平均数能客观观地反映地反映该该厂的工厂的工资资水水平平吗吗?为为什么?什么? 分析分析:众数:众数为为200,中位数,中位数为为220,平均数,平均数为为300。 因平均数因平均数为为300,由表格中所列出的数据可,由表格中所列出的数据可见见,只有,只有经经理在平均数以上,其余的人都在平均数以下,故用平理在平均数以上,其余的人都在平均数以下,故用平均数不能客均数不能客观观真真实实地反映地反映该该工厂的工工厂的工资资水平。水平。课课堂堂练习练习:1、假、假设设你是一名交通部你是一名交通部门门的工作人的工作人员员。你打算向市。你打算向市长报长报告国告国家家对对本市本市26条公路条公路项项目投目投资资的平均的平均资资金数金数额额,其中一条新公,其中一条新公路的建路的建设设投投资为资为2 200万元人民万元人民币币,另外,另外25个个项项目的投目的投资资在在20万与万与100万中位数是万中位数是25万,平均数是万,平均数是100万,众数是万,众数是20万元。万元。你会你会选择选择哪一种数字特征来表示每一个哪一种数字特征来表示每一个项项目的国家投目的国家投资资?你?你选择这选择这种数字特征的缺点是什么?种数字特征的缺点是什么?选择选择平均数更好:因平均数更好:因为为,此,此时时的众数的众数20万比中位数万比中位数25万万还还小,小,所以众数代表的是局部的数。中位数代表的所以众数代表的是局部的数。中位数代表的虽虽然是大多数公路然是大多数公路投投资资的数的数额额,但由于其不受极端,但由于其不受极端值值的影响,不能代表全体,因的影响,不能代表全体,因而此而此时时成了它的缺点。成了它的缺点。选择选择平均数平均数较较好,能比好,能比较较好的代表整体好的代表整体水平,但缺点是仍不能水平,但缺点是仍不能显显示出具体的数字特征示出具体的数字特征 (二)情境一情境一; ;甲.乙两名射击队员,在进行的十次射击中成绩分别是:甲: 10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5乙: 9; 9; 8,5; 9; 9; 9.5; 9.5; 8.5; 8.5; 9.5试问二人谁发挥的水平较稳定?分析:甲的平均成绩是9环.乙的平均成绩也是9环.一一.实实例引入例引入情境二情境二: : 某某农场农场种植了甲、乙两种玉米苗,从中各抽取种植了甲、乙两种玉米苗,从中各抽取了了1010株,分株,分别测别测得它得它们们的株高如下:的株高如下:( (单单位位cm)cm) 甲:甲: 31 32 35 37 33 30 32 31 30 29 乙:乙: 53 16 54 13 66 16 13 11 16 62问问:哪种玉米苗哪种玉米苗长长得高?得高?哪种玉米苗哪种玉米苗长长得得齐齐?甲甲37(最大(最大值值)29(最小(最小值值)8乙乙66(最大(最大值值)11(最小(最小值值)55极极 差差 甲甲: 31 32 35 37 33 30 32 31 30 29 乙乙: 53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙极差:极差: 一一组组数据的最大数据的最大值值与最小与最小值值的差的差极差越大,数据越分散,越不极差越大,数据越分散,越不稳稳定定极差越小,数据越集中,越极差越小,数据越集中,越稳稳定定极差体极差体现现了数据的了数据的离散程度离散程度离散程度离散程度 为为了了对对两人射两人射击击水平的水平的稳稳定程度定程度,玉米生玉米生长长的的高度差异以及高度差异以及钢钢筋筋质质量量优优劣做个合理的劣做个合理的评评价价,这这里我里我们们引入了一个新的概念引入了一个新的概念,方差和方差和标标准差准差.设设一一组样组样本数据本数据 ,其平均数,其平均数为为 ,则则称称s2为这为这个个样样本的本的方差方差,称称为这为这个个样样本的本的标标准差准差,分,分别别称称为样为样本方差、本方差、样样本本标标准差准差它的算它的算术术平方根平方根x1,x2,xnv样样本方差和本方差和样样本本标标准差都是衡量一个准差都是衡量一个样样本本波波动动大小大小的量,的量,样样本方差或本方差或样样本本标标准准差差越大越大,样样本数据的本数据的波波动动就越大就越大。 例例1.计计算数据算数据89,93,88,91,94,90,88,87的的方差和方差和标标准差。(准差。(标标准差准差结结果精确到果精确到0.1) 解:解: 所以所以这组这组数据的方差数据的方差为为5.5,标标准差准差为为2.3 .练习练习:若甲、乙两:若甲、乙两队队比比赛赛情况如下情况如下,下列下列说说法哪些法哪些 说说法是不正确的:法是不正确的:甲甲乙乙平均失球数平均失球数平均失球个数的平均失球个数的标标准差准差1. 52. 11. 10. 41、平均来、平均来说说,甲的技,甲的技术术比乙的技比乙的技术术好;好;2、乙比甲技、乙比甲技术术更更稳稳定;定;3、甲、甲队队有有时时表表现现差,有差,有时时表表现现好;好;4、乙、乙队队很少不失球。很少不失球。全全对对例例2:甲、乙两种水稻:甲、乙两种水稻试验试验品种品种连续连续5年的平均年的平均单单位面位面积产积产量量如下(如下(单单位:位:t/hm ),),试试根据根据这组这组数据估数据估计计哪一种水稻品种哪一种水稻品种的的产产量比量比较稳较稳定定 解:1 1、在一次歌手大、在一次歌手大奖赛奖赛上,七位上,七位评评委委为为歌手打出的分歌手打出的分数如下:数如下:9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去,去掉一个最高分和一个最低分后,所剩数据的平均掉一个最高分和一个最低分后,所剩数据的平均值值和和方差分方差分别为别为_; 2 2、已知数据、已知数据 的方差的方差为为2 2,则则求数据求数据 的方差。的方差。9.5,0.016 三三. .当堂反当堂反馈馈思考一下:如果数据如果数据的平均数的平均数为为 ,方差方差为为(1 1)新数据)新数据的平均数的平均数为为,方差仍,方差仍为为 (2 2)新数据)新数据的平均数的平均数为为,方差,方差为为 (3 3)新数据)新数据的平均数的平均数为为 ,方差方差为为 ,则则方差的运算性方差的运算性质质:
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号