资源预览内容
第1页 / 共24页
第2页 / 共24页
第3页 / 共24页
第4页 / 共24页
第5页 / 共24页
第6页 / 共24页
第7页 / 共24页
第8页 / 共24页
第9页 / 共24页
第10页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
.总体特征数:总体特征数:在数学中,通常把能反映总体某种特征的量称为总体特征数在数学中,通常把能反映总体某种特征的量称为总体特征数如何反映总体的特征数?如何反映总体的特征数?用样本的特征数估计总体的特征数!用样本的特征数估计总体的特征数!.情境引入一情境引入一: 在利用单摆检验重力加速度的实验中,全班同学在相同的条件下进行测试,得到下列数据单位:m/s)9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.329.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.949.65 9.79 9.42 9.68 9.70 9.84 9.90怎样利用这些数据对重力加速度进行估计?怎样利用这些数据对重力加速度进行估计?数数均均平平.问题转化为:问题转化为:实验结果测得一组数据为实验结果测得一组数据为用用 作为重力加速度作为重力加速度“最理想的近似最理想的近似值,依据是什么呢?值,依据是什么呢?算术平均数算术平均数=读作:读作: 平均平均 处理实验数据的原则是使这个近似值与实验数处理实验数据的原则是使这个近似值与实验数据之间的离差偏向最小、设近似值为据之间的离差偏向最小、设近似值为x,则它与则它与n个实验值个实验值 aii1,2,3,n的的离差分别为离差分别为 x-a1,x-a2,x-an平均数最能代表一个样本数据的集中趋势,平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小。也就是说它与样本数据的离差最小。称为这称为这n n个数的个数的 平均数或者均值平均数或者均值.例1 某校高一年级的甲乙两个班级均为50人的数学成绩如下总分150),试确定这次考试中,哪个班的数学成绩更好一些 .甲班甲班 乙班乙班 甲班均分甲班均分 乙班均分乙班均分1128610684100105981029410787112949499901209895119108100961151111049510811110510410711910793102981121129992102938494941009084114116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110. 考虑考虑某公司内部结构以及工资分布:某公司内部结构以及工资分布:人员经理管理人员技工工人 学徒 合计月工资11000125011001000500人数165101023 某公司有经理某公司有经理1人,另有人,另有6名管理人员,名管理人员,5名高级名高级技工,技工,10名工人和名工人和10名学徒,现需要增加一名新工人。名学徒,现需要增加一名新工人。小张前来应聘,经理说:小张前来应聘,经理说:“我公司报酬不错,平均工我公司报酬不错,平均工资每月资每月1695元。元。”小张工作几天后找到经理说:小张工作几天后找到经理说:“你你欺骗了我,我问过其他工人,每月一个人的工资超过欺骗了我,我问过其他工人,每月一个人的工资超过1500元,平均月工资怎么能是元,平均月工资怎么能是1695元呢?元呢?”经理拿出经理拿出如下表所示的工资表说:如下表所示的工资表说:“你看,平均周工资就是你看,平均周工资就是1695元。元。” 在这个问题中,总体月平均数能客观地反映工人的在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什么?月工资水平吗?为什么?. 总体月平均数不能反映工人的月工资水平,总体月平均数不能反映工人的月工资水平,总体月平均数不能反映工人的月工资水平,总体月平均数不能反映工人的月工资水平,因为公司中少数人的月工资额与大多因为公司中少数人的月工资额与大多因为公司中少数人的月工资额与大多因为公司中少数人的月工资额与大多 数人数人数人数人的月工资额差别较大,这样导致平均的月工资额差别较大,这样导致平均的月工资额差别较大,这样导致平均的月工资额差别较大,这样导致平均 数与数与数与数与中位数的偏差较大,所以月平均数不中位数的偏差较大,所以月平均数不中位数的偏差较大,所以月平均数不中位数的偏差较大,所以月平均数不 能反能反能反能反映这个公司工人的月工资水平,而应映这个公司工人的月工资水平,而应映这个公司工人的月工资水平,而应映这个公司工人的月工资水平,而应 该应该应该应该应用中位数或众数来反映工人的月工资用中位数或众数来反映工人的月工资用中位数或众数来反映工人的月工资用中位数或众数来反映工人的月工资 水平水平水平水平 在这个问题中,总体月平均数能客观地反映工人的在这个问题中,总体月平均数能客观地反映工人的月工资水平吗?为什么?月工资水平吗?为什么?.例例2 2 高一高一1班学生年龄统计:(班级共有班学生年龄统计:(班级共有43人人其中有其中有20人人18岁,岁,13人人17岁,岁,7人人16岁,岁,3人人15岁,求该班级的平均年龄。岁,求该班级的平均年龄。分析分析在班级年龄序列中在班级年龄序列中18出现了出现了20次,次, 17出现了出现了13次,次,16出现了出现了7次,次,15出现了出现了3次次解:解:“加权平均数加权平均数”15.加权平均值加权平均值(用频率计算平均值)(用频率计算平均值) 一般地,若取值为一般地,若取值为 , 出现的次数分别为出现的次数分别为 ,设频,设频率为率为 则其加权平均数为则其加权平均数为其中其中.例例3 3:由下表估计学生日平均睡眠时间:由下表估计学生日平均睡眠时间睡眠时间睡眠时间人数人数频率频率6,6.5)50.056.5,7)170.177,7.5)330.337.5,8)370.378,8.5)60.068.5,920.02合合 计计1001.收入范围收入范围所占百分所占百分比比1000010000 至至 150001500010%10%1500015000 至至 200002000015%15%2000020000 至至 250002500020%20%2500025000 至至 300003000025%25%3000030000 至至 350003500015%15%3500035000 至至 400004000010%10%4000040000 至至 50000500005%5%例例4 4:由某单位年收入表试估计该单位职工:由某单位年收入表试估计该单位职工 的平均年输入的平均年输入.有甲乙两种钢筋,现从中各抽取一个样本有甲乙两种钢筋,现从中各抽取一个样本检查它们的抗拉强度,如下表:检查它们的抗拉强度,如下表:甲甲110120130125120125135125135125乙乙115100125130115125125145125145110115105120125130135140110115105120125130135140甲甲乙乙100145哪种钢筋的质量较好?哪种钢筋的质量较好?11012125130情境引入二情境引入二:.一组数据的最大值与最小值的差称为极差;一组数据的最大值与最小值的差称为极差;说明甲比乙稳定说明甲比乙稳定思思 考考 : 什么样的指标可以反映一组数据什么样的指标可以反映一组数据 变化范围的大小?变化范围的大小? 极差最大值最小值极差最大值最小值 甲甲110115105120125130135140110115105120125130135140乙乙100145极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度极差体现了数据的离散程度. 某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下: 甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62问:问:哪种玉米苗长得高?哪种玉米苗长得高?哪种玉米苗长得齐?哪种玉米苗长得齐?怎怎么么办办呢呢?.甲甲37最大值)最大值)29最小值)最小值)8乙乙66最大值)最大值)11最小值)最小值)55极极 差差 甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙. 如果甲乙两组数据的集中程度差异不大时,怎如果甲乙两组数据的集中程度差异不大时,怎么办呢?么办呢? 我们可以考虑每一株的高度与平均高度的离差离差的平方和越小,长的越齐离差的平方和越小,长的越齐 考察样本数据的分散程度的大小考察样本数据的分散程度的大小, 最常用的统计最常用的统计量是方差和标准差。量是方差和标准差。 样本中各数据与样本平均数的差的平方和的平样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差的算术平方根叫做样本标准差。.设一组样本数据设一组样本数据 ,其平均数为,其平均数为 ,那么,那么称称s2为这个样本的方差,为这个样本的方差,称为这个样本的标准差,分别称为样本方差、样本标准差称为这个样本的标准差,分别称为样本方差、样本标准差 即即它的算术平方根它的算术平方根. 因为方差与原始数据的单位不同,且平方后可能夸大因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们标准差来刻画一组数据的稳定了离差的程度,我们标准差来刻画一组数据的稳定 水水平平 方差和标准差的意义:方差和标准差的意义: 描述一个样本和总体的波动离散程度大小的特征数,标准差大说明波动大描述一个样本和总体的波动离散程度大小的特征数,标准差大说明波动大. . .如果数据如果数据的平均数为的平均数为 ,方差为方差为(1 1新数据新数据的平均数为的平均数为,方差仍为,方差仍为 (2 2新数据新数据的平均数为的平均数为,方差为,方差为 (3 3新数据新数据的平均数为的平均数为 ,方差为方差为 ,那么,那么方差的运算性质:方差的运算性质:.极差、方差与标准差的区别和联系:极差、方差与标准差的区别和联系: 都是用来描述数据的离散程度,其中极差都是用来描述数据的离散程度,其中极差都是用来描述数据的离散程度,其中极差都是用来描述数据的离散程度,其中极差是数据最大值与最小值的差,反映了一组数据是数据最大值与最小值的差,反映了一组数据是数据最大值与最小值的差,反映了一组数据是数据最大值与最小值的差,反映了一组数据的变化的最大幅度,它对一组数据中的极端值的变化的最大幅度,它对一组数据中的极端值的变化的最大幅度,它对一组数据中的极端值的变化的最大幅度,它对一组数据中的极端值非常敏感。方差反映一组数据围绕平均数波动非常敏感。方差反映一组数据围绕平均数波动非常敏感。方差反映一组数据围绕平均数波动非常敏感。方差反映一组数据围绕平均数波动的大小,标准差是以样本数据为单位表示波动的大小,标准差是以样本数据为单位表示波动的大小,标准差是以样本数据为单位表示波动的大小,标准差是以样本数据为单位表示波动幅度。幅度。幅度。幅度。.例例1 1:从高一:从高一1 1班的一次数学测验抽取一小组班的一次数学测验抽取一小组成绩如下保留整数):成绩如下保留整数):85 90 80 80 85 75 100 计算这组样本数据的极差、方差和标准差计算这组样本数据的极差、方差和标准差.例例2 2甲、乙两种水稻试验品种连续甲、乙两种水稻试验品种连续5 5年的平均单位年的平均单位面积产量如下单位:面积产量如下单位:t/hm2t/hm2),试根据这组数据),试根据这组数据估计哪一种水稻品种的产量比较稳定。估计哪一种水稻品种的产量比较稳定。品种品种第第1 1年年第第2 2年年第第3 3年年第第4 4年年第第5 5年年甲甲9.89.89.99.910.110.1101010.210.2乙乙9.49.410.310.310.810.89.79.79.89.8.1 1、在一次歌手大奖赛上,七位评委为歌手打出的分数、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:如下:9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去掉一个最高分,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为和一个最低分后,所剩数据的平均值和方差分别为_; 2 2、已知数据、已知数据 的方差为的方差为2 2,则求数据,则求数据 的方差、标准差。的方差、标准差。 9.5,0.016 .
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号