资源预览内容
第1页 / 共21页
第2页 / 共21页
第3页 / 共21页
第4页 / 共21页
第5页 / 共21页
第6页 / 共21页
第7页 / 共21页
第8页 / 共21页
第9页 / 共21页
第10页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
标准差标准差 样本的众数、中位数和平均数常用来表样本的众数、中位数和平均数常用来表样本的众数、中位数和平均数常用来表样本的众数、中位数和平均数常用来表示样本数据的示样本数据的示样本数据的示样本数据的“中心值中心值中心值中心值”,其中众数和中位数容,其中众数和中位数容,其中众数和中位数容,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表易计算,不受少数几个极端值的影响,但只能表易计算,不受少数几个极端值的影响,但只能表易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息达样本数据中的少量信息达样本数据中的少量信息达样本数据中的少量信息. . . . 平均数代表了数据更平均数代表了数据更平均数代表了数据更平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端多的信息,但受样本中每个数据的影响,越极端多的信息,但受样本中每个数据的影响,越极端多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大的数据对平均数的影响也越大的数据对平均数的影响也越大的数据对平均数的影响也越大. . . .当样本数据质量当样本数据质量当样本数据质量当样本数据质量比较差时,使用众数、中位数或平均数描述数据比较差时,使用众数、中位数或平均数描述数据比较差时,使用众数、中位数或平均数描述数据比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,的中心位置,可能与实际情况产生较大的误差,的中心位置,可能与实际情况产生较大的误差,的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要难以反映样本数据的实际状况,因此,我们需要难以反映样本数据的实际状况,因此,我们需要难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度一个统计数字刻画样本数据的离散程度一个统计数字刻画样本数据的离散程度一个统计数字刻画样本数据的离散程度. . . . 实际问题:有两位射击运动员在一次射击测试中各射靶实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:乙:乙: 如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果是一如果是一次选拔考核,你应该如何做选择?次选拔考核,你应该如何做选择?计算可得计算可得两人射击两人射击 的平均成绩是一样的的平均成绩是一样的. .那么两个人的水平就没那么两个人的水平就没有什么差异吗有什么差异吗? ?45678910环数环数频率频率0.10.20.3(甲甲)456789 100.10.20.30.4环数环数频率(乙乙)甲成绩比较甲成绩比较分散分散, ,乙成绩乙成绩相对集中相对集中看来,平均数还难以看来,平均数还难以概括样本的实际状态,概括样本的实际状态,因此因此, ,我们还需要从另外的我们还需要从另外的角度来考察这两组数据角度来考察这两组数据. .思思 考考 :什么样的指标可以反映一组数据:什么样的指标可以反映一组数据 变化范围的大小?变化范围的大小? 我们可以用一组数据中的最大值减去最我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围。小值所得的差来反映这组数据的变化范围。用这种方法得到的差称为用这种方法得到的差称为极差极差 极差最大值最小值极差最大值最小值 在生活中,我们常常会和极差打交在生活中,我们常常会和极差打交道班级里个子最高的学生比个子最矮的学道班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子小的孩子大多少?这些都是求极差的例子 例例1.(口答)求下列各题的极差。(口答)求下列各题的极差。(1)某班个子最高的学生身高为)某班个子最高的学生身高为1.70米,个米,个子最矮的学生的身高为子最矮的学生的身高为1.38米,求该班所有米,求该班所有学生身高的极差。学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是岁,年纪最小的孩子的年龄是9岁,求小明家岁,求小明家中所有成员年龄的极差。中所有成员年龄的极差。甲的环数极差甲的环数极差=10-4=6=10-4=6乙的环数极差乙的环数极差=9-5=4. =9-5=4. 极极差差对对极极端端值值非非常常敏敏感感,在在一一定定程程度度上上表表明明样样本本数数据据的的的的波波动动情情况况但但极极差差只只能能反反映映一一组组数数据据中中两两个个极极端端值值之之间间的的差差异异情情况况,对对其其他他数数据据的的波波动动情情况况不不敏敏感感,到到底底是是A A组组还还是是B B组组数数据据更更加加稳稳定定呢呢?有有必必要要重重新新找找一一个个对对整整组组数数据据波动情况更敏感的指标波动情况更敏感的指标本节课我们就要来学习反应一组数据本节课我们就要来学习反应一组数据稳定程稳定程度度的两个量的两个量方差、标准差方差、标准差 考察样本数据的分散程度的大小,最常考察样本数据的分散程度的大小,最常用的统计量是用的统计量是标准差标准差 标准差是样本平均数的一种标准差是样本平均数的一种平均距离平均距离,一般用一般用s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:x。xxxxxin的距离是的距离是到到表示这组数据的平均数表示这组数据的平均数假设样本数据是假设样本数据是-,.,21 于是样本数据于是样本数据x1,x2,xn,到到x的平均的平均距离是距离是平均距离平均距离标准差标准差由于上式含有绝对值,运算不太方便,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差因此,通常改用如下公式来计算标准差考虑一个容量为考虑一个容量为2的样本的样本:标准差的几何意义标准差的几何意义a 显然显然显然显然, , , ,标准差越大标准差越大标准差越大标准差越大, , , ,则则则则a a越大越大越大越大, , , ,数据的离散程数据的离散程数据的离散程数据的离散程度越大度越大度越大度越大; ; ; ;标准差越小标准差越小标准差越小标准差越小, , , ,数据的离散程度越小数据的离散程度越小数据的离散程度越小数据的离散程度越小. . . . 标准差标准差用来衡量一批数据的用来衡量一批数据的波动大小波动大小(即即这批数据偏离平均数的大小这批数据偏离平均数的大小).标准差的取值范围是什么标准差的取值范围是什么?标准差为标准差为0的样本的样本数据有什么特点数据有什么特点?标准差是怎样表现数据的离标准差是怎样表现数据的离散程度的散程度的?标准差的取值范围标准差的取值范围: 0,+)标准差为标准差为0的样本数据都等于样本平均数的样本数据都等于样本平均数.标准差表现为:标准差越大,表明数据的离散程标准差表现为:标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离度就越大;反之,标准差越小,表明各数据的离散程度就越小。散程度就越小。它用来描述样本数据的离散程度。在实际应用中,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差常被理解为稳定性。标准差的作用标准差的作用:例题分析例题分析例例1 1 画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明他们的异同点说明他们的异同点. .(1) 5(1) 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5;(2) 4(2) 4,4 4,4 4,5 5,5 5,5 5,6 6,6 6,6 6;O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)(3) 3(3) 3,3 3,4 4,4 4,5 5,6 6,6 6,7 7,7 7;(4) 2(4) 2,2 2,2 2,2 2,5 5,8 8,8 8,8 8,8.8.频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)1.01.00.80.80.60.60.40.40.20.2(4 4)频率频率1 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O 对于城市居民月均用水量样本数据,其平均数对于城市居民月均用水量样本数据,其平均数 =1.973 =1.973 ,标准差,标准差s=0.868.s=0.868.在这在这100100个数据中,个数据中,落在区间(落在区间( -s -s, +s +s)=1.105=1.105,2.8412.841外的有外的有2828个;个;落在区间(落在区间( -2s -2s, +2s +2s)=0.237,3.709=0.237,3.709外的只有外的只有4 4个;个;落在区间(落在区间( -3s -3s, +3s +3s)=-0.631=-0.631,4.5774.577外的有外的有0 0个个. .一般地一般地, ,对于一个正态总体对于一个正态总体( , ),( , ),数据落在区间数据落在区间( )( )、( )( )、( )( )内内的百分比分别为的百分比分别为68.3%68.3%、95.4%95.4%、99.7%99.7%,这个原理,这个原理在产品质量控制中有着广泛的应用(参考教材在产品质量控制中有着广泛的应用(参考教材P79“P79“阅读与思考阅读与思考”). . 标准差还可用于对样本数据的另外一种解释标准差还可用于对样本数据的另外一种解释标准差还可用于对样本数据的另外一种解释标准差还可用于对样本数据的另外一种解释从数学的角度考虑,人们有时用标准差从数学的角度考虑,人们有时用标准差的平方的平方s s2 2_ _-方差来代替标准作为测量样本方差来代替标准作为测量样本数据分散程度数据分散程度的工具。的工具。步骤:求平均数;作差;平方;再求平均数步骤:求平均数;作差;平方;再求平均数如果数据如果数据 的平均数为的平均数为 ,方差为,方差为 ,那么那么练习:从甲乙两种玉米苗中各抽株,练习:从甲乙两种玉米苗中各抽株,分别测得它们的株高如下分别测得它们的株高如下(单位:(单位:cm)问问:(1)哪一种玉米长得高?哪一种玉米长得高?(2)哪种玉米的苗长得齐?哪种玉米的苗长得齐?小结小结1.1.用样本的数字特征估计总体的数字特征,是指用样本的用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据应的统计数据. .2.2.平均数对数据有平均数对数据有“取齐取齐”的作用,代表一组数据的平均的作用,代表一组数据的平均水平水平. .标准差描述一组数据围绕平均数波动的幅度标准差描述一组数据围绕平均数波动的幅度. .在实际在实际应用中,我们常综合样本的多个统计数据,对总体进行估应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策计,为解决问题作出决策. . 3. 3.对同一个总体,可以抽取不同的样本,相应的平对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变均数与标准差都会发生改变. .如果样本的代表性差,如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性由此可见抽样方法的重要性. .4. 4.在抽样过程中,抽取的样本是具有随机性的,如在抽样过程中,抽取的样本是具有随机性的,如从一个包含从一个包含6 6个个体的总体中抽取一个容量为个个体的总体中抽取一个容量为3 3的样的样本就有本就有2020中可能抽样,因此样本的数字特征也有随中可能抽样,因此样本的数字特征也有随机性机性. .用样本的数字特征估计总体的数字特征,是用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案一种统计思想,没有惟一答案. .练习:练习:(1)如果数据)如果数据 的平均数为的平均数为 ,方差为,方差为 ,中位数为,中位数为a,求数据,求数据3x1+5, 3x2+5, ,3xn+5的的平均数、标准差、方差、中位数。平均数、标准差、方差、中位数。(2)求数据)求数据2,1,0,-1,1的方差。的方差。(3)已知)已知40个数据中的前个数据中的前20个数据的平均数和方个数据的平均数和方差分别为差分别为60、20,后,后20个数据的平均数和方差分别个数据的平均数和方差分别为为80、40,求这,求这40个数据的平均数和方差。个数据的平均数和方差。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号