资源预览内容
第1页 / 共26页
第2页 / 共26页
第3页 / 共26页
第4页 / 共26页
第5页 / 共26页
第6页 / 共26页
第7页 / 共26页
第8页 / 共26页
第9页 / 共26页
第10页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
用样本估计总体用样本估计总体 复习上节课的内容复习上节课的内容 在上节课中,我们知道在在上节课中,我们知道在选取样本时应注意的问题,其选取样本时应注意的问题,其一是所选取的样本必须具有代一是所选取的样本必须具有代表性,其二是所选取的样本的表性,其二是所选取的样本的容量应该足够大,这样的样本容量应该足够大,这样的样本才能反映总体的特性,所选取才能反映总体的特性,所选取的样本才比较可靠的样本才比较可靠. . 随机抽样调查随机抽样调查是了解总是了解总体情况的一种重要的数学方法,体情况的一种重要的数学方法,抽样是它的一个关键,抽样是它的一个关键,上节课上节课介绍了介绍了简单的随机抽样简单的随机抽样方法,方法,即用抽签的方法来选取样本,即用抽签的方法来选取样本,这使每个个体都有这使每个个体都有相等的机会相等的机会被选入样本被选入样本判断下面这些抽样调查选取样本的方法是否判断下面这些抽样调查选取样本的方法是否合适,若不合适,请说明理由合适,若不合适,请说明理由(1)(1)为调查江苏省的环境污染情况,调查了长为调查江苏省的环境污染情况,调查了长江以南的南京市、常州市、苏州市、镇江市、江以南的南京市、常州市、苏州市、镇江市、无锡市的环境污染情况无锡市的环境污染情况(2)(2)从从100100名学生中,随机抽取名学生中,随机抽取2 2名学生,测量名学生,测量他们的身高来估算这他们的身高来估算这100100名学生的平均身高名学生的平均身高(3)(3)从一批灯泡中随机抽取从一批灯泡中随机抽取5050个进行试验,个进行试验,估算这批灯泡的使用寿命估算这批灯泡的使用寿命(4)(4)为了解观众对中央电视台第一套节目的收为了解观众对中央电视台第一套节目的收视率,对所有上英特网的家庭进行在线调查视率,对所有上英特网的家庭进行在线调查解解:(1)(1)不合适因为调查对象在总体中必须有代不合适因为调查对象在总体中必须有代表性,现在所调查的这些地方的环境污染表性,现在所调查的这些地方的环境污染情况仅仅代表了长江以南地区,并不能代情况仅仅代表了长江以南地区,并不能代表整个江苏省的环境污染情况表整个江苏省的环境污染情况(2)(2)不合适因为抽样调查时所抽取的样本要不合适因为抽样调查时所抽取的样本要足够大,现在只抽取了足够大,现在只抽取了2 2名学生的身高,不名学生的身高,不能用来估算能用来估算100100名学生的平均身高名学生的平均身高(3)(3)合适合适(4)(4)不合适虽然调查的家庭很多,但仅仅增不合适虽然调查的家庭很多,但仅仅增加调查的数量不一定能够提高调查质量,加调查的数量不一定能够提高调查质量,本题中所调查的仅代表上英特网的家庭,本题中所调查的仅代表上英特网的家庭,不能代表不上英特网的家庭,因此这样的不能代表不上英特网的家庭,因此这样的抽样调查不具有普遍代表性抽样调查不具有普遍代表性 让我们仍以上一节让我们仍以上一节300300名学生的考试成名学生的考试成绩为例,考察一下抽样调查的结果是绩为例,考察一下抽样调查的结果是否可靠。上一节中,老师选取的一个否可靠。上一节中,老师选取的一个样本是:样本是:随机数随机数(学号)学号)11125416794276成成绩8086669167它的频数分布直方图、平均它的频数分布直方图、平均成绩和标准差分别如下:成绩和标准差分别如下:另外,同学们也分别选取了一些样本,另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:它们同样也包含五个个体,如下表:随机数随机数(学号)(学号)1321322452455 598988989成绩成绩78787373767669697575同样,也可以作出这两个样本的频同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成数分布直方图、计算它们的平均成绩和标准差,如下图所示:绩和标准差,如下图所示: 随机数随机数(学号)(学号)901678627554成成绩7286838282样本平均成绩样本平均成绩为为80.880.8分,分,标准差为标准差为6.56.5分分样本平均成绩为样本平均成绩为74.274.2分,分,标准差为标准差为3.83.8分分从以上三张图比较来看,它们之间存在明显从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与的差异,平均数和标准差与总体的平均数与标准差也相去甚远,显然这样选择的样本不标准差也相去甚远,显然这样选择的样本不能反映总体的特性,是不可靠的。能反映总体的特性,是不可靠的。2 2、选择恰当的样本个体数目、选择恰当的样本个体数目样本平均成绩为样本平均成绩为75.775.7分,分,标准差为标准差为10.210.2分分样本平均成绩为样本平均成绩为77.177.1分,分,标准差为标准差为10.710.7分分 当样本中个体太少时,当样本中个体太少时,样本的平均数、标准差往往样本的平均数、标准差往往差距较大,如果选取适当的差距较大,如果选取适当的样本的个体数,各个样本的样本的个体数,各个样本的平均数、标准差与总体的标平均数、标准差与总体的标准差相当接近。准差相当接近。 北京在这北京在这3030天的空气污染指数及质量天的空气污染指数及质量级别,如下表所示:级别,如下表所示:2 2、体会用样本估计总体的合理性、体会用样本估计总体的合理性经比较可以经比较可以发现,虽然发现,虽然从样本获得从样本获得的数据与总的数据与总体的不完全体的不完全一致,但这一致,但这样的误差还样的误差还是可以接受是可以接受的,是一个的,是一个较好的估计。较好的估计。 随着样本容量(样本中包含的个体随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的经证明随机抽样方法是科学而可靠的. . 对于估计总体特性这类问题,数学上的对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一一般做法是给出具有一定可靠程度的一个估计值的范围个估计值的范围 . .3 3、加权平均数的求法、加权平均数的求法问题问题1 1:在计算:在计算2020个男同学平均身高时,个男同学平均身高时,小华先将所有数据按由小到大的顺序小华先将所有数据按由小到大的顺序排列,如下表所示:排列,如下表所示:然后然后, ,他这样计算这他这样计算这2020个学生的平均身高:个学生的平均身高:小华这样计算平均数可以吗?为什么?小华这样计算平均数可以吗?为什么?问题问题2 2:假设你们年级共有四个班级,假设你们年级共有四个班级,各班的男同学人数和平均身高如表所示各班的男同学人数和平均身高如表所示. .小强这样计算全年级男同学的平均身高:小强这样计算全年级男同学的平均身高:小强这样计算平均数可以吗?为什么?小强这样计算平均数可以吗?为什么?为了检查一批手榴弹的杀伤半径,抽为了检查一批手榴弹的杀伤半径,抽取了其中取了其中2020颗做试验,得到这颗做试验,得到这2020颗颗手榴弹的杀伤半径,并列表如下:手榴弹的杀伤半径,并列表如下:练习练习1:(1)(1)在这个问题中,总体、个体、在这个问题中,总体、个体、样本和样本容量各是什么?样本和样本容量各是什么?(2)(2)求出这求出这2020颗手榴弹的杀伤半颗手榴弹的杀伤半径的众数、中位数和平均数,径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤并估计这批手榴弹的平均杀伤半径半径解解:(1)(1)总体是要检查的这批手榴弹的杀伤半径总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的径;样本是所抽取的2020颗手榴弹的杀伤颗手榴弹的杀伤半径;样本容量是半径;样本容量是2020(2)(2)在在2020个数据中,个数据中,1010出现了出现了6 6次,次数最次,次数最多,所以众数是多,所以众数是1010(米)(米) 2020个数据从小到大排列,第个数据从小到大排列,第1010个和第个和第1111个个数据是最中间的两个数,分别为数据是最中间的两个数,分别为9 9(米)(米)和和1010(米),所以中位数是(米),所以中位数是9.5 9.5 (米)(米)样本平均数样本平均数9.49.4(米)(米)为估计一次性木质筷子的用量,为估计一次性木质筷子的用量,19991999年从某县共年从某县共600600家高、家高、中、低档饭店抽取中、低档饭店抽取1010家作样本,这些饭店每天消耗的一次家作样本,这些饭店每天消耗的一次性筷子盒数分别为:性筷子盒数分别为: 0.60.6、3.73.7、2.22.2、1.51.5、2.82.8、1.71.7、1.2 1.2 、2.12.1、3.23.2、1.01.0(1)(1)通过对样本的计算,估计该县通过对样本的计算,估计该县19991999年消耗了多少盒一次年消耗了多少盒一次性筷子(每年按性筷子(每年按350350个营业日计算);个营业日计算);(2)2001(2)2001年又对该县一次性木质筷子的用量以同样的方式作年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是了抽样调查,调查的结果是1010个样本饭店,每个饭店平均个样本饭店,每个饭店平均每天使用一次性筷子每天使用一次性筷子2.422.42盒求该县盒求该县20002000年、年、20012001年这两年这两年一次性木质筷子用量平均每年增长的百分率(年一次性木质筷子用量平均每年增长的百分率(20012001年该年该县饭店数、全年营业天数均与县饭店数、全年营业天数均与19991999年相同)年相同);(3)(3)在在(2)(2)的条件下,若生产一套学生桌椅需木材的条件下,若生产一套学生桌椅需木材0.07m0.07m3 3,求,求该县该县20012001年使用一次性筷子的木材可以生产多少套学生桌年使用一次性筷子的木材可以生产多少套学生桌椅椅计算中需用的有关数据为:每盒筷子计算中需用的有关数据为:每盒筷子100100双,每双筷子的质双,每双筷子的质量为量为5g5g,所用木材的密度为,所用木材的密度为0.5103kg/m0.5103kg/m3 3; ;(4)(4)假如让你统计你所在省一年使用一次性筷子所消耗的木假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来材量,如何利用统计知识去做,简要地用文字表述出来练习练习2:解解:(1)所以所以, ,该县该县19991999年消耗一次性筷子为年消耗一次性筷子为2600350=4200002600350=420000(盒)(盒)(2)(2)设平均每年增长的百分率为设平均每年增长的百分率为x x,则,则2 2(1+1+X X)2 2=2.42=2.42解得解得X X1 1=0.1=10%=0.1=10%,X X2 2= =2.12.1(不合题意,舍去)(不合题意,舍去)所以所以, ,平均每年增长的百分率为平均每年增长的百分率为10%10%(3)(3)可以生产学生桌椅套数为可以生产学生桌椅套数为(套)(套)(4)(4)先抽取若干个县(或市、州)作样本,再分别从这先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量一次性筷子的用量在一个班的在一个班的4040学生中,学生中,1414岁岁的有的有5 5人,人,1515岁的有岁的有3030人,人,1616岁的有岁的有4 4人,人,1717岁的有岁的有1 1人,人,求这个班级学生的平均年龄。求这个班级学生的平均年龄。练习练习3: 专家提醒,目前我国儿童青少年专家提醒,目前我国儿童青少年的健康存在着五个必须重视的问题:的健康存在着五个必须重视的问题:营养不良和肥胖、近视、龋齿、贫血营养不良和肥胖、近视、龋齿、贫血以及心理卫生你认为这是用普查还以及心理卫生你认为这是用普查还是抽样调查得到的结果?设计一份调是抽样调查得到的结果?设计一份调查卷和一个抽样调查方案,了解我们查卷和一个抽样调查方案,了解我们学校学生是否普遍存在这五个健康问学校学生是否普遍存在这五个健康问题,是否严重?题,是否严重?练习练习4:小结小结: : 一般来说,用样本估计总体时,一般来说,用样本估计总体时,样本容量越大,样本对总体的估计样本容量越大,样本对总体的估计也就越精确,相应地,搜集、整理、也就越精确,相应地,搜集、整理、计算数据的工作量也就越大,因此,计算数据的工作量也就越大,因此,在实际工作中,样本容量既要考虑在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的问题本身的需要,又要考虑实现的可能性和所付出的代价的大小。可能性和所付出的代价的大小。 随机抽样是经过数学随机抽样是经过数学证明了的可靠的方法,它证明了的可靠的方法,它对于估计总体特征是很有对于估计总体特征是很有帮助的。帮助的。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号