资源预览内容
第1页 / 共103页
第2页 / 共103页
第3页 / 共103页
第4页 / 共103页
第5页 / 共103页
第6页 / 共103页
第7页 / 共103页
第8页 / 共103页
第9页 / 共103页
第10页 / 共103页
亲,该文档总共103页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第九章第九章抽样与参数估计抽样与参数估计统计推断是统计学研究的重要内容。统计推断是统计学研究的重要内容。抽样是进行统计推断的基础性工作。抽样是进行统计推断的基础性工作。参数估计是统计推断的重要内容之一。参数估计是统计推断的重要内容之一。本章主要内容本章主要内容第一节第一节 抽样与抽样分布抽样与抽样分布第二节第二节 参数估计的一般问题参数估计的一般问题第三节第三节 一个总体的参数区间估计一个总体的参数区间估计第四节第四节 两个总体的参数区间估计两个总体的参数区间估计第五节第五节 样本容量的确定样本容量的确定第一节第一节 抽样与抽样分布抽样与抽样分布一、几个基本概念一、几个基本概念二、概率抽样方式二、概率抽样方式三、总体分布、样本分布、抽样分布三、总体分布、样本分布、抽样分布四、四、一个总体的抽样分布一个总体的抽样分布五、两个总体的抽样分布五、两个总体的抽样分布统计推断的过程统计推断的过程样样样样本本本本总体总体总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等统计推断统计推断是在对样本数据进行描述的基础上,对总是在对样本数据进行描述的基础上,对总体的未知数量特征作出以概率形式表述的推断体的未知数量特征作出以概率形式表述的推断。一、几个基本概念一、几个基本概念总体、个体、样本总体、个体、样本总体总体是所要研究的事物或现象的全体,也称全及总是所要研究的事物或现象的全体,也称全及总体、母体体、母体。个体个体是组成总体的各个基本单位或元素。是组成总体的各个基本单位或元素。样本样本是从总体中按一定抽样技术抽取的若干是从总体中按一定抽样技术抽取的若干个体组个体组成的集合体,也称抽样总体、子样。成的集合体,也称抽样总体、子样。总体容量和样本容量总体容量和样本容量总体容量总体容量是总体全部单位总数,用是总体全部单位总数,用N表示。表示。样本容量样本容量是一个样本所包含的单位数,通常用是一个样本所包含的单位数,通常用n表表示。根据容量大小样本有大样本和小样本之分,一示。根据容量大小样本有大样本和小样本之分,一般当般当n5,n(1-p)5,则二项分布可用正态则二项分布可用正态分布近似求解。因而有分布近似求解。因而有 样本比例分布为:样本比例分布为: 可用可用Z统计量构造总体统计量构造总体 比例比例的置信区间,即:的置信区间,即: 查标准正态分布表查标准正态分布表 可得置信区间:可得置信区间:总体比例总体比例未知,可用样本比例未知,可用样本比例p代替。在代替。在1置信水平下,总置信水平下,总体比例体比例的置信区间为:的置信区间为:总体比例的区间估计总体比例的区间估计(例题分析例题分析)例:例:一项广告活动的跟踪调查,在随机调查的一项广告活动的跟踪调查,在随机调查的400人中,人中,有有240人能记起广告语。试以人能记起广告语。试以95的置信水平估计能的置信水平估计能记起广告语的人所占比例的置信区间。记起广告语的人所占比例的置信区间。解:解:已知已知 n=400 , p=240/400=0.6,np=2405, n(1-p)=1605,1-=0.95,查表得,查表得Z=1.96, 则则 即以即以95的概率保证,估计能记起广告语的人数所占的概率保证,估计能记起广告语的人数所占比例在比例在55.2%64.8%之间。之间。总体比例的区间估计总体比例的区间估计(例题分析例题分析)【例例例例】某某某某城城城城市市市市要要要要估估估估计计计计下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性所所所所占占占占的的的的比比比比例例例例,随随随随机机机机抽抽抽抽 取取取取 了了了了 100100个个个个下下下下岗岗岗岗职职职职工工工工,其其其其中中中中6565人人人人为为为为女女女女性性性性职职职职 工工工工 。 试试试试 以以以以95%95%的的的的置置置置信信信信水水水水平平平平估估估估计计计计该该该该城城城城市市市市下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的的的的置置置置信信信信区间。区间。区间。区间。解:解:解:解:已知已知已知已知 n n=100=100,p p65%65%, , 1 1- - = 0.95= 0.95时,查表得时,查表得时,查表得时,查表得z z /2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置信区间为置信区间为55.65%74.35% 课堂练习三:课堂练习三:某电池厂生产的某种型号电池,其使用寿命的质量某电池厂生产的某种型号电池,其使用寿命的质量标准为标准为25小时。为提高产品竞争能力,该厂家对生小时。为提高产品竞争能力,该厂家对生产线进行了改造,现随机抽取产线进行了改造,现随机抽取100只电池进行测试,只电池进行测试,得其使用寿命为:得其使用寿命为:23小时以下小时以下 1只只2324小时小时 4只只2425小时小时10只只2526小时小时79只只26小时以上小时以上 6只只 要求以要求以95%的置信水平建立该种电池合格率的置信的置信水平建立该种电池合格率的置信区间。区间。课堂练习三参考答案:课堂练习三参考答案:解:解:已知已知 n=100,1- = 95%, 查表得查表得z /2=1.96 由资料可知使用寿命在由资料可知使用寿命在25小时以上的电池共小时以上的电池共85只,只,因此:因此:p=85/100=85% 则总体比例则总体比例 在在1- 置信水平下置信水平下的置信区间为的置信区间为在在95%95%的置信水平下,该种电池合格率的置信区的置信水平下,该种电池合格率的置信区间为:间为:82.50%82.50%87.50%87.50%。课堂练习四:课堂练习四:某彩电生产厂对某地区居民家庭购买其产某彩电生产厂对某地区居民家庭购买其产品的情况进行调查,调查户数为品的情况进行调查,调查户数为400户,户,其中有其中有40户购买了该厂生产的彩电。要求户购买了该厂生产的彩电。要求以以95.45的置信水平估计该地区居民家的置信水平估计该地区居民家庭购买该厂产品的比例的置信区间。庭购买该厂产品的比例的置信区间。区间估计应注意:区间估计应注意:在进行区间估计时,必须同时考虑置信概在进行区间估计时,必须同时考虑置信概率和置信区间两个方面,二者都与概率度率和置信区间两个方面,二者都与概率度(z或或t)有关。在样本容量一定的情况下,)有关。在样本容量一定的情况下,置信概率定得越大,估计的可靠程度就越置信概率定得越大,估计的可靠程度就越大,概率度(大,概率度(z或或t)就越大,则置信区间)就越大,则置信区间相应也越大,估计的准确性就越小。因此相应也越大,估计的准确性就越小。因此对于可靠性和准确性,要结合具体问题、对于可靠性和准确性,要结合具体问题、具体要求来综合考虑。具体要求来综合考虑。第四节第四节 两个总体的参数区间估计两个总体的参数区间估计一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计三、两个总体方差比的区间估计(略)三、两个总体方差比的区间估计(略)一、两个总体均值之差的估计一、两个总体均值之差的估计大样本大样本1.假定条件假定条件两个两个总体都服从正态分布,总体都服从正态分布, 1、 2已知已知若若不不是是正正态态分分布布, 可可以以用用正正态态分分布布来来近近似似(n1 30和和n2 30)两个样本是独立的简单随机样本两个样本是独立的简单随机样本2.建立置信区间建立置信区间使用正态分布统计量使用正态分布统计量Z两个总体均值之差的估计两个总体均值之差的估计 (大样本大样本)3. 1、 2已已知知时时,两两个个总总体体均均值值之之差差 1- 2在在1- 置置信水平下的置信区间为信水平下的置信区间为4.4. 1 1、 2 2未知未知时,时,两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】某某地地区区教教育育委委员员会会想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为此此在在两两所所中中学学独独立立地地抽抽取取两两个个随随机机样样本本,有有关关数数据据如如下下表表 。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%的的置信区间置信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.2两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解解解: : 两个总体均值之差在两个总体均值之差在两个总体均值之差在两个总体均值之差在1-1- 置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分分分10.9710.97分分分分两个总体均值之差的估计两个总体均值之差的估计小样本小样本: 1 12 2= = 2 22 2 1.假定条件假定条件两个两个总体都服从正态分布总体都服从正态分布两个总体方差未知但相等:两个总体方差未知但相等: 1= 2两个独立的小样本两个独立的小样本(n130和和n230)2.总体方差的合并估计量总体方差的合并估计量3.3.估计量估计量 x x1 1- -x x2 2的抽样标准差的抽样标准差两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 12 2= = 2 22 2 )4.建立两个样本均值之差的置信区间用建立两个样本均值之差的置信区间用t统计量统计量5.5.两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下置信水平下的置信区间为的置信区间为两个总体均值之差的估计两个总体均值之差的估计小样本小样本: 1 12 2 2 22 2 1.假定条件假定条件两个两个总体都服从正态分布总体都服从正态分布两个总体方差未知且不相等:两个总体方差未知且不相等: 12两个独立的小样本两个独立的小样本(n130和和n230)2.建立置信区间建立置信区间使用统计量使用统计量t两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 12 2 2 22)2)3.两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信水平下的置信区间为置信区间为两个总体均值之差的估计两个总体均值之差的估计匹配大样本匹配大样本1.假定条件假定条件两个匹配的大样本两个匹配的大样本(n1 30和和n2 30)2.两个总体均值之差两个总体均值之差 d= 1- 2在在1- 置信水置信水平下的置信区间为平下的置信区间为对应差值的均值对应差值的均值对应差值的标准差对应差值的标准差两个总体均值之差的估计两个总体均值之差的估计匹配小样本匹配小样本1.假定条件假定条件两个匹配的小样本两个匹配的小样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 2.两个总体均值之差两个总体均值之差 d= 1- 2在在1- 置信水平置信水平下的置信区间为下的置信区间为1.假定条件假定条件两个两个总体服从二项分布总体服从二项分布可以用正态分布来近似可以用正态分布来近似两个样本是独立的两个样本是独立的2.两个总体比例之差两个总体比例之差 1- 2在在1- 置信水平下置信水平下的置信区间为的置信区间为二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)【例例】在在某某个个电电视视节节目目的的收收视视率率调调查查中中,农农村村随随机机调调查查了了400人人,有有32%的的人人收收看看了了该该节节目目;城城市市随随机机调调查查了了500人人,有有45%的的人人收收看看了了该该节节目目。试试以以90%的的置置信信水水平平估估计计城城市市与与农农村村收收视视率差别的置信区间。率差别的置信区间。 1 12 2两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)解解解解: : 已知已知已知已知 n n1 1=500 =500 ,n n2 2=400=400, p p1 1=45%=45%, p p2 2=32%=32%, 1- 1- =95%=95%, z z /2/2=1.96=1.96 1 1 1 1- - - - 2 2置信度为置信度为置信度为置信度为95%95%的置信区间为的置信区间为的置信区间为的置信区间为城城城城 市市市市 与与与与 农农农农 村村村村 收收收收 视视视视 率率率率 差差差差 值值值值 的的的的 置置置置 信信信信 区区区区 间间间间 为为为为6.68%19.32%6.68%19.32%第五节第五节 样本容量的确样本容量的确定定前面讨论中都假定样本容量前面讨论中都假定样本容量n已知,但在实践中需已知,但在实践中需要自己设计调查方案,确定样本容量。样本容量要自己设计调查方案,确定样本容量。样本容量n越大,抽样误差越小,但越大,抽样误差越小,但n越大,所需人、财、物越大,所需人、财、物及时间也越多;及时间也越多;n太小,估计误差会很大。因此确太小,估计误差会很大。因此确定样本容量的大小要从允许误差范围、概率保证程定样本容量的大小要从允许误差范围、概率保证程度及经费、时间等多方面统筹考虑。度及经费、时间等多方面统筹考虑。一、估计总体均值时样本容量的确定一、估计总体均值时样本容量的确定二、估计总体比例时样本容量的确定二、估计总体比例时样本容量的确定一、估计总体均值时样本容量的确定一、估计总体均值时样本容量的确定 重复抽样下估计总体均值时样本容量:重复抽样下估计总体均值时样本容量:可以看出样本容量可以看出样本容量n与总体方差与总体方差 2、允许误、允许误差差 、概率度、概率度Z或或t之间的关系为之间的关系为样本容量样本容量n 与总体方差与总体方差 2成正比成正比样本容量样本容量n与与允许误差允许误差 成反比成反比样本容量样本容量n与概率度与概率度Z或或t成正比成正比估计总体均值时样本容量的确定估计总体均值时样本容量的确定(例题分析例题分析) 例例:一家广告公司想估计某类商店去年平均:一家广告公司想估计某类商店去年平均每店广告费支出额。经验表明,总体方差为每店广告费支出额。经验表明,总体方差为1800000。若置信水平取。若置信水平取95,允许误差为,允许误差为500元,问应抽取多少家商店作样本?元,问应抽取多少家商店作样本? 解:已知解:已知21800000,0.05, 查表得查表得z /2 1.96,500, 则则 应抽选应抽选28家商店作样本。家商店作样本。 n应取整数。应取整数。估计总体均值时样本容量的确定估计总体均值时样本容量的确定 (例题分析例题分析)【例例】拥拥有有工工商商管管理理学学士士学学位位的的大大学学毕毕业业生生年年薪薪的的标标准准差差大大约约为为2000元元,假假定定想想要要估估计计平平均均年年薪薪95%的的置置信信区区间间,希希望望允允许许误误差差为为400元,应抽取多大的样本容量?元,应抽取多大的样本容量?估计总体均值时样本容量的确定估计总体均值时样本容量的确定 (例题分析例题分析)解解: 已知已知 =2000,=400, 1- =95%, z /2=1.96 则则即应抽取即应抽取97人作为样本人作为样本 二、估计总体比例时样本容量的确定二、估计总体比例时样本容量的确定 重复抽样下估计总体比例时样本容量:重复抽样下估计总体比例时样本容量:p的取值一般小于的取值一般小于0.1。 未知时,可取最大值未知时,可取最大值0.5。因为因为对于服从二项分布对于服从二项分布的随机变量,当的随机变量,当 =0.5时,方差达到最大值。用时,方差达到最大值。用0.5计计算得出的样本容量可以保证有足够高的置信水平和算得出的样本容量可以保证有足够高的置信水平和尽可能小的置信区间。尽可能小的置信区间。估计总体比例时样本容量的确定估计总体比例时样本容量的确定 (例题分析例题分析)例例:某市场调研公司想估计某地区有家用计算:某市场调研公司想估计某地区有家用计算机的家庭所占比例。希望允许误差不超过机的家庭所占比例。希望允许误差不超过0.05,可靠程度为,可靠程度为95,问应取多大容量的样本?,问应取多大容量的样本?没有可利用的比例没有可利用的比例 。解解:已知:已知:p0.05 , =0.05 , z /2 =1.96 , 用用 =0.5计算计算 ,则则 应抽取应抽取385户家庭进行调查。户家庭进行调查。估计总体比例时样本容量的确定估计总体比例时样本容量的确定 (例题分析例题分析)【例例】根根据据以以往往的的生生产产统统计计,某某种种产产品品的的合合格格率率约约为为90%,现现要要求求允允许许误误 差差 为为 5%,在在求求95%的的置置信信区区间间时时,应应抽抽取取多多少少个个产产品作为样本?品作为样本? 解解:已已知知p=90%, =0.05, Z /2=1.96, p=5%应抽取的样本容量应抽取的样本容量为为 应抽取应抽取139个产品作为样本个产品作为样本内容内容 置信区间置信区间 总体均值总体均值的区间估计的区间估计已知已知 未知未知(正态总体正态总体小样本小样本) 总体比例总体比例的区间估计的区间估计(大样本大样本)内容内容 置信区间置信区间两个总两个总体均值体均值之差的之差的 估计估计已知未知两个总体比例之差两个总体比例之差 的估计的估计本章学习要求本章学习要求了解抽样推断的了解抽样推断的几个基本概念;几个基本概念;理解理解参数估计基本方法:点估计和区参数估计基本方法:点估计和区间估计;间估计;理解和掌握简单随机抽样下总体均值理解和掌握简单随机抽样下总体均值和总体比例的区间估计方法以及必要和总体比例的区间估计方法以及必要样本单位数的确定方法。样本单位数的确定方法。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号