资源预览内容
第1页 / 共238页
第2页 / 共238页
第3页 / 共238页
第4页 / 共238页
第5页 / 共238页
第6页 / 共238页
第7页 / 共238页
第8页 / 共238页
第9页 / 共238页
第10页 / 共238页
亲,该文档总共238页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1 - 1统计学统计学STATISTICS(第三版第三版)参数估计和假设检验Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望1 - 2统计学统计学STATISTICS(第三版第三版)第第 4 章章 参数估计和假设检验参数估计和假设检验4.1 抽样调查的基本概念抽样调查的基本概念 4.2 抽样估计的基本原理抽样估计的基本原理4.3 参数估计参数估计4.4 样本容量的确定样本容量的确定4.5 假设检验假设检验2008年8月1 - 3统计学统计学STATISTICS(第三版第三版)4.1 抽样估计的基本概念抽样估计的基本概念一一.总体分布总体分布二二.样本分布样本分布三三.抽样分布抽样分布2008年8月1 - 4统计学统计学STATISTICS(第三版第三版)1.总体中各元素的观察值所形成的分布 2.分布通常是未知的3.可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体2008年8月1 - 5统计学统计学STATISTICS(第三版第三版)总体分布(Population Distribution)是指由客观存在的,构成总体的个体所形成的频数分布,及其相关参数数值。例如,当研究某一企业职工收入情况时,该企业全体职工的收入状况的频数分布,以及反映该企业全体职工收入状况的均值、方差、偏态系数和峰度系数,从不同角度综合描述了这一总体的分布特征。 我们往往是通过对构成总体的部分个体进行观察,即通过样本数据计算的统计量,例如样本均值、样本方差、样本偏态系数和样本峰度系数,以及样本的频数分布来推断总体参数,用样本分布来估计总体分布。2008年8月1 - 6统计学统计学STATISTICS(第三版第三版)1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布样本分布(sample distribution)样样本本2008年8月1 - 7统计学统计学STATISTICS(第三版第三版)样本分布(Sample Distribution)是指由构成样本的个体所形成样本的频数分布,以及计算出来的相关统计量频数分布,以及计算出来的相关统计量。 样本中的个体都是来自于总体,具有总体的相关信息和基本特征,样本分布是总体分布的一个映象,一个缩影。当样本容量样本容量充分大时,样本分布趋近于总体分布。 样本分布是指某一个具体的样本中的个体数量特征样本分布是指某一个具体的样本中的个体数量特征。由于样本是随机抽取的,每一次抽取的样本中的个体不尽相同,每一个具体的样本分布也会与对应的总体分布存在或大或小的偏误,根据样本计算的统计量是随机变量。 (随机抽取的)样本的分布与客观的总体分布之间的误差,需要借助抽样分布概念。2008年8月1 - 8统计学统计学STATISTICS(第三版第三版)1.样本统计量的概率分布样本统计量的概率分布2.是一种理论概率分布是一种理论概率分布3.随机变量是随机变量是 样本统计量样本统计量样本统计量样本统计量n n样本均值样本均值, , 样本比例,样本方差等样本比例,样本方差等4.结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本5.提供了样本统计量长远我们稳定的信息,是进提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重行推断的理论基础,也是抽样推断科学性的重要依据要依据 抽样分布抽样分布 (sampling distribution)2008年8月1 - 9统计学统计学STATISTICS(第三版第三版)抽样分布(Sampling Distribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量样本统计量的概率分布概率分布。所以,抽样分布是样本分布的概率分抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。布,抽样分布是抽样理论的研究对象。 抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。2008年8月1 - 10统计学统计学STATISTICS(第三版第三版)抽样分布抽样分布 (sampling distribution)总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方差差差样样本本2008年8月1 - 11统计学统计学STATISTICS(第三版第三版)样本容量与样本个数样本容量与样本个数 (1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。(2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。2008年8月1 - 12统计学统计学STATISTICS(第三版第三版)总体参数与样本统计量总体参数与样本统计量(1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总体参数有:总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。(2)样本统计量:与总体参数对应的是样本统计量。2008年8月1 - 13统计学统计学STATISTICS(第三版第三版)重复抽样与不重复抽样重复抽样与不重复抽样 (1)重复抽样:是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一次样本单位的抽取。(2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下一次抽样。2008年8月1 - 14统计学统计学STATISTICS(第三版第三版)4.2 抽抽样估估计原理原理 一、样本统计量的抽样分布 ( (一个总体参数推断一个总体参数推断时时) )(一)样本均值的抽样分布(一)样本均值的抽样分布(二)样本比例的抽样分布(二)样本比例的抽样分布(三)抽样方差的抽样分布(三)抽样方差的抽样分布2008年8月1 - 15统计学统计学STATISTICS(第三版第三版)样本均值的抽样分布样本均值的抽样分布2008年8月1 - 16统计学统计学STATISTICS(第三版第三版)1.容量相同的所有可能样本的样本均值的概率分布2.一种理论概率分布3.进行推断总体总体均值的理论基础样本均值的抽样分布样本均值的抽样分布2008年8月1 - 17统计学统计学STATISTICS(第三版第三版)样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素( (个个体体) ) ,即即总总体体单单位位数数N N= =4 4。4 4 个个个个体体分分别别为为x x1 1=1=1、x x2 2=2=2、x x3 3=3=3 、x x4 4=4=4 。总总体的均值、方差及分布如下体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1. .2 2.3.3均值和方差均值和方差均值和方差均值和方差2008年8月1 - 18统计学统计学STATISTICS(第三版第三版)样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析) 现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的所有可能的所有可能的n n = 2 = 2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)2008年8月1 - 19统计学统计学STATISTICS(第三版第三版)样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析) 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P ( (X X ) )1.51.53.03.04.04.03.53.52.02.02.52.52008年8月1 - 20统计学统计学STATISTICS(第三版第三版)样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析例题分析) = 2.5 2 =1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P ( ( X X ) )1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X2008年8月1 - 21统计学统计学STATISTICS(第三版第三版)样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 = 50= 50= 50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n = 4 = 4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n =16 =16当当总总体体服服从从正正态态分分布布N N( , , 2 2) )时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 X X也也服服从从正正态态分分布布, X X 的的数学期望为数学期望为 ,方差为,方差为 2 2/ /n n。即。即 X XN N( ( , , 2 2/ /n n) )2008年8月1 - 22统计学统计学STATISTICS(第三版第三版)中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时( (n n 30) 30) ,样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设从从均均值值为为 ,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样分布近似服从均值为样分布近似服从均值为 、方差为、方差为 2 2/ /n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体X X2008年8月1 - 23统计学统计学STATISTICS(第三版第三版)中心极限定理中心极限定理 (central limit theorem)的分的分的分的分布趋布趋布趋布趋于正于正于正于正态分态分态分态分布的布的布的布的过程过程过程过程2008年8月1 - 24统计学统计学STATISTICS(第三版第三版)抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布2008年8月1 - 25统计学统计学STATISTICS(第三版第三版)1.样本均值的数学期望2.样本均值的方差n重复抽样重复抽样n不重复抽样不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)2008年8月1 - 26统计学统计学STATISTICS(第三版第三版)样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)比较及结论:比较及结论:比较及结论:比较及结论:1. 1. 样本均值的均值样本均值的均值( (数学期望数学期望) ) 等于总体均值等于总体均值 2. 2. 样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n2008年8月1 - 27统计学统计学STATISTICS(第三版第三版)均值的抽样标准误均值的抽样标准误1.所有可能的样本均值的标准差,测度所有样本均值的离散程度2.小于总体标准差3.计算公式为2008年8月1 - 28统计学统计学STATISTICS(第三版第三版)样本比例的抽样分布样本比例的抽样分布2008年8月1 - 29统计学统计学STATISTICS(第三版第三版)1.总体总体( (或样本或样本) )中具有某种属性的单位与全部单中具有某种属性的单位与全部单位总数之比位总数之比n n不同性别的人与全部人数之比不同性别的人与全部人数之比n n合格品合格品( (或不合格品或不合格品) ) 与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为4. 比例比例(proportion)2008年8月1 - 30统计学统计学STATISTICS(第三版第三版)1.容量相同的所有可能样本的样本比例的概率分布2.当样本容量很大时,样本比例的抽样分布可用正态分布近似 3.一种理论概率分布4.推断总体总体比例的理论基础样本比例的抽样分布样本比例的抽样分布2008年8月1 - 31统计学统计学STATISTICS(第三版第三版)1.样本比例的数学期望2.样本比例的方差n重复抽样重复抽样n不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)2008年8月1 - 32统计学统计学STATISTICS(第三版第三版)样本方差的抽样分布样本方差的抽样分布2008年8月1 - 33统计学统计学STATISTICS(第三版第三版)样本方差的分布样本方差的分布对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为 (n-1) 2分布,即2008年8月1 - 34统计学统计学STATISTICS(第三版第三版)1.1.由由阿阿贝贝( (AbbeAbbe) ) 于于18631863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特 ( (HermertHermert) )和和 卡卡 皮皮 尔尔 逊逊 ( (KPearsonKPearson) ) 分分 别别 于于18751875年和年和19001900年推导出来年推导出来2.2.设设 ,则,则3.3.令令 ,则,则 Y Y 服从自由度为服从自由度为1 1的的 2 2分布,即分布,即4.4. 5.5.当总体当总体 ,从中抽取容量为,从中抽取容量为n n的样本,则的样本,则 2分布分布( 2 distribution)2008年8月1 - 35统计学统计学STATISTICS(第三版第三版)1.分布的变量值始终为正分布的变量值始终为正 2.分分布布的的形形状状取取决决于于其其自自由由度度n n的的大大小小,通通常常为为不不对对称称的的正正偏偏分分布布,但但随随着着自自由由度度的的增增大大逐逐渐渐趋趋于对称于对称 3.期期望望为为:E(E( 2 2)=)=n n,方方差差为为:D(D( 2 2)=2)=2n n( (n n为为自自由度由度) ) 4.可可加加性性:若若U U和和V V为为两两个个独独立立的的 2 2分分布布随随机机变变量量,U U 2 2(n(n1 1) ), V V 2 2( (n n2 2), ),则则U U+ +V V这这一一随随机机变变量量服服从自由度为从自由度为n n1 1+ +n n2 2的的 2 2分布分布 2分布分布(性质和特点性质和特点)2008年8月1 - 36统计学统计学STATISTICS(第三版第三版) 2)分布分布(图示图示) 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2 = (n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 n n=1=1n n=4=4n n=10=10n n=20=20 总体总体2008年8月1 - 37统计学统计学STATISTICS(第三版第三版)二、二、 样本统计量的抽样分布样本统计量的抽样分布 (两个总体参数推断时两个总体参数推断时)(一)两个样本均值之差的抽样分布(一)两个样本均值之差的抽样分布(二)两个样本比例之差的抽样分布(二)两个样本比例之差的抽样分布(三)两个样本方差比的抽样分布(三)两个样本方差比的抽样分布2008年8月1 - 38统计学统计学STATISTICS(第三版第三版)两个样本均值之差的抽样分布两个样本均值之差的抽样分布2008年8月1 - 39统计学统计学STATISTICS(第三版第三版)1.两个总体都为正态分布,即两个总体都为正态分布,即 , 2.两两个个样样本本均均值值之之差差 的的抽抽样样分分布布服服从从正正态态分布,其分布的数学期望为两个总体均值之差分布,其分布的数学期望为两个总体均值之差3. 方差为各自的方差之和方差为各自的方差之和 两个样本均值之差的抽样分布两个样本均值之差的抽样分布2008年8月1 - 40统计学统计学STATISTICS(第三版第三版)两个样本均值之差的抽样分布两个样本均值之差的抽样分布 1 1 1 1总体总体1 2 2 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-1-1- 抽样分布抽样分布抽样分布抽样分布2008年8月1 - 41统计学统计学STATISTICS(第三版第三版)两个样本比例之差的抽样分布两个样本比例之差的抽样分布2008年8月1 - 42统计学统计学STATISTICS(第三版第三版)1.1.两个总体都服从二项分布两个总体都服从二项分布2.2.分分别别从从两两个个总总体体中中抽抽取取容容量量为为n n1 1和和n n2 2的的独独立立样样本本,当当两两个个样样本本都都为为大大样样本本时时,两两个个样样本本比比例例之之差差的的抽抽样分布可用正态分布来近似样分布可用正态分布来近似3.3.分布的数学期望为分布的数学期望为4.4.方差为各自的方差之和方差为各自的方差之和 两个样本比例之差的抽样分布两个样本比例之差的抽样分布2008年8月1 - 43统计学统计学STATISTICS(第三版第三版)两个样本方差比的抽样分布两个样本方差比的抽样分布2008年8月1 - 44统计学统计学STATISTICS(第三版第三版)两个样本方差比的抽样分布两个样本方差比的抽样分布1. 两两个个总总体体都都为为正正态态分分布布,即即X X1 1 N N( ( 1 1, , 1 12 2) )的的一一个个样样本本, Y Y1 1,Y Y2 2, ,Y Yn2n2是是来来自自正正态态总总体体X X2 2 N N( ( 2 2, , 2 22 2 ) )2.从两从两个总体中分别抽取容量为个总体中分别抽取容量为n n1 1和和n n2 2的独立样本的独立样本3.两两个个样样本本方方差差比比的的抽抽样样分分布布,服服从从分分子子自自由由度度为为( (n n1 1-1)-1),分母自由度为,分母自由度为( (n n2 2-1) -1) F F分布,即分布,即 2008年8月1 - 45统计学统计学STATISTICS(第三版第三版)1.1.由由统统计计学学家家费费舍舍( (R.A.FisherR.A.Fisher) ) 提提出出的的,以以其其姓姓氏氏的的第一个字母来命名则第一个字母来命名则2.2.设设若若U U为为服服从从自自由由度度为为n n1 1的的 2 2分分布布,即即U U 2 2(n(n1 1) ),V V为为服服从从自自由由度度为为n n2 2的的 2 2分分布布,即即V V 2 2( (n n2 2), ),且且U U和和V V相互独立,则相互独立,则 称称F F为服从自由度为服从自由度n n1 1和和n n2 2的的F F分布,记为分布,记为F分布分布(F distribution)2008年8月1 - 46统计学统计学STATISTICS(第三版第三版)F分布分布(图示图示) 不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)2008年8月1 - 47统计学统计学STATISTICS(第三版第三版)4.3 参数估计参数估计一、一、 参数估计的一般问题参数估计的一般问题 二、二、 一个总体参数的区间估计一个总体参数的区间估计三、三、两个总体参数的区间估计两个总体参数的区间估计2008年8月1 - 48统计学统计学STATISTICS(第三版第三版)参数估计在统计方法中的地位参数估计在统计方法中的地位2008年8月1 - 49统计学统计学STATISTICS(第三版第三版)统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方差差差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等2008年8月1 - 50统计学统计学STATISTICS(第三版第三版)一、一、 参数估计的一般问题参数估计的一般问题(一)估计量与估计值(一)估计量与估计值(二)点估计与区间估计(二)点估计与区间估计(三)评价估计量的标准(三)评价估计量的标准2008年8月1 - 51统计学统计学STATISTICS(第三版第三版)估计量与估计值估计量与估计值2008年8月1 - 52统计学统计学STATISTICS(第三版第三版)1.估计量:用于估计总体参数的随机变量n如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等n例如例如: : 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值n如果样本均值如果样本均值 x x =80=80,则,则8080就是就是 的估计值的估计值估计量与估计值估计量与估计值 (estimator & estimated value)2008年8月1 - 53统计学统计学STATISTICS(第三版第三版)点估计与区间估计点估计与区间估计2008年8月1 - 54统计学统计学STATISTICS(第三版第三版)参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计2008年8月1 - 55统计学统计学STATISTICS(第三版第三版)点估计点估计 (point estimate)1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例例如如:用用两两个个样样本本均均值值之之差差直直接接作作为为总总体体均均值之差的估计值之差的估计2. 没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等2008年8月1 - 56统计学统计学STATISTICS(第三版第三版)区间估计区间估计 (interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范范围,该区间由样本统计量加减抽样误差而得到的围,该区间由样本统计量加减抽样误差而得到的2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总总体体参数的接近程度给出一个概率度量参数的接近程度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95% 样本统计量样本统计量样本统计量样本统计量 ( (点估计点估计点估计点估计) )置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限2008年8月1 - 57统计学统计学STATISTICS(第三版第三版)区间估计的图示区间估计的图示 X95% 95% 的样本的样本的样本的样本 -1.96 -1.96 x x +1.96+1.96 x x99% 99% 的样本的样本的样本的样本 - 2.58- 2.58 x x + 2.58+ 2.58x x90%90%的样本的样本的样本的样本 -1.65 -1.65 x x +1.65+1.65 x x2008年8月1 - 58统计学统计学STATISTICS(第三版第三版)1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为 (1 - n 为是总体参数为是总体参数未在未在区间内的比例区间内的比例 3.常用的置信水平值有 99%, 95%, 90%n相应的相应的相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平 2008年8月1 - 59统计学统计学STATISTICS(第三版第三版)1.由样本统计量所构造的总体参数的估计区间称由样本统计量所构造的总体参数的估计区间称为置信区间为置信区间2.统计学家在某种程度上确信这个区间会包含真统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值否包含总体参数的真值n n我们只能是希望这个区间是大量包含总体参数真我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个含参数真值的区间中的一个置信区间置信区间 (confidence interval)2008年8月1 - 60统计学统计学STATISTICS(第三版第三版)置信区间与置信水平置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1 - (1 - ) % ) % 区间包含了区间包含了区间包含了区间包含了 % % 的区间未包含的区间未包含的区间未包含的区间未包含 1 - 1 - / /2 2 / /2 22008年8月1 - 61统计学统计学STATISTICS(第三版第三版)影响区间宽度的因素影响区间宽度的因素1. 总体数据的离散程度,用来测度2.样本容量,3.3.置信水平 (1 - ),影响 z 的大小2008年8月1 - 62统计学统计学STATISTICS(第三版第三版)评价估计量的标准评价估计量的标准2008年8月1 - 63统计学统计学STATISTICS(第三版第三版)无偏性无偏性(unbiasedness)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 P P( ( ) )B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏2008年8月1 - 64统计学统计学STATISTICS(第三版第三版)有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P( ( ) )2008年8月1 - 65统计学统计学STATISTICS(第三版第三版)一致性一致性(consistency)一致性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P( ( ) )2008年8月1 - 66统计学统计学STATISTICS(第三版第三版)二、二、 一个总体参数的区间估计一个总体参数的区间估计(一)总体均值的区间估计(一)总体均值的区间估计(二)总体比例的区间估计(二)总体比例的区间估计(三)总体方差的区间估计(三)总体方差的区间估计2008年8月1 - 67统计学统计学STATISTICS(第三版第三版)一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数总体参数总体参数符号表示符号表示符号表示符号表示样本统计量样本统计量样本统计量样本统计量均均值值比例比例方差方差2008年8月1 - 68统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计 (正态总体、正态总体、 已知,或非正态总体、大样本已知,或非正态总体、大样本)2008年8月1 - 69统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(大样本大样本)1.1.假定条件假定条件n n总体服从正态分布总体服从正态分布, ,且方差且方差( ( ) ) 已知已知n n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 ( (n n 30) 30)2.使用正态分布统计量使用正态分布统计量3.总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为2008年8月1 - 70统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产量量质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为1010克克。试试估估计计该该批批产产品品平平均均重重量量的的置信区间,置信水平为置信区间,置信水平为95%95%2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.32008年8月1 - 71统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解解解:已已知知 N N( ( ,10102 2) ),n n=25, =25, 1-1- = = 95%95%,z z /2/2=1.96=1.96。根据样本数据计算得:根据样本数据计算得: 总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44101.44克克109.28109.28克之克之2008年8月1 - 72统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】一一家家保保险险公公司司收收集集到到由由3636投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄( (周周岁岁) )数数据据如如下下表表。试建立投保人年龄试建立投保人年龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 2335392736443642464331334253455447243428393644403949383448503439454845322008年8月1 - 73统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解解解:已已知知n n=36, =36, 1-1- = = 90%90%,z z /2/2=1.645=1.645。根根据据样样本本数数据计算得:据计算得: , 总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁2008年8月1 - 74统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计 (正态总体、正态总体、 未知、小样本未知、小样本)2008年8月1 - 75统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计 (小样本小样本)1. 假定条件n总体服从正态分布总体服从正态分布, ,且方差且方差( ( ) ) 未知未知n小样本小样本 ( (n n 30) 30)2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为2008年8月1 - 76统计学统计学STATISTICS(第三版第三版)t 分布分布 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散散。一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也逐逐渐渐趋趋于正态分布于正态分布 X X Xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t ( (dfdf = 13) = 13)t t ( (dfdf = 5) = 5)Z Z2008年8月1 - 77统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命( (小小时时) )如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间1616灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据 15101520148015001450148015101520148014901530151014601460147014702008年8月1 - 78统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解解解 : 已已 知知 N N( ( , 2 2) ), n n=16, =16, 1-1- = = 95%95%,t t /2/2=2.131=2.131。根据样本数据计算得:。根据样本数据计算得: , 总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时2008年8月1 - 79统计学统计学STATISTICS(第三版第三版)总体比例的区间估计总体比例的区间估计2008年8月1 - 80统计学统计学STATISTICS(第三版第三版)总体比例的区间估计总体比例的区间估计1.1.假定条件假定条件n n总体服从二项分布总体服从二项分布n n可以由正态分布来近似可以由正态分布来近似2.2.使用正态分布统计量使用正态分布统计量3. 3. 3. 总体比例总体比例总体比例 在在在1-1-1- 置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为2008年8月1 - 81统计学统计学STATISTICS(第三版第三版)总体比例的区间估计总体比例的区间估计(例题分析例题分析)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机抽抽取取了了100100个个下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信区间信区间解解解解:已已知知 n n=100=100,p p65% 65% , , 1 1- - = = 95%95%,z z /2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35% 2008年8月1 - 82统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计2008年8月1 - 83统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计1. 估计一个总体的方差或标准差2. 假设总体服从正态分布3.总体方差 2 2 的点估计量为S2 2,且4. 总体方差在1-置信水平下的置信区间为2008年8月1 - 84统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计(图示图示) 1-1-1-1- 总体方差总体方差总体方差1-1-1- 的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 2008年8月1 - 85统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例例例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表7 7所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.32008年8月1 - 86统计学统计学STATISTICS(第三版第三版)总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解解解 : :已已 知知 n n 2525, 1-1- 95% 95% , ,根根 据据 样样 本本 数数 据据 计计 算算 得得 s s2 2 =93.21=93.21 2 2置信度为置信度为95%95%的置信区间为的置信区间为 该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区间为间为7.547.54克克13.4313.43克克2008年8月1 - 87统计学统计学STATISTICS(第三版第三版)三、三、 两个总体参数的区间估计两个总体参数的区间估计(一)两个总体均值之差的区间估计(一)两个总体均值之差的区间估计(二)两个总体比例的之差区间估计(二)两个总体比例的之差区间估计(三)两个总体方差比的区间估计(三)两个总体方差比的区间估计2008年8月1 - 88统计学统计学STATISTICS(第三版第三版)两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比例之差方差比2008年8月1 - 89统计学统计学STATISTICS(第三版第三版)两个总体均值之差的区间估计两个总体均值之差的区间估计(独立大样本独立大样本)2008年8月1 - 90统计学统计学STATISTICS(第三版第三版)两个样本均值之差的抽样分布两个样本均值之差的抽样分布 1 1 1 1总体总体1 2 2 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-1-1- 抽样分布抽样分布抽样分布抽样分布2008年8月1 - 91统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(大样本大样本)1. 假定条件 两个两个总体都服从正态分布,总体都服从正态分布, 1 1、 2 2已知已知 若若不不是是正正态态分分布布, , 可可以以用用正正态态分分布布来来近近似似( (n n1 1 3030和和n n2 2 30)30) 两个样本是独立的随机样本两个样本是独立的随机样本2.使用正态分布统计量Z2008年8月1 - 92统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计 (大样本大样本)1.1. 1 1、 2 2已已知知时时,两两个个总总体体均均值值之之差差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信区间为2. 1 1、 2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信区间为2008年8月1 - 93统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立地抽取两个随机样本,有关数据如下表 。建立两所中学高考英语平均分数之差95%的置信区间 两个样本的有关数据两个样本的有关数据两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.22008年8月1 - 94统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解解解: : 两两个个总总体体均均值值之之差差在在1-1- 置置信信水水平平下下的的置置信信区区间间为为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分10.9710.97分分2008年8月1 - 95统计学统计学STATISTICS(第三版第三版)两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本)2008年8月1 - 96统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 1 )1.1.假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知但相等:两个总体方差未知但相等: 1 1= = 2 2 两个独立的小样本两个独立的小样本( (n n1 1 3030和和n n2 2 30)30)2.2.总体方差的合并估计量总体方差的合并估计量3.3.估计估计量量 X X1 1- - X X2 2的抽样标准差的抽样标准差2008年8月1 - 97统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 1 )1.两个样本均值之差的标准化2.两个总体均值之差1-2在1- 置信水平下的置信区间为2008年8月1 - 98统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例例例】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排1212个个工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(分分钟钟)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差相相等等。试试以以95%95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需需平平均均时间差值的置信区间时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 12008年8月1 - 99统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解解解: : 根据样本数据计算得根据样本数据计算得 合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟2008年8月1 - 100统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 1 )1.1.假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知且不相等:两个总体方差未知且不相等: 1 12 2 两个独立的小样本两个独立的小样本( (n n1 1 3030和和n n2 2 30)30)2.使用统计量使用统计量2008年8月1 - 101统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 1 )两个总体均值之差1-2在1- 置信水平下的置信区间为自由度自由度2008年8月1 - 102统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例例例】沿沿用用前前例例。假假定定第第一一种种方方法法随随机机安安排排1212个个工工人人,第第二二种种方方法法随随机机安安排排8 8个个工工人人,即即n n1 1=12=12,n n2 2=8 =8 ,所所得得的的有有关关数数据据如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差不不相相等等。以以95%95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22 21 12008年8月1 - 103统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解解解: : 根据样本数据计算得根据样本数据计算得 自由度为:自由度为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.1920.192分钟分钟9.0589.058分钟分钟2008年8月1 - 104统计学统计学STATISTICS(第三版第三版)两个总体均值之差的区间估计两个总体均值之差的区间估计(匹配样本匹配样本)2008年8月1 - 105统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(匹配大样本匹配大样本)1.假定条件两个匹配的大样本两个匹配的大样本( (n n1 1 3030和和n n2 2 30)30)2.两个总体均值之差d=1-2在1- 置信水平下的置信区间为对应差值的均值对应差值的均值对应差值的标准差对应差值的标准差2008年8月1 - 106统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)1.假定条件两个匹配的小样本两个匹配的小样本( (n n1 1 3030和和n n2 2 30)30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 2.两个总体均值之差d=1-2在1- 置信水平下的置信区间为2008年8月1 - 107统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例例例】由由1010名名学学生生组组成成一一个个随随机机样样本本,让让他他们们分分别别 采采 用用 A A和和 B B两两套套试试卷卷进进行行测测试试,结结果果如如下下表表 。试试建建立立两两种种试试卷卷分分数数之之差差 d d= = 1 1- - 2 2 95%95%的置信区间的置信区间 1010名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷卷B差差值d17871726344193726111489845691741754951-276855138766016985778105539162008年8月1 - 108统计学统计学STATISTICS(第三版第三版)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解解解: : 根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产生的分数之差的置信区间为6.336.33分分15.6715.67分分2008年8月1 - 109统计学统计学STATISTICS(第三版第三版)两个总体比例之差区间的估计两个总体比例之差区间的估计2008年8月1 - 110统计学统计学STATISTICS(第三版第三版)1. 假定条件 两个两个总体服从二项分布总体服从二项分布 可以用正态分布来近似可以用正态分布来近似 两个样本是独立的两个样本是独立的2. 两个总体比例之差1- 2在1-置信水平下的置信区间为两个总体比例之差的区间估计两个总体比例之差的区间估计2008年8月1 - 111统计学统计学STATISTICS(第三版第三版)两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)【例例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间 1 12 22008年8月1 - 112统计学统计学STATISTICS(第三版第三版)两个总体比例之差的估计两个总体比例之差的估计 (例题分析例题分析)解解解解: : 已知已知 n n1 1=500 =500 ,n n2 2=400=400, p p1 1=45%=45%, p p2 2=32%=32%, 1- 1- =95%=95%, z z /2/2=1.96=1.96 1 1- - 2 2置信度为置信度为95%95%的置信区间为的置信区间为城城 市市 与与 农农 村村 收收 视视 率率 差差 值值 的的 置置 信信 区区 间间 为为6.68%19.32%6.68%19.32%2008年8月1 - 113统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计2008年8月1 - 114统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计1.1.比较两个总体的方差比比较两个总体的方差比2.用两个样本的方差比来判断用两个样本的方差比来判断 如果如果S S1 12 2/ / S S2 22 2接近于接近于1 1, ,说明两个总体方差很接近说明两个总体方差很接近 如果如果S S1 12 2/ / S S2 22 2远离远离1 1, ,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1-1- 置信水平下的置信区间为置信水平下的置信区间为2008年8月1 - 115统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计(图示图示)F FF F1-1-1-1-F F总体方差比总体方差比总体方差比1-1-1- 的置信区间的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图2008年8月1 - 116统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计(例题分析例题分析)【例例】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果: 男学生: 女学生: 试以90%置信水平估计男女学生生活费支出方差比的置信区间 2008年8月1 - 117统计学统计学STATISTICS(第三版第三版)两个总体方差比的区间估计两个总体方差比的区间估计 (例题分析例题分析)解解解解: :根根据据自自由由度度 n n1 1=25-1=24 =25-1=24 ,n n2 2=25-1=24=25-1=24,查查得得 F F /2/2(24)=1.98(24)=1.98, F F1-1- /2/2(24)=1/1.98=0.505(24)=1/1.98=0.505 1 12 2 / / 2 22 2置信度为置信度为90%90%的置信区间为的置信区间为男男 女女 学学 生生 生生 活活 费费 支支 出出 方方 差差 比比 的的 置置 信信 区区 间间 为为0.471.840.471.84 2008年8月1 - 118统计学统计学STATISTICS(第三版第三版)4.4 样本容量的确定样本容量的确定一一.估计总体均值时样本容量的确定估计总体均值时样本容量的确定二二.估计总体比例时样本容量的确定估计总体比例时样本容量的确定三三.估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定四四.估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定2008年8月1 - 119统计学统计学STATISTICS(第三版第三版)估计总体均值时样本容量的确定估计总体均值时样本容量的确定2008年8月1 - 120统计学统计学STATISTICS(第三版第三版)1.估计总体均值时样本容量n为2.样本容量n与总体方差2、边际误差E、可靠性系数Z或t之间的关系为 与总体方差成正比与总体方差成正比 与边际误差成反比与边际误差成反比 与可靠性系数成正比与可靠性系数成正比估计总体均值时样本容量的确定估计总体均值时样本容量的确定 其中:2008年8月1 - 121统计学统计学STATISTICS(第三版第三版)估计总体均值时样本容量的确定估计总体均值时样本容量的确定 (例题分析例题分析)【例例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?2008年8月1 - 122统计学统计学STATISTICS(第三版第三版)估计总体均值时样本容量的确定估计总体均值时样本容量的确定 (例题分析例题分析)解解解解: : 已知已知 =2000=2000,E E=400, =400, 1-1- =95%=95%, z z /2/2=1.96=1.96 1 12 2 / / 2 22 2置信度为置信度为90%90%的置信区间为的置信区间为即应抽取即应抽取9797人作为样本人作为样本 2008年8月1 - 123统计学统计学STATISTICS(第三版第三版)估计总体比例时样本容量的确定估计总体比例时样本容量的确定2008年8月1 - 124统计学统计学STATISTICS(第三版第三版)1.根据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定估计总体比例时样本容量的确定 2. E的取值一般小于0.13. 未知时,可取最大值0.5其中:其中:其中:2008年8月1 - 125统计学统计学STATISTICS(第三版第三版)估计总体比例时样本容量的确定估计总体比例时样本容量的确定 (例题分析例题分析)【例例例例】根根据据以以往往的的生生产产统统计计,某某种种产产品品的的合合格格率率约约为为90%90%,现现要要求求 边边 际际 误误 差差 为为5%5%, 在在 求求 95%95%的的置置信信区区间间时时,应应抽抽取取多多少少个个产产品作为样本?品作为样本? 解解解解 : :已已 知知 =90%=90%, =0.05=0.05, Z Z /2/2=1.96=1.96,E E=5%=5% 应抽取的样本容量应抽取的样本容量为为 应抽取应抽取139139个产品作为样本个产品作为样本2008年8月1 - 126统计学统计学STATISTICS(第三版第三版)估计两个总体均值之差时估计两个总体均值之差时样本容量的确定样本容量的确定2008年8月1 - 127统计学统计学STATISTICS(第三版第三版)1.设n1和n2为来自两个总体的样本,并假定n1=n22.根据均值之差的区间估计公式可得两个样本的容量n为估计两个总体均值之差时估计两个总体均值之差时样本容量的确定样本容量的确定 其中:其中:其中:2008年8月1 - 128统计学统计学STATISTICS(第三版第三版)估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定 (例题分析例题分析)【例例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班12=90 ,普通班 22=120 。如果要求估计的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查? 2008年8月1 - 129统计学统计学STATISTICS(第三版第三版)估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定 (例题分析例题分析)解解解解: : 已已知知 1 12 2=90=90, 2 22 2=120=120,E E=5, =5, 1-1- =95%=95%,z z /2/2=1.96=1.96即应抽取即应抽取3333人作为样本人作为样本 2008年8月1 - 130统计学统计学STATISTICS(第三版第三版)估计两个总体比例之差时估计两个总体比例之差时样本容量的确定样本容量的确定2008年8月1 - 131统计学统计学STATISTICS(第三版第三版)1.设n1和n2为来自两个总体的样本,并假定n1=n22.根据比例之差的区间估计公式可得两个样本的容量n为估计两个总体比例之差时估计两个总体比例之差时样本容量的确定样本容量的确定 其中:其中:其中:2008年8月1 - 132统计学统计学STATISTICS(第三版第三版)估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定 (例题分析例题分析)【例例例例】一一家家瓶瓶装装饮饮料料制制造造商商想想要要估估计计顾顾客客对对一一种种新新型型饮饮料料认认知知的的广广告告效效果果。他他在在广广告告前前和和广广告告后后分分别别从从市市场场营营销销区区各各抽抽选选一一个个消消费费者者随随机机样样本本,并并询询问问这这些些消消费费者者是是否否听听说说过过这这种种新新型型饮饮料料。这这位位制制造造商商想想以以10%10%的的误误差差范范围围和和95%95%的的置置信信水水平平估估计计广广告告前前后后知知道道该该新新型型饮饮料料消消费费者者的的比比例例之之差差,他他抽抽取取的的两两个个样样本本分分别别应应包包括括多多少少人人?( (假假定两个样本容量相等定两个样本容量相等) ) 绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品2008年8月1 - 133统计学统计学STATISTICS(第三版第三版)估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定 (例题分析例题分析)解解: E=10%, 1-=95%,z/2=1.96,由于没有的信息,用0.5代替即应抽取193个消费者作为样本 2008年8月1 - 134统计学统计学STATISTICS(第三版第三版)4.5 假设检验假设检验一、一、 假设检验的基本问题假设检验的基本问题 二、二、一个正态总体参数的检验一个正态总体参数的检验三、三、两个正态总体参数的检验两个正态总体参数的检验四、四、假设检验中的其他问题假设检验中的其他问题2008年8月1 - 135统计学统计学STATISTICS(第三版第三版)假设检验在统计方法中的地位假设检验在统计方法中的地位2008年8月1 - 136统计学统计学STATISTICS(第三版第三版)一、一、假设检验的基本问题假设检验的基本问题(一)假设问题的提出(一)假设问题的提出(二)假设的表达式(二)假设的表达式(三)两类错误(三)两类错误(四)假设检验中的值(四)假设检验中的值(五)假设检验的另一种方法(五)假设检验的另一种方法(六)单侧检验(六)单侧检验2008年8月1 - 137统计学统计学STATISTICS(第三版第三版)假设检验的概念与思想假设检验的概念与思想2008年8月1 - 138统计学统计学STATISTICS(第三版第三版)什么是假设什么是假设?(hypothesis) 对总体参数的的数值所作的一种陈述n总总体体参参数数包包括括总总总总体体体体均均均均值值值值、比例比例比例比例、方差方差方差方差等等n分析分析之前之前之前之前必需陈述必需陈述我认为该地区新生婴儿我认为该地区新生婴儿的平均体重为的平均体重为31903190克克! !2008年8月1 - 139统计学统计学STATISTICS(第三版第三版)什么是假设检验什么是假设检验? (hypothesis testing)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理2008年8月1 - 140统计学统计学STATISTICS(第三版第三版)假设检验的基本思想假设检验的基本思想. . . 因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设绝假设绝假设 = 50= 50= 50. . . 如果这是如果这是如果这是如果这是如果这是如果这是总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均值值值值值值样本均值样本均值样本均值 = 50= 50抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值样本均值样本均值 . . .2020202008年8月1 - 141统计学统计学STATISTICS(第三版第三版)总体总体总体总体假设检验的过程假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X = 20= 20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设! 别无选择别无选择.作出决策作出决策作出决策作出决策2008年8月1 - 142统计学统计学STATISTICS(第三版第三版)假设检验的步骤假设检验的步骤提出假设提出假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值作出统计决策作出统计决策2008年8月1 - 143统计学统计学STATISTICS(第三版第三版)提出原假设和备择假设提出原假设和备择假设 什么是原假设?什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3. 总是有等号 , 或 4. 表示为 H0n nH H0 0: 某一数值某一数值 n n指定为指定为 = = 号,即号,即 或或 n n例如例如, H, H0 0: 3190 3190(克)(克)为什么叫为什么叫为什么叫0 00假设假设假设? ?2008年8月1 - 144统计学统计学STATISTICS(第三版第三版) 什么是备择假设?什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号: , 或 3.表示为 H1n nH H1 1: 某一数值,或某一数值,或 某一数值某一数值n n例如例如, H, H1 1: 3910( 3910(克克) ),或,或 3910(3910(克克 提出原假设和备择假设提出原假设和备择假设2008年8月1 - 145统计学统计学STATISTICS(第三版第三版) 什么检验统计量?什么检验统计量?1. 用于假设检验决策的统计量2. 选择统计量的方法与参数估计相同,需考虑n是大样本还是小样本是大样本还是小样本n总体方差已知还是未知总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量确定适当的检验统计量2008年8月1 - 146统计学统计学STATISTICS(第三版第三版)规定显著性水平规定显著性水平 ( (significant levelsignificant level) ) 什么显著性水平?什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率n被称为抽样分布的拒绝域被称为抽样分布的拒绝域3.表示为 (alpha)n常用的常用的 值有值有0.01, 0.05, 0.100.01, 0.05, 0.104.由研究者事先确定2008年8月1 - 147统计学统计学STATISTICS(第三版第三版)作出统计决策作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/23.将检验统计量的值与 水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论2008年8月1 - 148统计学统计学STATISTICS(第三版第三版)假设检验中的小概率原理假设检验中的小概率原理2008年8月1 - 149统计学统计学STATISTICS(第三版第三版)假设检验中的小概率原理假设检验中的小概率原理 什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小什么是小什么是小概率?概率?概率?2008年8月1 - 150统计学统计学STATISTICS(第三版第三版)假设检验中的两类错误假设检验中的两类错误(决策风险决策风险)2008年8月1 - 151统计学统计学STATISTICS(第三版第三版)假设检验中的两类错误假设检验中的两类错误1.1.第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)n n原假设为真时拒绝原假设原假设为真时拒绝原假设n n会产生一系列后果会产生一系列后果n n第一类错误的概率为第一类错误的概率为 被称为显著性水平被称为显著性水平2.2.第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)n n原假设为假时接受原假设原假设为假时接受原假设n n第二类错误的概率为第二类错误的概率为(Beta)(Beta)2008年8月1 - 152统计学统计学STATISTICS(第三版第三版)H H0 0: : 无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误(决策结果)(决策结果)陪审团审判陪审团审判陪审团审判陪审团审判裁决裁决裁决裁决实际情况实际情况实际情况实际情况无罪无罪无罪无罪有罪有罪有罪有罪无罪无罪无罪无罪正确正确正确正确错误错误错误错误有罪有罪有罪有罪错误错误错误错误正确正确正确正确H H0 0 检验检验检验检验决策决策决策决策实际情况实际情况实际情况实际情况H H0 0为真为真为真为真H H0 0为假为假为假为假接受接受接受接受H H0 0正确决策正确决策正确决策正确决策(1 (1 )第二类错第二类错第二类错第二类错误误误误( ( ( ()拒绝拒绝拒绝拒绝H H0 0第一类错第一类错第一类错第一类错误误误误( ( ( ()正确决策正确决策正确决策正确决策(1-(1-(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程2008年8月1 - 153统计学统计学STATISTICS(第三版第三版) 错误和错误和 错误的关系错误的关系 你不能同时减你不能同时减少两类错误少两类错误! 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板, 小小小小 就就就就大,大,大,大, 大大大大 就小就小就小就小2008年8月1 - 154统计学统计学STATISTICS(第三版第三版)影响影响 错误的因素错误的因素1.总体参数的真值n随着假设的总体参数的减少而增大随着假设的总体参数的减少而增大2.显著性水平 n当当 减少时增大减少时增大3.总体标准差 n当当 增大时增大增大时增大4.样本容量 nn当当 n n 减少时增大减少时增大2008年8月1 - 155统计学统计学STATISTICS(第三版第三版)假设检验中的假设检验中的 P 值值2008年8月1 - 156统计学统计学STATISTICS(第三版第三版)什么是什么是P 值值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率n左侧检验时,左侧检验时,P P- -值为曲线上方值为曲线上方小于等于小于等于小于等于小于等于检检验统计量部分的面积验统计量部分的面积n右侧检验时,右侧检验时,P P- -值为曲线上方值为曲线上方大于等于大于等于大于等于大于等于检检验统计量部分的面积验统计量部分的面积3.被称为观察到的(或实测的)显著性水平nH H0 0 能被拒绝的能被拒绝的的最小值的最小值2008年8月1 - 157统计学统计学STATISTICS(第三版第三版)双侧检验的双侧检验的P 值值 / / 2 2 / / 2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值2008年8月1 - 158统计学统计学STATISTICS(第三版第三版)左侧检验的左侧检验的P 值值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值2008年8月1 - 159统计学统计学STATISTICS(第三版第三版)右侧检验的右侧检验的P 值值H HH0 00值值值临界值临界值临界值 拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值2008年8月1 - 160统计学统计学STATISTICS(第三版第三版)利用利用 P 值进行检验值进行检验(决策准则决策准则)1.单侧检验n若若p-p-值值 , ,不拒绝不拒绝 H H0 0n若若p-p-值值 , , 拒绝拒绝 H H0 02.双侧检验n若若p-p-值值 /2/2, , 不拒绝不拒绝 H H0 0n若若p-p-值值 /2/2, , 拒绝拒绝 H H0 02008年8月1 - 161统计学统计学STATISTICS(第三版第三版)双侧检验和单侧检验双侧检验和单侧检验2008年8月1 - 162统计学统计学STATISTICS(第三版第三版)双侧检验与单侧检验双侧检验与单侧检验 (假设的形式假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0= = 0 0 0 0 0 0H1 0 0 0 02008年8月1 - 163统计学统计学STATISTICS(第三版第三版)双侧检验双侧检验(原假设与备择假设的确定原假设与备择假设的确定)1.属于决策中的假设检验决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格n n我我们们想想要要证证明明( (检检验验) )大大于于或或小小于于这这两两种种可可能能性性中的任何一种是否成立中的任何一种是否成立4.建立的原假设与备择假设应为 H0: 10 H1: 102008年8月1 - 164统计学统计学STATISTICS(第三版第三版)双侧检验双侧检验(显著性水平与拒绝域显著性水平与拒绝域 )抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2 /2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平2008年8月1 - 165统计学统计学STATISTICS(第三版第三版)双侧检验双侧检验(显著性水平与拒绝域显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平2008年8月1 - 166统计学统计学STATISTICS(第三版第三版)双侧检验双侧检验 (显著性水平与拒绝域显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2 /2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平2008年8月1 - 167统计学统计学STATISTICS(第三版第三版)双侧检验双侧检验 (显著性水平与拒绝域显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2 /2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平2008年8月1 - 168统计学统计学STATISTICS(第三版第三版)单侧检验单侧检验(原假设与备择假设的确定原假设与备择假设的确定)1.将将研研究究者者想想收收集集证证据据予予以以支支持持的的假假设设作作为为备备择择假设假设H H1 1 例例如如, ,一一个个研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论是是正正确的确的 一个销售商总是想正确供货商的说法是不正确的一个销售商总是想正确供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致备择假设的方向与想要证明其正确性的方向一致2.将将研研究究者者想想收收集集证证据据证证明明其其不不正正确确的的假假设设作作为为原假设原假设H H0 03.先确立备择假设先确立备择假设H H1 12008年8月1 - 169统计学统计学STATISTICS(第三版第三版)单侧检验单侧检验 (原假设与备择假设的确定原假设与备择假设的确定)q一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立n研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论( (寿寿命命延延长长) )是正确的是正确的n备择假设的方向为“”(寿命延长寿命延长)n建立的原假设与备择假设应为 H0: 1500 H1: 15002008年8月1 - 170统计学统计学STATISTICS(第三版第三版)单侧检验单侧检验 (原假设与备择假设的确定原假设与备择假设的确定)q一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立n研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论( (废废品品率率降低降低) )是正确的是正确的n备择假设的方向为“”(废品率降低废品率降低)n建立的原假设与备择假设应为 H0: 2% H1: 2%2008年8月1 - 171统计学统计学STATISTICS(第三版第三版)单侧检验单侧检验 (原假设与备择假设的确定原假设与备择假设的确定)q某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方检验权在销售商一方作作为为销销售售商商,你你总总是是想想收收集集证证据据证证明明生生产产商商的的说说法法( (寿寿命命在在10001000小小时时以以上上) )是是不不是是正正确确的的n备择假设的方向为“ 1020 1020 = = 0.050.05n n = = 1616临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05 = 0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策决策决策: :结论结论结论结论: :Z Z0 0拒绝域拒绝域0.050.051.6451.6452008年8月1 - 186统计学统计学STATISTICS(第三版第三版) 2 未知大样本均值的检验未知大样本均值的检验 (例题分析例题分析)【例例例例】某某电电子子元元件件批批量量生生产产的的质质量量标标准准为为平平均均使使用用寿寿命命12001200小小时时。某某厂厂宣宣称称他他们们采采用用一一种种新新工工艺艺生生产产的的元元件件质质量量大大大大超超过过规规定定标标准准。为为了了进进行行验验证证,随随机机抽抽取取了了100100件件作作为为样样本本,测测得得平平均均使使用用寿寿命命12451245小小时时,标标准准差差300300小小时时。能能否否说说该该厂厂生生产产的的电电子子元元件件质质量量显显著著地地高高于规定标准?于规定标准? ( ( 0.050.05) )单侧检验单侧检验2008年8月1 - 187统计学统计学STATISTICS(第三版第三版) 2 未知大样本均值的检验未知大样本均值的检验 (例题分析例题分析)H H0 0: : 12001200H H1 1: : 1200 1200 = = 0.050.05n n = = 100100临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05 = 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于12001200小时小时决策决策决策决策: :结论结论结论结论: :Z Z0 0拒绝域拒绝域0.050.051.6451.6452008年8月1 - 188统计学统计学STATISTICS(第三版第三版)总体均值的检验总体均值的检验 ( 2未知小样本未知小样本)1.假定条件n总体为正态分布总体为正态分布n 2 2未知,且小样本未知,且小样本2.使用t 统计量2008年8月1 - 189统计学统计学STATISTICS(第三版第三版) 2 未知小样本均值的检验未知小样本均值的检验 (例题分析例题分析)【例例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。 双侧检验双侧检验2008年8月1 - 190统计学统计学STATISTICS(第三版第三版) 2 未知小样本均值的检验未知小样本均值的检验 (例题分析例题分析)H H0 0: : = 5 = 5H H1 1: : 5 5 = 0.05= 0.05df df = 10= 10 - 1 = 9 - 1 = 9临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05 = 0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0252008年8月1 - 191统计学统计学STATISTICS(第三版第三版) 2 未知小样本均值的检验未知小样本均值的检验 (例题分析例题分析) 【例例例例】一一个个汽汽车车轮轮胎胎制制造造商商声声称称,某某一一等等级级的的轮轮胎胎的的平平均均寿寿命命在在一一定定的的汽汽车车重重量量和和正正常常行行驶驶条条件件下下大大于于4000040000公公里里,对对一一个个由由2020个个轮轮胎胎组组成成的的随随机机样样本本作作了了试试验验,测测得得平平均均值值为为4100041000公公里里,标标准准差差为为50005000公公里里。已已知知轮轮胎胎寿寿命命的的公公里里数数服服从从正正态态分分布布,我我们们能能否否根根据据这这些些数数据据作作出出结结论论,该该制制造造商商的的产产品品同同他他所所说说的的标标准准相相符符?( ( = 0.05= 0.05) )单侧检验!单侧检验!2008年8月1 - 192统计学统计学STATISTICS(第三版第三版)均值的单尾均值的单尾 t 检验检验 (计算结果计算结果) H H0 0: : 40000 40000H H1 1: : 40000 40000 = 0.= 0.0505df df = = 20 - 1 = 1920 - 1 = 19临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05 = 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为制造商的产品同他所不能认为制造商的产品同他所说的标准不相符说的标准不相符决策决策决策决策: : 结论结论结论结论: : -1.7291-1.7291t t0 0拒绝域拒绝域. .05052008年8月1 - 193统计学统计学STATISTICS(第三版第三版)总体比例的检验总体比例的检验(Z 检验检验)2008年8月1 - 194统计学统计学STATISTICS(第三版第三版)适用的数据类型适用的数据类型2008年8月1 - 195统计学统计学STATISTICS(第三版第三版)一个总体比例检验一个总体比例检验1.假定条件n有两类结果有两类结果n总体服从二项分布总体服从二项分布n可用正态分布来近似可用正态分布来近似2.比例检验的 Z 统计量 0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例2008年8月1 - 196统计学统计学STATISTICS(第三版第三版)一个总体比例的检验一个总体比例的检验 (例题分析例题分析)【例例例例】一一项项统统计计结结果果声声称称,某某市市老老年年人人口口(年年龄龄在在6565岁岁以以上上)的的比比重重为为14.714.7%,该该市市老老年年人人口口研研究究会会为为了了检检验验该该项项统统计计是是否否可可靠靠,随随机机抽抽选选了了400400名名居居民民,发发现现其其中中有有5757人人年年龄龄在在6565岁岁以以上上。调调查查结结果果是是否否支支持持该该市市老老年年人人口口比比重重为为14.7%14.7%的看法?的看法?( ( = = 0.050.05) )双侧检验双侧检验2008年8月1 - 197统计学统计学STATISTICS(第三版第三版)一个总体比例的检验一个总体比例的检验 (例题分析例题分析)H H0 0: : = 14.7% = 14.7%H H1 1: : 14.7% 14.7% = 0.05= 0.05n n = = 400400临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :在在 = 0.05 = 0.05的水平上不拒绝的水平上不拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策: :结论结论结论结论: :Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0252008年8月1 - 198统计学统计学STATISTICS(第三版第三版)总体方差的检验总体方差的检验( 2 检验检验)2008年8月1 - 199统计学统计学STATISTICS(第三版第三版)方差的卡方方差的卡方 ( 2) 检验检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设的总体方差假设的总体方差2008年8月1 - 200统计学统计学STATISTICS(第三版第三版)方差的卡方方差的卡方 ( 2) 检验检验(例题分析例题分析)【例例例例】某某厂厂商商生生产产出出一一种种新新型型的的饮饮料料装装瓶瓶机机器器,按按设设计计要要求求,该该机机器器装装一一瓶瓶一一升升( (1000cm1000cm3 3) )的的饮饮料料误误差差上上下下不不超超过过1cm1cm3 3。如如果果达达到到设设计计要要求求,表表明明机机器器的的稳稳定定性性非非常常好好。现现从从该该机机器器装装完完的的产产品品中中随随机机抽抽取取2525瓶瓶,分分别别 进进 行行 测测 定定 ( (用用 样样 本本 减减1000cm1000cm3 3) ),得得到到如如下下结结果果。检检验验该该机机器器的的性性能能是是否否达达到到设设计计要求要求 ( ( =0.05=0.05) )0.3-0.4 -0.71.4-0.6-0.3 -1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5 -0.2 -1.9-0.51-0.2 -0.61.1绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品双侧检验双侧检验2008年8月1 - 201统计学统计学STATISTICS(第三版第三版)方差的卡方方差的卡方 ( 2) 检验检验(例题分析例题分析)H H0 0: : 2 2 = 1 = 1H H1 1: : 2 2 1 1 = 0.= 0.0505df df = = 25 - 1 = 2425 - 1 = 24临界值临界值临界值临界值(s):(s):统计量统计量统计量统计量: : 在在 = 0.05 = 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该机器的性能未达到不能认为该机器的性能未达到设计要求设计要求 2 220 0 039.3639.3639.3612.4012.4012.40 /2 =.05 /2 =.05 /2 =.05决策决策决策决策: :结论结论结论结论: :2008年8月1 - 202统计学统计学STATISTICS(第三版第三版)三、三、两个正态总体参数的检验两个正态总体参数的检验(一)检验统计量的确定(一)检验统计量的确定(二)两个总体均值之差的检验(二)两个总体均值之差的检验(三)两个总体比例之差的检验(三)两个总体比例之差的检验(四)两个总体方差比的检验(四)两个总体方差比的检验(五)检验中的匹配样本(五)检验中的匹配样本2008年8月1 - 203统计学统计学STATISTICS(第三版第三版)两个正态总体参数的检验两个正态总体参数的检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验独立样本独立样本独立样本配对样本配对样本配对样本均值均值比例比例方差方差2008年8月1 - 204统计学统计学STATISTICS(第三版第三版)独立样本总体均值之差的检验独立样本总体均值之差的检验2008年8月1 - 205统计学统计学STATISTICS(第三版第三版)两个独立样本之差的抽样分布两个独立样本之差的抽样分布1 1总体总体1 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-1-1- 抽样分布抽样分布抽样分布抽样分布2008年8月1 - 206统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 ( 12、 22 已知已知)1.1.假定条件假定条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n若不是正态分布若不是正态分布, , 可以用正态分布来近似可以用正态分布来近似( (n n1 1 3030和和 n n2 2 30)30)2.检验统计量为检验统计量为2008年8月1 - 207统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 (假设的形式假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 均值均值2 2H0 1 1 2 2 = 0= 0 1 1 2 2 0 0 1 1 2 2 0 0H1 1 1 2 2 0 0 1 1 2 2 0 0 02008年8月1 - 208统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析) 双侧检验!双侧检验!【例例例例】有有两两种种方方法法可可用用于于制制造造某某种种以以抗抗拉拉强强度度为为重重要要特特征征的的产产品品。根根据据以以往往的的资资料料得得知知,第第一一种种方方法法生生产产出出的的产产品品其其抗抗拉拉强强度度的的标标准准差差为为8 8公公斤斤,第第二二种种方方法法的的标标准准差差为为1010公公斤斤。从从两两种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机样样本本,样样本本容容量量分分别别为为n n1 1=32=32,n n2 2=40=40,测测得得 x x2 2= = 5050公公斤斤, x x1 1= = 4444公公斤斤。问问这这两两种种方方法法生生产产的的产产品品平平均均抗抗拉拉强强度度是否有显著差别?是否有显著差别? ( ( = 0.05 = 0.05) )2008年8月1 - 209统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析)H H0 0: : 1 1 1 1- - = 0 = 0H H1 1: : 1 1 1 1- - 0 0 = = 0.050.05n n1 1 = = 32 32,n n2 2 = = 4040临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05 = 0.05的水平上拒绝的水平上拒绝H H0 0有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其抗拉强度有显著差异Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0252008年8月1 - 210统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 ( 12、 22 未知且不相等未知且不相等,小样本小样本)1.检验具有不等方差的两个总体的均值检验具有不等方差的两个总体的均值2.假定假定条件条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n两个总体方差未知且不相等两个总体方差未知且不相等 1 122 2 22 23.检验检验统计量统计量其中:其中:其中:2008年8月1 - 211统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 ( 12、 22 未知但相等未知但相等,小样本小样本)1.检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值2.假定假定条件条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n两个总体方差未知但相等两个总体方差未知但相等 1 122= 2 22 23.检验检验统计量统计量2008年8月1 - 212统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析)单侧检验单侧检验 【例例】 “ “多多吃吃谷谷物物,将将有有助助于于减减肥肥。” ”为为了了验验证证这这个个假假设设,随随机机抽抽取取了了3535人人,询询问问他他们们早早餐餐和和午午餐餐的的通通常常食食谱谱,根根据据他他们们的的食食谱谱,将将其其分分为为二二类类,一一类类为为经经常常的的谷谷类类食食用用者者( (总总体体1 1) ),一一类类为为非非经经常常谷谷类类食食用用者者( (总总体体2 2) )。然然后后测测度度每每人人午午餐餐的的大大卡卡摄摄取取量量。经经过过一一段段时时间间的的实实验验,得得到到如如下下结果:检验该假设结果:检验该假设 ( ( = 0.05 = 0.05) )2008年8月1 - 213统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析用统计量进行检验用统计量进行检验)H H0 0: : 1 1 1 1- - 0 0H H1 1: : 1 1 1 1- - 0 0 = = 0.050.05n n1 1 = = 15 15,n n2 2 = = 2020临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05 = 0.05的水平上拒绝的水平上拒绝H H0 0没有证据表明多吃谷物将有助没有证据表明多吃谷物将有助于减肥于减肥-1.694-1.694t t0 0拒绝域拒绝域.05.052008年8月1 - 214统计学统计学STATISTICS(第三版第三版)两个匹配两个匹配(或配对或配对)样本的均值检验样本的均值检验2008年8月1 - 215统计学统计学STATISTICS(第三版第三版)两个总体均值之差的检验两个总体均值之差的检验(匹配匹配样本的样本的 t 检验检验)1.检验两个总体的均值n配对或匹配配对或匹配n重复测量重复测量 ( (前前/ /后后) )3.假定条件n两个总体都服从正态分布两个总体都服从正态分布n如果不服从正态分布,可用正态分布来近似如果不服从正态分布,可用正态分布来近似 ( (n n1 1 30 , 30 , n n2 2 30 ) 30 )2008年8月1 - 216统计学统计学STATISTICS(第三版第三版)匹配样本的匹配样本的 t 检验检验 (假设的形式假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 总体总体2 2H0 D D = = 0 0 D D 0 0 D D 0 0H1 D D 0 0 D D 0 0 0注:注:D Di i = = X X1 1i i - - X X2 2i i ,对第,对第 i i 对观察值对观察值2008年8月1 - 217统计学统计学STATISTICS(第三版第三版)匹配样本的匹配样本的 t 检验检验 (数据形式数据形式) 观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1 = x 11 - x 212x 12x 22D1 = x 12 - x 22MMMMMMMMix 1ix 2iD1 = x 1i - x 2iMMMMMMMMnx 1nx 2nD1 = x 1n- x 2n2008年8月1 - 218统计学统计学STATISTICS(第三版第三版)匹配样本的匹配样本的 t 检验检验(检验统计量检验统计量)样本差值均值样本差值均值样本差值均值样本差值均值样本差值标准差样本差值标准差样本差值标准差样本差值标准差自由度自由度df df n nD D - 1- 1统计量统计量统计量统计量D D0 0:假设的差值:假设的差值2008年8月1 - 219统计学统计学STATISTICS(第三版第三版)【例例例例】一一个个以以减减肥肥为为主主要要目目标标的的健健美美俱俱乐乐部部声声称称,参参加加其其训训练练班班至至少少可可以以使使减减肥肥者者平平均均体体重重减减重重8.58.5kgkg以以上上。为为了了验验证证该该宣宣称称是是否否可可信信,调调查查人人员员随随机机抽抽取了取了1010名参加者,得到他们的体重记录如下表:名参加者,得到他们的体重记录如下表:匹配样本的匹配样本的 t 检验检验 (例题分析例题分析)在在 = 0.05 = 0.05的显著性水平下,调查结果是否支持该的显著性水平下,调查结果是否支持该俱乐部的声称?俱乐部的声称?训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102单侧检验单侧检验2008年8月1 - 220统计学统计学STATISTICS(第三版第三版)样本差值计算表样本差值计算表样本差值计算表样本差值计算表训练前训练前训练后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计98.5配对样本的配对样本的 t 检验检验(例题分析例题分析)2008年8月1 - 221统计学统计学STATISTICS(第三版第三版)配对样本的配对样本的 t 检验检验 (例题分析例题分析)差值均值差值均值差值均值差值均值差值标准差差值标准差差值标准差差值标准差2008年8月1 - 222统计学统计学STATISTICS(第三版第三版)H H0 0: : 1 1 2 2 8.5 8.5H H1 1: : 1 1 2 2 8.5 8.5 = = 0.05 0.05df df = = 10 - 1 = 910 - 1 = 9临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05 = 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该俱乐部的宣称不可信不能认为该俱乐部的宣称不可信配对样本的配对样本的 t 检验检验 (例题分析例题分析)-1.833-1.833t t0 0拒绝域拒绝域.05.052008年8月1 - 223统计学统计学STATISTICS(第三版第三版)两个总体比例之差的检验两个总体比例之差的检验2008年8月1 - 224统计学统计学STATISTICS(第三版第三版)1. 假定条件n n两个总体是独立的两个总体是独立的n n两个两个总体都服从二项分布总体都服从二项分布n n可以用正态分布来近似可以用正态分布来近似2.检验统计量两个总体比例之差的两个总体比例之差的Z检验检验2008年8月1 - 225统计学统计学STATISTICS(第三版第三版)两个总体比例之差的检验两个总体比例之差的检验(假设的形式假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异比例比例1 1 比例比例2 2比例比例1 1 比例比例2 2H0P1P2 = 0P1P2 0P1P2 0H1P1P2 0P1P202008年8月1 - 226统计学统计学STATISTICS(第三版第三版)两个总体比例之差的两个总体比例之差的Z检验检验 (例题分析例题分析)单侧检验单侧检验 【例例例例】对对两两个个大大型型企企业业青青年年工工人人参参加加技技术术培培训训的的情情况况进进行行调调查查,调调查查结结果果如如下下:甲甲厂厂:调调查查6060人人,1818人人参参加加技技术术培培训训。乙乙厂厂调调查查4040人人,1414人人参参加加技技术术培培训训。能能否否根根据据以以上上调调查查结结果果认认为为乙乙厂厂工工人人参参加加技技术术培培训训的的人人数数比比例例高高于甲厂?于甲厂?( ( = 0.05 = 0.05) )2008年8月1 - 227统计学统计学STATISTICS(第三版第三版)两个总体比例之差的两个总体比例之差的Z检验检验 (例题分析例题分析)H H0 0: : 1 1 1 1- - 0 0H H1 1: : 1 1 1 1- - 0 0 = = 0.050.05n n1 1 = = 60 60,n n2 2 = = 4040临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05 = 0.05的水平上不拒绝的水平上不拒绝H H0 0没没有有证证据据表表明明乙乙厂厂工工人人参参加加技技术培训的人数比例高于甲厂术培训的人数比例高于甲厂-1.645-1.645Z Z0 0拒绝域拒绝域 2008年8月1 - 228统计学统计学STATISTICS(第三版第三版)两个总体方差比的检验两个总体方差比的检验2008年8月1 - 229统计学统计学STATISTICS(第三版第三版)两个总体方差比的检验两个总体方差比的检验(F 检验检验)1.假定条件n两个总体都服从正态分布,且方差相等两个总体都服从正态分布,且方差相等n两个独立的随机样本两个独立的随机样本2.假定形式nH H0 0: 1 12 2 = = 2 22 2 或或 H H0 0: 1 12 2 2 22 2 ( (或或 ) ) H H1 1: 1 12 2 2 22 2 H H1 1: 1 12 2 ) )3.检验统计量nF F = = S S1 12 2 / /S S2 22 2F F( (n n1 1 1 , 1 , n n2 2 1) 1)2008年8月1 - 230统计学统计学STATISTICS(第三版第三版)两个总体方差的两个总体方差的 F 检验检验(临界值临界值)0不能拒绝不能拒绝H0F拒绝拒绝H0 /2 /2拒绝拒绝 H02008年8月1 - 231统计学统计学STATISTICS(第三版第三版)两个总体方差的两个总体方差的 F 检验检验 (例题分析例题分析)H H0 0: : 1 1 1 1 = = H H1 1: : 1 1 1 1 = 0.05 = 0.05n n1 1 = 15 = 15,n n2 2 = 20= 20临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05 = 0.05的水平上不拒绝的水平上不拒绝H H0 0不不能能认认为为这这两两个个总总体体的的方方差差有有显著差异显著差异 0FF F0.0975 0.0975 =0.352=0.352.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025F F0.025 0.025 =2.62=2.622008年8月1 - 232统计学统计学STATISTICS(第三版第三版)四、四、假设检验中的其他问题假设检验中的其他问题(一)用置信区间进行检验(一)用置信区间进行检验(二)单侧检验中假设的建立(二)单侧检验中假设的建立2008年8月1 - 233统计学统计学STATISTICS(第三版第三版)用置信区间进行检验用置信区间进行检验2008年8月1 - 234统计学统计学STATISTICS(第三版第三版)用置信区间进行检验用置信区间进行检验(双侧检验双侧检验)1.求出双侧检验均值的置信区间 已知时:已知时:已知时: 未知时:未知时:未知时:2.若总体的假设值 0在置信区间外,拒绝H0 2008年8月1 - 235统计学统计学STATISTICS(第三版第三版)用置信区间进行检验用置信区间进行检验(单侧检验单侧检验)1.左侧检验:求出单边置信下限2. 若总体的假设值若总体的假设值 0 0小于单边置信下限,拒绝小于单边置信下限,拒绝H H0 03.右侧检验:求出单边置信上限4. 若总体的假设值若总体的假设值 0 0大于单边置信上限,拒绝大于单边置信上限,拒绝H H0 02008年8月1 - 236统计学统计学STATISTICS(第三版第三版)用置信区间进行检验用置信区间进行检验 (例题分析例题分析) 【例例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?( = 0.05)双侧检验!双侧检验!香脆香脆香脆蛋卷蛋卷蛋卷2008年8月1 - 237统计学统计学STATISTICS(第三版第三版)用置信区间进行检验用置信区间进行检验 (例题分析例题分析)H H0 0: : = = 1000 1000H H1 1: : 1000 1000 = = 0.050.05n n = = 49 49临界值临界值临界值临界值(s):(s):置信区间为置信区间为置信区间为置信区间为决策决策决策决策: :结论结论结论结论: : 假设的假设的 00=1000=1000在置信区在置信区间内,不拒绝间内,不拒绝H H0 0不能认为这批产品的包装重量不能认为这批产品的包装重量不合格不合格Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0252008年8月1 - 238统计学统计学STATISTICS(第三版第三版)结结 束束2008年8月
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号