统计推断：估计与假设检验-

第第4章章统计推断：估计与假设检验统计推断：估计与假设检验4.1 统计推断的含义统计推断的含义4.2 点估计及估计量的特征点估计及估计量的特征4.4 区间估计方法区间估计方法4.5 假设检验假设检验4.1 统计推断的含义统计推断的含义p统计推断研究的是总体与来自总体的样本之间的关系，统计推断研究的是总体与来自总体的样本之间的关系，根据来自总体的样本对总体的种种特征做出判断。根据来自总体的样本对总体的种种特征做出判断。p参数估计和假设检验是统计推断的两个孪生分支参数估计和假设检验是统计推断的两个孪生分支p参数估计问题包括点估计（参数估计问题包括点估计（point estimation）和区间）和区间估计（估计（interval estimation).p假设检验包括置信区间法和显著性检验假设检验包括置信区间法和显著性检验4.2 点估计及估计量的特征点估计及估计量的特征一、点估计的含义一、点估计的含义所谓点估计就是给出被估计参数的一个特定的估计值。所谓点估计就是给出被估计参数的一个特定的估计值。例如随机变量例如随机变量X X服从某一未知均值和方差的正态分布，若服从某一未知均值和方差的正态分布，若有来自该正态总体的一随机样本，则这些样本数据的平有来自该正态总体的一随机样本，则这些样本数据的平均值就为总体的均值均值就为总体的均值u ux x的点估计值，的点估计值，为点估为点估计量。计量。4.2 点估计及估计量的特征点估计及估计量的特征一、点估计的含义一、点估计的含义p点估计量是一个随机变量，因为其值随样本的不同而不点估计量是一个随机变量，因为其值随样本的不同而不同。同。p常用的点估计方法有三种：矩法、最大似然法、最小二常用的点估计方法有三种：矩法、最大似然法、最小二乘法。乘法。p对同一样本根据三种方法估计同一参数，所获得的估计对同一样本根据三种方法估计同一参数，所获得的估计结果可能互不相同。然而由于各种建立原则的合理性，结果可能互不相同。然而由于各种建立原则的合理性，所以三种方法在研究中都经常使用。所以三种方法在研究中都经常使用。二、点估计方法二、点估计方法（1）矩法）矩法p矩法是求估计量最古老的方法。具体作法是：矩法是求估计量最古老的方法。具体作法是：以一样以一样本矩作为相应总体矩的估计量；本矩作为相应总体矩的估计量；以样本矩的函数作为以样本矩的函数作为相应的总体矩同样函数的估计量。相应的总体矩同样函数的估计量。p这种方法最常见的应用是用样本平均数这种方法最常见的应用是用样本平均数估计总体数估计总体数学期望，用样本方差学期望，用样本方差S2估计总体的方差。估计总体的方差。p矩法比较直观，求估计量时有时也比较直接，但它求矩法比较直观，求估计量时有时也比较直接，但它求出的估计量往往不够理想。出的估计量往往不够理想。矩法点估计的例题矩法点估计的例题例例4-1 某灯泡厂某天生产了一大批灯泡，从中抽取了某灯泡厂某天生产了一大批灯泡，从中抽取了10个进行寿命试验，获得数据如下（单位：小时），问该个进行寿命试验，获得数据如下（单位：小时），问该天生产的灯泡的平均寿命是多少？天生产的灯泡的平均寿命是多少？（2）最大似然法）最大似然法(Maximum Likelihood Estimation)a、一个重要的事实、一个重要的事实p 不同的总体会产生不同的样本，对于某一特定的样本，不同的总体会产生不同的样本，对于某一特定的样本，在不了解产生它的总体究竟为何物的观察者眼中，它来在不了解产生它的总体究竟为何物的观察者眼中，它来自一些总体的可能性要比来自另一些总体的可能性大，自一些总体的可能性要比来自另一些总体的可能性大，即一些总体更容易产生出我们所观察到的样本。即一些总体更容易产生出我们所观察到的样本。p举例说假定我们抽取到（举例说假定我们抽取到（x1,x2,x8），知道它来自），知道它来自正态总体，且总体的方差是了解的，但是总体的均值未正态总体，且总体的方差是了解的，但是总体的均值未知。如下图所示。知。如下图所示。二、点估计方法二、点估计方法假定样本不是来自假定样本不是来自B就是来自就是来自A。如果样本来自。如果样本来自B，观察，观察到它的可能性非常小；真正的母体若是到它的可能性非常小；真正的母体若是A，得到样本的，得到样本的可能性很大。显然我们宁愿承认样本来自可能性很大。显然我们宁愿承认样本来自A。是样本。是样本“替替”我们我们“选择选择”了了A。 x6 x2 x3 x4 x5 x6 x7 x8 分布B分布A概率xb、最大似然法的概念、最大似然法的概念p上述事实诱导我们宁愿作出这样的抉择：将样本最容易来自上述事实诱导我们宁愿作出这样的抉择：将样本最容易来自的总体当作产生样本的总体。的总体当作产生样本的总体。p现在要根据从总体现在要根据从总体中抽取得到的样本中抽取得到的样本(x1,xn)对总体中对总体中的未知数的未知数进行估计。最大似然法是选择这样的估计量进行估计。最大似然法是选择这样的估计量作为作为的估计值，以便使观察结果的估计值，以便使观察结果(x1,xn)出现的可能性（概出现的可能性（概率）最大。率）最大。p对于离散型变量，就是要选择对于离散型变量，就是要选择使使p(x1)p(x2)p(xn)最大。最大。（连乘（连乘表示一次独立地抽取各个样本观察值）表示一次独立地抽取各个样本观察值）p对于连续型变量，就是要选择对于连续型变量，就是要选择使使 (x1) (x2). (xn)最大。最大。注意注意 (xi)是随机变量在是随机变量在xi附近取值的概率，相当于离散型的附近取值的概率，相当于离散型的p(xi)。c、似然法函数、似然法函数 d、最大似然法的定义和估计方法、最大似然法的定义和估计方法定义定义如果如果L(x1, x2,，xn;)在在处达到最大值，则称处达到最大值，则称是是的最大似然估计。的最大似然估计。为了取得为了取得的最大似然估计，必须使似然函数的最大似然估计，必须使似然函数L达到最达到最大值。由于对数函数是单增的，大值。由于对数函数是单增的，L达到最大亦即达到最大亦即LnL达到最达到最大。这样使大。这样使LnL达到最大来估计达到最大来估计为计算带来了许多方便。为计算带来了许多方便。根据拉格朗日定理，对未知参数求条件极值，令根据拉格朗日定理，对未知参数求条件极值，令LnL对对的一阶导数等于的一阶导数等于0，即，即dLnL/d =0 =得到似然方程，得到似然方程，所求的所求的就是似然方程中就是似然方程中的解。的解。注意：注意：当不只一个参数需要估计时，应将当不只一个参数需要估计时，应将LnL分别对不分别对不同参数求偏导，然后解似然方程组同参数求偏导，然后解似然方程组最大似然估计法对方差的估计往往是有偏估计最大似然估计法对方差的估计往往是有偏估计量，以后对线性模型估计时也是如此。量，以后对线性模型估计时也是如此。（3）最小二乘法）最小二乘法(Least Square Estimation Method)p最小二乘法是计量经济学中应用最广泛的一种估计方最小二乘法是计量经济学中应用最广泛的一种估计方法。法。p这是本课程研究的重点问题，在以后各章中将详尽地这是本课程研究的重点问题，在以后各章中将详尽地阐述它的原理、步骤、特性和优越处。阐述它的原理、步骤、特性和优越处。二、点估计方法二、点估计方法三三点估计量的特征点估计量的特征p所谓估计量的特性指的是衡量一个统计量用以所谓估计量的特性指的是衡量一个统计量用以估计总体参数的好坏标准。估计总体参数的好坏标准。p 点估计量的一些统计性质点估计量的一些统计性质（1）线性；（）线性；（2）无偏性；（）无偏性；（3）有效性；）有效性；（4）最优线性无偏估计量（）最优线性无偏估计量（BLUE）；）；（5）一致性）一致性（1）线性）线性p若若估计量是样本观察值的线性函数，则称该估计量是估计量是样本观察值的线性函数，则称该估计量是线性估计量线性估计量p样本均值是一个线性估计量样本均值是一个线性估计量（2）无偏性）无偏性无偏性的直观意义无偏性的直观意义根据样本推得的估计值和真值可能不同，然而如果根据样本推得的估计值和真值可能不同，然而如果有一系列抽样依据同一估计方法就可以得到一系列估有一系列抽样依据同一估计方法就可以得到一系列估计值，很自然会要求这些估计的期望值与未知参数的计值，很自然会要求这些估计的期望值与未知参数的真值相等。这就是无偏性的概念，无偏性的直观意义真值相等。这就是无偏性的概念，无偏性的直观意义是：样本估计量的数值在真值周围摆动，即无系统误是：样本估计量的数值在真值周围摆动，即无系统误差。差。无偏性的定义无偏性的定义的真值的真值的真值的真值有偏有偏无偏无偏例例4-3 无偏性是估计量最重要的优良性，是一个重复抽样的无偏性是估计量最重要的优良性，是一个重复抽样的性质，它只能保证估计量的期望等于真值。而且，对性质，它只能保证估计量的期望等于真值。而且，对于总体某个待定参数，其无偏估计量不只一个。例如于总体某个待定参数，其无偏估计量不只一个。例如样本中位数也是真实均值的无偏估计量。样本中位数也是真实均值的无偏估计量。（3）有效性）有效性总体某个参数总体某个参数的无偏估计量往往不只一个，而且无的无偏估计量往往不只一个，而且无偏性仅仅表明偏性仅仅表明的所有可能的取值按概率平均等于的所有可能的取值按概率平均等于，它，它的可能取值可能大部分与的可能取值可能大部分与相差很大。为保证相差很大。为保证的取值能的取值能集中于集中于附近，必须要求附近，必须要求的方差越小越好。所以，提出的方差越小越好。所以，提出有效性标准。有效性标准。有效性的定义有效性的定义例例4-4 比较总体均值两个无偏估计的有效性比较总体均值两个无偏估计的有效性无偏有效估计量的意义无偏有效估计量的意义（1）一个无偏有效估计量的取值在可能范围内最密集于）一个无偏有效估计量的取值在可能范围内最密集于附近。换言之，它以最大的概率保证估计量的取值在真附近。换言之，它以最大的概率保证估计量的取值在真值值附近摆动。附近摆动。（2）可以证明，样本均值是总体数学期望的有效估计量。）可以证明，样本均值是总体数学期望的有效估计量。（4）最优线性无偏估计量）最优线性无偏估计量如果一个估计量是线性的和无偏的，并且在参数如果一个估计量是线性的和无偏的，并且在参数的所有线性无偏估计量中，这个估计量的方差最小，的所有线性无偏估计量中，这个估计量的方差最小，则称这个估计量是最优线性无偏估计量（则称这个估计量是最优线性无偏估计量（best linear unbiased extimator，BLUE）。）。（5）一致性）一致性“依概率收敛依概率收敛”的定义的定义若存在常数若存在常数a，使对于任何，使对于任何0，有，有则称随机变量序列则称随机变量序列n依概率收敛于依概率收敛于a.一致性一致性一致性既是从概率又是从极限性质来定义的，因此只一致性既是从概率又是从极限性质来定义的，因此只有样本容量较大时才起作用。有样本容量较大时才起作用。p一致性作为评价估计量好坏的一个标准，计量经济学家一致性作为评价估计量好坏的一个标准，计量经济学家在无偏性和一致性之间更偏重选择一致性。在无偏性和一致性之间更偏重选择一致性。p虽然一个一致估计量可能在平均意义上与真值不同，但虽然一个一致估计量可能在平均意义上与真值不同，但是当样本容量加大时，它会变得与真值十分接近，即有是当样本容量加大时，它会变得与真值十分接近，即有偏的一致估计量具有大样本下的无偏性。同时，根据大偏的一致估计量具有大样本下的无偏性。同时，根据大数定律，当数定律，当n增大时，方差会变得很小，所以一致估计增大时，方差会变得很小，所以一致估计量具有大样本下的量具有大样本下的“无偏性无偏性”和和“有效性有效性”。4.3 区间估计区间估计p区间估计就是以一定的可靠性给出被估计参数的一个可能的取区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。值范围。p一般的，假定随机变量一般的，假定随机变量X服从某一概率分布，若要对其参数进服从某一概率分布，若要对其参数进行估计，选取容量为行估计，选取容量为n的随机样本，找出两个统计量的随机样本，找出两个统计量 1(x1,xn)与与 2 (x1,xn)，使，使P( 1 2 )=1- 其中其中( 1 , 2)称为置信区间，称为置信区间， 1- 称为置信系数（置信度），称为置信系数（置信度），称为显著性水平称为显著性水平或犯第一类错误的概率或犯第一类错误的概率, 一般取一般取5%或或1%。如果建立一个置信系数为如果建立一个置信系数为95%的置信区间，那么重复建立这的置信区间，那么重复建立这样的区间样的区间100次，预期有次，预期有95次包括了真实的次包括了真实的ux。对区间估计的形象比喻对区间估计的形象比喻我们经常说某甲的成绩我们经常说某甲的成绩“大概大概80分左右分左右”，可以看成，可以看成一个区间估计问题。（某甲的成绩一个区间估计问题。（某甲的成绩为被估计的参数）为被估计的参数） P( 1 2 )=大概的准确程度（大概的准确程度（ 1- ）如：如：P(75 85 )=95%=1-5%“大概大概80分左右分左右”冒险率冒险率（假设检验中叫显著水平）（假设检验中叫显著水平）下限下限上限上限例例4-5 如果随机变量如果随机变量XN(2) ，若要根据样本估计总体均值，若要根据样本估计总体均值，且方差未知，则总体均值且方差未知，则总体均值95的置信区间可由下式求得的置信区间可由下式求得（样本容量为（样本容量为50）即即ux的的95的置信区间为的置信区间为10.63 ux 该置信区间是随机的，它依赖于样本的取值，但总体均值该置信区间是随机的，它依赖于样本的取值，但总体均值取某一固定值，是非随机的，所有不能说取某一固定值，是非随机的，所有不能说ux位于区间的概位于区间的概率是率是0.95, 只能说这个区间包括真实只能说这个区间包括真实ux的概率是的概率是0.95. 2.5%95%2.5%0t分布分布（d.f.=49)一、对总体期望值的估计一、对总体期望值的估计（1）已知方差，对总体数学期望）已知方差，对总体数学期望E = 进行区间估计进行区间估计（正态总体）（正态总体）/2/21-假设总体服从正态分布假设总体服从正态分布N( ,8), 求求的的置信区间置信区间例例4-6 本节例本节例4-1中再假设总体服从正态分布，总体方差中再假设总体服从正态分布，总体方差为为8，求电子管寿命的置信区间（，求电子管寿命的置信区间（ =5%）。）。（2）方差未知，对数学期望）方差未知，对数学期望E 进行区间估计进行区间估计大样本下大样本下根据中心极限定理，根据中心极限定理，V 可以用可以用S2代替，所以仍按已知代替，所以仍按已知方差正态分布的方法进行方差正态分布的方法进行的置信区间估计。的置信区间估计。小样本下小样本下例例4-7 新生儿体重的置信区间新生儿体重的置信区间假设新生儿（男）的体重服从正态分布。随机抽取假设新生儿（男）的体重服从正态分布。随机抽取12名新生儿，测得体重如下表，试以名新生儿，测得体重如下表，试以95%的置信度估计的置信度估计新生儿（男）的平均体重。新生儿（男）的平均体重。二、对总体方差的估计二、对总体方差的估计（未知（未知u时对总体方差进行区间估计）时对总体方差进行区间估计）总体方差区间估计的例题总体方差区间估计的例题例例4-8 冷拔丝的抗拉强度服从正态分布冷拔丝的抗拉强度服从正态分布N(,2) ，现从一，现从一批铜丝中任取批铜丝中任取10根，测的抗拉强度数据（单位：根，测的抗拉强度数据（单位：N）如）如下：下：578、572、570、568、572、570、570、596、584、572，求，求2 的置信度为的置信度为90%的置信区间的置信区间.解：样本均值与方差的观测值分别为：解：样本均值与方差的观测值分别为：三、关于区间估计的几点说明三、关于区间估计的几点说明p在进行区间估计时，应针对不同的情况，采用不同的在进行区间估计时，应针对不同的情况，采用不同的方法。例如分清分布的形式是已知或是未知；是大样方法。例如分清分布的形式是已知或是未知；是大样本或是小样本；小样本（估计总体数学期望时）又分本或是小样本；小样本（估计总体数学期望时）又分清是已知方差或是未知方差等。充分利用分布信息可清是已知方差或是未知方差等。充分利用分布信息可以得到较精确的估计。以得到较精确的估计。p一般地，一般地，越大置信度越低，置信区间越长；反之，则越大置信度越低，置信区间越长；反之，则反。反。4.4 假设检验假设检验一、假设检验的概念一、假设检验的概念二、显著性检验二、显著性检验三、置信区间法三、置信区间法四、假设检验的应用四、假设检验的应用单正态总体的假设检验单正态总体的假设检验一、假设检验的概念一、假设检验的概念p定义：称对任何一个随机变量未知分布的假设为统计定义：称对任何一个随机变量未知分布的假设为统计假设，简称假设，简称假设假设。p一个仅涉及到随机变量分布中未知参数的假设称为一个仅涉及到随机变量分布中未知参数的假设称为参参数假设数假设。一个仅涉及到随机变量分布的形式而不涉及。一个仅涉及到随机变量分布的形式而不涉及到未知参数的假设称为到未知参数的假设称为非参数假设非参数假设。p提出一个统计假设的关键是将一个实际的研究问题用提出一个统计假设的关键是将一个实际的研究问题用数学语言转换为统计假设。数学语言转换为统计假设。例例4-9.检验一个硬币是否均匀检验一个硬币是否均匀抛掷一个硬币抛掷一个硬币100次，次，“正面正面”出现出现60次，问此硬币是否次，问此硬币是否均匀？均匀？分析：分析：若用若用X描述抛掷硬币的试验，描述抛掷硬币的试验，“X=1”和和“X=0”分别表示分别表示“出现正面出现正面”和和“出现反面出现反面”。上述问题就是检验。上述问题就是检验X是否是否可以被认为服从的可以被认为服从的01分布。分布。问题是分布形式已知，检验参数的假设。记作，问题是分布形式已知，检验参数的假设。记作，H0:p=0.5 H1零假设与备择假设零假设与备择假设p在统计假设在统计假设H0:p=0.5 H1中，中， H0称为零假设或原称为零假设或原假设，是进行统计假设检验欲确定其是否成立的假设假设，是进行统计假设检验欲确定其是否成立的假设体现我们进行假设检验的目的。体现我们进行假设检验的目的。pH1称为备择假设，统计假设检验是二择一的判断，当称为备择假设，统计假设检验是二择一的判断，当不成立时，不得不接受它。不成立时，不得不接受它。p假设检验包括置信区间法和显著性检验法假设检验包括置信区间法和显著性检验法例例4-10 检验新生女婴体重是否等于某个既定值检验新生女婴体重是否等于某个既定值p从从2003年出生的女婴中随机地抽取年出生的女婴中随机地抽取20名，测得平均体名，测得平均体重重=3160克，标准差克，标准差=300克，根据已有的统计资料新生克，根据已有的统计资料新生女婴的体重女婴的体重=3140克，问现在与过去新生女婴的体重是克，问现在与过去新生女婴的体重是否有变化？否有变化？p分析：把分析：把2003年出生的女婴视为一个总体，用年出生的女婴视为一个总体，用X描述，描述，问题就是判断：问题就是判断： H0:EX=3140 H1 :EX 3140 因为通常可以假定经过量测得到的资料是服从正态分因为通常可以假定经过量测得到的资料是服从正态分布的，无须检验总体的分布形式，显然这是一个关于布的，无须检验总体的分布形式，显然这是一个关于参数的假设检验问题。参数的假设检验问题。二、显著性检验二、显著性检验（1）两类错误的概念）两类错误的概念（2）Neyman-Pearson方法方法（3）显著性水平与）显著性水平与P值值（4）几类特殊的显著性检验）几类特殊的显著性检验（1）两类错误的概念）两类错误的概念由于假设检验是从样本到总体，因而结果不可能绝对由于假设检验是从样本到总体，因而结果不可能绝对正确，它有可能是错误的；而且出现错误可能性的大正确，它有可能是错误的；而且出现错误可能性的大小，也是以统计规律（小概率原理）为依据的。所可小，也是以统计规律（小概率原理）为依据的。所可能犯的错误有两类：能犯的错误有两类：p第一类第一类弃真，原假设符合实际情况，而检验结果把它否弃真，原假设符合实际情况，而检验结果把它否定了。设犯这类错误的概率为定了。设犯这类错误的概率为，那么，那么 =p(否定否定H0/H0实际上为真实际上为真)。为显著性水平为显著性水平p第二类第二类取伪，原假设不符合实际情况，而检验结果却把取伪，原假设不符合实际情况，而检验结果却把它肯定下来。设犯这类错误的概率为它肯定下来。设犯这类错误的概率为，那么，那么 =p(接受接受H0/H0实际上不正确实际上不正确)。1- 称为检验的功效称为检验的功效（2）Neyman-Pearson方法方法p自然希望犯两类错误的概率都越小越好。但对一定的自然希望犯两类错误的概率都越小越好。但对一定的样本容量样本容量n，一般都不能做到犯这两类错误的概率同时一般都不能做到犯这两类错误的概率同时都小。由于减小都小。由于减小 =增大增大，或者减小，或者减小 =增大增大。一。一般愿意使犯般愿意使犯”第一类错误第一类错误“的概率的概率较小，则拒绝错了较小，则拒绝错了的概率就较小的概率就较小，而不考虑而不考虑。pNeyman-Pearson提出提出了一种方法：先固定犯了一种方法：先固定犯“第一类第一类错误错误”的概率的概率，再考虑如何减小犯，再考虑如何减小犯“第二类错误第二类错误”的概率的概率，也称，也称Fix ,Min 方法。当方法。当确定以后，让确定以后，让尽量的小，尽量的小，1- 就越大，称不犯就越大，称不犯“第二类错误第二类错误”的概率的概率为为“检验的功效（检验的功效（Power of test）。）。（3）显著性水平与）显著性水平与P值值显著水平指的是犯显著水平指的是犯“第一类错误第一类错误”的可能性，在给定的可能性，在给定的小概率的小概率下，零假设几乎是不可能发生的，可以认为下，零假设几乎是不可能发生的，可以认为零假设零假设H0是错的，必须抛弃它。同时，即使抛弃零假是错的，必须抛弃它。同时，即使抛弃零假设设H0，这时也只需冒这时也只需冒的风险，的风险，抛弃抛弃H0的可靠性的可靠性则为则为1- 。如果假设事关重大，譬如人命关载人的宇宙飞船升空如果假设事关重大，譬如人命关载人的宇宙飞船升空或药品试验，则必须提高差异显著水平即减小或药品试验，则必须提高差异显著水平即减小，使我，使我们不能轻易地拒绝们不能轻易地拒绝H0。否则，则可以降低显著水平否则，则可以降低显著水平。检验（统计量）是统计显著检验（统计量）是统计显著的一般是指能够拒绝零假设，的一般是指能够拒绝零假设，即观察到的样本值与假设值不同的概率非常小，小于即观察到的样本值与假设值不同的概率非常小，小于（犯第一类错误的概率）；检验是统计不显著的，是指（犯第一类错误的概率）；检验是统计不显著的，是指不能拒绝零假设。不能拒绝零假设。为了避免在选择显著性水平时的任意性，可以计算检验为了避免在选择显著性水平时的任意性，可以计算检验的的p值。检验的值。检验的p值值(p-value)是指给定是指给定t统计量的观测值，统计量的观测值，能拒绝虚拟假设的最小显著性水平。小的能拒绝虚拟假设的最小显著性水平。小的p值是拒绝虚值是拒绝虚拟假设的证据。拟假设的证据。例例4-11：df=40, t（检验统计量的数值），则针对双侧对（检验统计量的数值），则针对双侧对立假设来检验虚拟假设立假设来检验虚拟假设的的p值为值为以上以上p值意味着，如果虚拟假设正确，那么我们约有值意味着，如果虚拟假设正确，那么我们约有7.2%次观察到次观察到t统计量的绝对值至少和一样大。可以看出，统计量的绝对值至少和一样大。可以看出， p值越小，对应的统计量值值越小，对应的统计量值t应该越大，越可能拒绝应该越大，越可能拒绝H0。面积-1.851.85面积0.0359面积0.0359如果用如果用表示检验的显著性水平（小数形式），那么表示检验的显著性水平（小数形式），那么p值值时，时，则则拒绝虚拟假设，否则在拒绝虚拟假设，否则在100 %显著性水平下，显著性水平下，不能拒绝不能拒绝H0。注意注意（1）对于线性回归方程，一般软件包报告了回归系数及对于线性回归方程，一般软件包报告了回归系数及标准误，并且给出了针对双侧对立假设的标准误，并且给出了针对双侧对立假设的p值，将其除以值，将其除以2，即可得到单侧对立假设的，即可得到单侧对立假设的p值；值；（2）随着样本容量的扩大，一般使用较小的显著性水平，随着样本容量的扩大，一般使用较小的显著性水平，以作为抵偿标准误越来越小的一种办法；对于小样本容以作为抵偿标准误越来越小的一种办法；对于小样本容量，可以接受较大的显著性水平，可以让大到量，可以接受较大的显著性水平，可以让大到（4）几类特殊的显著性检验）几类特殊的显著性检验pt检验：未知总体方差，检验总体均值检验：未知总体方差，检验总体均值单侧检验（单侧检验（one-tail test）或双边检验）或双边检验关于关于t检验的两种类型比较见检验的两种类型比较见73页页例例4-12： H0：ux=13, H1：ux 13, 并且并且进行进行t检验。检验。p卡方显著性检验：检验总体方差卡方显著性检验：检验总体方差随机样本来自方差为随机样本来自方差为2的正态总体，其样本容量为的正态总体，其样本容量为n，样本方差为样本方差为S2，则则例例4-13：假定随机样本来自正态总体，样本容量为：假定随机样本来自正态总体，样本容量为35，样本方差为样本方差为12，零假设为真实的方差为，零假设为真实的方差为9；备择假设为真；备择假设为真实的方差不等于实的方差不等于9，显著性水平为，显著性水平为5%。进行卡方显著性。进行卡方显著性检验。检验。卡方显著性检验小结（卡方显著性检验小结（P74）p F显著性检验：显著性检验：检验两个正态总体方差是否相等检验两个正态总体方差是否相等如果如果X、Y是来自两正态总体的随机样本，自由度分别为是来自两正态总体的随机样本，自由度分别为m和和n，则变量则变量例例4-14：假设男女学生分数的方差分别为：假设男女学生分数的方差分别为和和，其样本观察，其样本观察值为值为24、23，假设这些方差代表了来自于一更大总体的样，假设这些方差代表了来自于一更大总体的样本。检验假设：男女学生数学分数总体同方差，显著性水本。检验假设：男女学生数学分数总体同方差，显著性水平为平为1。F显著性检验小结见显著性检验小结见P75三、置信区间法三、置信区间法置信区间法提供提供某一置信度（例如置信区间法提供提供某一置信度（例如95%）的真实的）的真实的ux的取值范围，比如的取值范围，比如ux12.36, 如果这个区间不包括零假设中的值，比如如果这个区间不包括零假设中的值，比如ux =13，那么我们说以，那么我们说以95%的置信度拒绝该零假的置信度拒绝该零假设。设。用假设检验的语言，不等式描述的置信区间称为接受区用假设检验的语言，不等式描述的置信区间称为接受区域（域（acceptance region），接受区域以外的称为零假设），接受区域以外的称为零假设的临界区域（的临界区域（critical region）或拒绝区域（）或拒绝区域（region of rejection)，接受区域的上界和下界称为临界值（，接受区域的上界和下界称为临界值（critical values）。如果参数值在零假设下位于接受区域内，则）。如果参数值在零假设下位于接受区域内，则不拒绝零假设，但如果落在接受区域以外，则拒绝零假不拒绝零假设，但如果落在接受区域以外，则拒绝零假设。设。三、置信区间法三、置信区间法通过求置信区间进行假设检验的例子通过求置信区间进行假设检验的例子例例4-14 根据长期经验和资料分析，某砖厂生产的砖的根据长期经验和资料分析，某砖厂生产的砖的“抗断强度抗断强度”服从正态分布，方差，今从该厂生产的服从正态分布，方差，今从该厂生产的砖中随机地抽取砖中随机地抽取6块砖，测得强度如下（单位千克块砖，测得强度如下（单位千克/cm2）：检验这批砖的平均抗断强度为千克）：检验这批砖的平均抗断强度为千克/cm2是否成立是否成立（）？）？解：解：H0:首先求首先求的置信区间：的置信区间：四、假设检验的应用四、假设检验的应用单正态总体的假设检验单正态总体的假设检验设总体设总体 N（， 2），对于其参数），对于其参数， 2的假设检验，讨的假设检验，讨论论3种情况：种情况：已知方差已知方差 2 ，检验假设，检验假设H0： = 0未知方差未知方差 2 ，检验假设，检验假设H0： = 0未知期望未知期望，检验假设，检验假设H0： 2= 20其中，其中， H0中的中的 0和和 20均是已知的数。均是已知的数。已知已知总体方差，检验总体均值等于定值总体方差，检验总体均值等于定值1、提出零假设、提出零假设 H0： = 0 H1： 0 （双侧检验）（双侧检验）2、根据抽样所得样本计算检验统计量、根据抽样所得样本计算检验统计量3、确定显著水平、确定显著水平（或）和相应的临界值（或）和相应的临界值u/24、将计算的、将计算的U与与u/2进行比较。如果进行比较。如果U落在拒绝域内，则拒落在拒绝域内，则拒绝绝H0，否则接收，否则接收H0未知总体方差，检验总体均值等于定值未知总体方差，检验总体均值等于定值例例4-15 从从2003年出生的新生女婴中随机抽取年出生的新生女婴中随机抽取20 个，测个，测得其平均体重为得其平均体重为3160克，样本标准差为克，样本标准差为300克，根据过克，根据过去的资料，新生女婴平均体重等于去的资料，新生女婴平均体重等于3140 克，问现在女克，问现在女婴体重与过去有无差别（婴体重与过去有无差别（）？）？未知总体数学期望，检验总体方差等于定值未知总体数学期望，检验总体方差等于定值例例4-16 某铁厂的铁水含碳量某铁厂的铁水含碳量在正常情况下服从正态分在正常情况下服从正态分布，现对操作工艺进行改进，然后抽取布，现对操作工艺进行改进，然后抽取5炉铁水测得含碳炉铁水测得含碳量数据如下：量数据如下：问是否可以认为新工艺炼出的铁水含碳量的方差为原先问是否可以认为新工艺炼出的铁水含碳量的方差为原先的的2( =0.05)?统计检验的基本步骤统计检验的基本步骤第一步：表述零假设和备择假设；第一步：表述零假设和备择假设；第二步：选择检验统计量；第二步：选择检验统计量；第三步：确定检验统计量的概率分布；第三步：确定检验统计量的概率分布；第四步：选择显著水平，即犯第一类错误的概率；第四步：选择显著水平，即犯第一类错误的概率；第五步：选择置信区间法或显著检验方法第五步：选择置信区间法或显著检验方法