资源预览内容
第1页 / 共54页
第2页 / 共54页
第3页 / 共54页
第4页 / 共54页
第5页 / 共54页
第6页 / 共54页
第7页 / 共54页
第8页 / 共54页
第9页 / 共54页
第10页 / 共54页
亲,该文档总共54页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计量资料统计推断PPT课件s统计推断:用样本信息推断总体特征。 包括参数估计和假设检验。参数估计:用样本指标(统计量)估计总体指标 (参数)。计量资料统计推断PPT课件一、抽样分布与抽样误差一、抽样分布与抽样误差1.1.样本均数的抽样分布与抽样误差样本均数的抽样分布与抽样误差计量资料统计推断PPT课件组段下限值组段下限值频数频数频率频率% %152.6-152.6-1 11.01.0153.2-153.2-4 44.04.0153.8-153.8-4 44.04.0154.4-154.4-222222.022.0155.0-155.0-252525.025.0155.6-155.6-212121.021.0156.2-156.2-171717.017.0156.8-156.8-3 33.03.0157.4-157.4-2 22.02.0158.0-158.0-1 11.01.0合计合计100100100.0100.0从正态总体从正态总体N N(155.4155.4,5.35.32 2)抽样得到的)抽样得到的100100个个样本均数的频数分布(样本均数的频数分布( )计量资料统计推断PPT课件计量资料统计推断PPT课件v样本均数的分布规律:样本均数的分布规律:s1.1.各样本均数未必等于总体均数。各样本均数未必等于总体均数。s2.2.样本均数之间存在差异。样本均数之间存在差异。s3.3.样本均数的分布很有规律,围绕着总体均数,中样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,也服从正态分布。间多,两边少,左右基本对称,也服从正态分布。s4.4.样本均数的变异较之原变量的变异大大缩小。样本均数的变异较之原变量的变异大大缩小。计量资料统计推断PPT课件s均数的抽样误差:均数的抽样误差:由抽样造成的样本均数与样本由抽样造成的样本均数与样本均数之间、样本均数与总体均数之间的差异,称均数之间、样本均数与总体均数之间的差异,称为抽样误差。为抽样误差。s样本均数的标准误样本均数的标准误(standard error of mean(standard error of mean,SE)SE):用于描述均数抽样误差大小的指标叫样本用于描述均数抽样误差大小的指标叫样本均数的标准差,通常也称为样本均数的标准误。均数的标准差,通常也称为样本均数的标准误。它反映样本均数的离散程度,也反映样本均数抽它反映样本均数的离散程度,也反映样本均数抽样误差的大小。用样误差的大小。用 表示。表示。计量资料统计推断PPT课件s中心极限定理一:中心极限定理一:在均数为在均数为,标准差为,标准差为的正态的正态总体中作随机抽样,则样本均数服从正态分布,样总体中作随机抽样,则样本均数服从正态分布,样本均数的均数为本均数的均数为,标准差为,标准差为 ,即:,即: 在实际应用中,总体标准差在实际应用中,总体标准差常常未知,需要用常常未知,需要用样本标准差样本标准差S S来估计。即样本均数标准误的估计值来估计。即样本均数标准误的估计值为为计量资料统计推断PPT课件s中心极限定理二:中心极限定理二:在非正态分布的总体中随机在非正态分布的总体中随机抽样,样本均数的均数仍等于原来的总体均数抽样,样本均数的均数仍等于原来的总体均数,样本均数的标准误,样本均数的标准误 ,但是当样本,但是当样本量较小时,样本均数的分布并非正态分布,而量较小时,样本均数的分布并非正态分布,而当样本量足够大时,样本均数的分布近似正态当样本量足够大时,样本均数的分布近似正态分布。分布。计量资料统计推断PPT课件s例例4-1 20004-1 2000年某研究者随机调查某地健康成年男年某研究者随机调查某地健康成年男子子2727人,得到血红蛋白量的均数为人,得到血红蛋白量的均数为125g/L125g/L,标准,标准差为差为15g/L15g/L。试估计该样本均数的抽样误差。试估计该样本均数的抽样误差。s解:解:计量资料统计推断PPT课件s标准差与标准误的关系:区别标准差与标准误的关系:区别 1. 1.意义意义:标准差标准差描述个体观察值间变异描述个体观察值间变异, ,即观察值间的离散度。即观察值间的离散度。s标标准准误误描描述述统统计计量量的的抽抽样样误误差差,即即样样本本统统计计量量与与总总体体参参数数的的接接近程度。近程度。 2. 2.用途:标准差常用于:用途:标准差常用于: 表表示示观观察察值值之之间间的的波波动动大大小小。当当资资料料服服从从正正态态分分布布时时,可可结结合均数估计正常值范围,如计算双侧合均数估计正常值范围,如计算双侧95%95%正常值范围。正常值范围。 标准误常用于:标准误常用于: 表表示示抽抽样样误误差差的的大大小小。估估计计参参数数的的可可信信区区间间,如如计计算算总总体体均均数的数的95%95%可信区间。可信区间。 3.3.标标准准差差、标标准准误误与与样样本本含含量量的的关关系系: :标标准准差差随随着着样样本本含含量量的的增增多多, ,逐逐渐渐趋趋于于稳稳定定, ,标标准准误误随随着着样样本本含含量量的的增增加加逐逐渐渐减减小小,若若样样本含量趋近于总体例数本含量趋近于总体例数, ,则标准误趋近于则标准误趋近于0,0,抽样误差几乎消失。抽样误差几乎消失。计量资料统计推断PPT课件联系:联系: 1.1.标标准准差差与与标标准准误误都都是是变变异异指指标标,说说明明个个体体值值之之间间的的变异用标准差,说明统计量之间的变异用标准误。变异用标准差,说明统计量之间的变异用标准误。2.2.当当样样本本含含量量不不变变时时,标标准准差差越越大大标标准准误误越越大大,即即均均数的标准误与标准差呈正比数的标准误与标准差呈正比。计量资料统计推断PPT课件二、二、t t 分布分布大样本、小样本概念:大样本、小样本概念:3030、5050、100100。量变引起质变:当样本容量较大时,其统计量的抽样量变引起质变:当样本容量较大时,其统计量的抽样分布近似为正态分布。随着分布近似为正态分布。随着N N的增大,越来越接近于正的增大,越来越接近于正态分布(样本均数的分布)。态分布(样本均数的分布)。但当样本量小于但当样本量小于100100时,抽样分布不能再用正态分布来时,抽样分布不能再用正态分布来近似,随着近似,随着N N的减小,与正态分布的差别越来越大,需的减小,与正态分布的差别越来越大,需要用小样本理论来解释(样本均数的分布)。要用小样本理论来解释(样本均数的分布)。计量资料统计推断PPT课件 1.1.概念概念 从正态分布从正态分布N N(,2 2)抽得的样本均数)抽得的样本均数 服从态服从态分布分布 , ,对样本均数对样本均数 做标准化变换做标准化变换。计量资料统计推断PPT课件英国统计学家英国统计学家W.S.GossetW.S.Gosset证明它服从自由度证明它服从自由度 的的t t分布,即分布,即计量资料统计推断PPT课件计量资料统计推断PPT课件st t 分布曲线的特征分布曲线的特征s单峰分布,以单峰分布,以0 0为中心,左右对称,类似于标准为中心,左右对称,类似于标准正态分布。正态分布。s自由度自由度越小,则越小,则 越大,越大,t t 值越分散,曲值越分散,曲线的峰部越矮,尾部越粗。线的峰部越矮,尾部越粗。s随着自由度随着自由度逐渐增大,逐渐增大,t t分布逐渐逼近标准正分布逐渐逼近标准正态分布;当态分布;当趋于趋于时,时,t t分布就完全成为标准正分布就完全成为标准正态分布。故标准正态分布是态分布。故标准正态分布是t t分布的特例。分布的特例。计量资料统计推断PPT课件三、假设检验三、假设检验显著性检验显著性检验; ;科研数据处理的重要工具科研数据处理的重要工具; ;某事发生了:是由于碰巧?某事发生了:是由于碰巧?还是由于必然的原因?统计还是由于必然的原因?统计学家运用显著性检验来处理学家运用显著性检验来处理这类问题。这类问题。计量资料统计推断PPT课件s假设检验:假设检验:s1 1、原因、原因s2 2、目的、目的s3 3、原理、原理s4 4、过程(步骤)、过程(步骤)s5 5、结果、结果计量资料统计推断PPT课件1. 1. 假设检验的原因假设检验的原因 由于个体差异的存在,即使从同一总体中严格的由于个体差异的存在,即使从同一总体中严格的随机抽样,随机抽样,X X1 1、X X2 2、X X3 3、X X4 4,不同。因此,不同。因此,X X1 1、X X2 2 不同不同有两种(而且只有两种)可能:有两种(而且只有两种)可能: (1)(1)分别所代表的总体均数相同,由于抽样误差造分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性成了样本均数的差别。差别无显著性 。 (2) (2)分别所代表的总体均数不同。差别有显著性。分别所代表的总体均数不同。差别有显著性。计量资料统计推断PPT课件s判断是由于何种原因造成的不同,以便做出判断是由于何种原因造成的不同,以便做出决策决策。2. 2. 假设检验的目的假设检验的目的计量资料统计推断PPT课件3.3.假设检验的原理假设检验的原理/ /思想思想 反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能A A和和B B,为了肯定其中的一种情况为了肯定其中的一种情况A A,但又不能直接证实,但又不能直接证实A A,这时否定另一种可能,这时否定另一种可能B B,则间接的肯定了,则间接的肯定了A A。 概率论(小概率):如果一件事情发生的概率很概率论(小概率):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是小,那么在进行一次试验时,我们说这个事件是“不会发生的不会发生的”。从一般的常识可知,这句话在。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。时候,因为概率再小也是有可能发生的。计量资料统计推断PPT课件4. 4. 假设检验的一般步骤假设检验的一般步骤 建立假设(反证法):建立假设(反证法): 确定显著性水平确定显著性水平( ( ): ): 计算统计量:计算统计量:u,tu,t, 2 2 确定概率值:确定概率值: 做出推论做出推论计量资料统计推断PPT课件 (1 1)建立假设:)建立假设: 检验假设或者称无效假设(检验假设或者称无效假设(null hypothesis)null hypothesis),用用H H0 0表示,表示, H H0 0假设是假设两总体均数相等。假设是假设两总体均数相等。 备择假设备择假设(alternative hypothesis),(alternative hypothesis),用用H H1 1表示。表示。 H H1 1是与是与H0H0相反的假设,假设两总体均数不相等。相反的假设,假设两总体均数不相等。计量资料统计推断PPT课件 (2 2)确定显著性水平)确定显著性水平(significance level )(significance level ) 显著性水平显著性水平( ( ) )就是我们用来区分大概率事件和就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生小概率事件的标准,是人为规定的。当某事件发生的概率小于的概率小于 时,则认为该事件为小概率事件,是时,则认为该事件为小概率事件,是不太可能发生的事件。通常不太可能发生的事件。通常 取取0.050.05或或0.010.01。计量资料统计推断PPT课件 (3 3)计算统计量)计算统计量 根据资料类型与分析目的选择适当的公式计根据资料类型与分析目的选择适当的公式计算出统计量,比如计算出算出统计量,比如计算出 u u 值值 或或 t t 值。值。 注意注意:在检验假设成立的情况下,才会出现:在检验假设成立的情况下,才会出现的分布类型或公式。的分布类型或公式。计量资料统计推断PPT课件 (4 4)确定概率值()确定概率值(P P) 将计算得到的将计算得到的u u值或值或t t值与查表得到值与查表得到u u 或或t t , , ,比较,得到比较,得到P P值的大小。根据值的大小。根据u u分布和分布和t t分布我们分布我们知道,如果知道,如果|u|u|u|u 或或|t|u|t|u ,则,则 P P ;如果;如果|u|u|u|u 或或|t|u|t|P 。计量资料统计推断PPT课件 (5 5)作出推断结论)作出推断结论 如果如果pp ,认为在检验假设,认为在检验假设H H0 0成立的条件下,得到成立的条件下,得到等于或大于现有统计量等于或大于现有统计量u u值或值或t t值的可能性大于值的可能性大于 ,不,不属于小概率事件,则不拒绝属于小概率事件,则不拒绝H H0 0,差别无统计学意义,差别无统计学意义,结论是不认为两总体均数不相等。结论是不认为两总体均数不相等。如果如果pp1.96, p1.96, p0.05= ,小概率事件发生了,原,小概率事件发生了,原假设不成立;拒绝假设不成立;拒绝H H0 0 , , 接受接受H H1 1,可认为:可认为:某校女大某校女大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数差别有显著性。学生身高均数与一般女子身高均数差别有显著性。 计算统计量:计算统计量:u u 统计量:统计量: u= u= 确定概率值:确定概率值: |u|=9.58|u|=9.58,u u =1.96=1.96,uuuu ,pp = =0.05; 0.05; 计量资料统计推断PPT课件2 2、小样本、小样本已知中学一般男生的心率平均为已知中学一般男生的心率平均为7474次次/ /分钟。为了研分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生体育锻炼的男生1616名,测量他们的心率,结果平均名,测量他们的心率,结果平均心率为心率为65.6365.63次次/ /分,标准差为分,标准差为7.27.2次次/ /分。有体育锻分。有体育锻炼的男生心率是否与一般男生不同?炼的男生心率是否与一般男生不同?计量资料统计推断PPT课件目的:目的:比较一个小样本均数所代表的未知总体均数比较一个小样本均数所代表的未知总体均数 与已知的总体均数有无差别。与已知的总体均数有无差别。计算公式:计算公式: t t 统计量:统计量:t=t= 自由度:自由度: = =n-1n-1计量资料统计推断PPT课件 适用条件:适用条件:(1)(1)已知一个总体均数;已知一个总体均数;(2)(2)可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误;(3)(3)样本量样本量小于小于100100;(4)(4)样本来自正态或近似正态总体。样本来自正态或近似正态总体。计量资料统计推断PPT课件例题:例题:已知:已知:(1) (1) 一个总体均数:一个总体均数:7474次次/ /分分 ; ;(2) (2) 一个样本均数:一个样本均数:65.6365.63次次/ /分分 ; ;(3) (3) 可计算出样本标准误:可计算出样本标准误:7.2/7.2/16=1.816=1.8(4) n=16100;(4) n=16ttt0.05(25) 0.05(25) , p0.05, p0.05 做出推论做出推论: : p0.05 p0.05ttt0.05(58)0.05(58),p0.05; ,p0.05; 做出推论做出推论: : 因为因为p0.05p0.05t t=7.826t0.05(9)0.05(9) p0.05 p0.05判断结果:因为判断结果:因为p0.05,p0.05,故拒绝检验假设故拒绝检验假设H0H0,1010名名病人透析前后病人透析前后血中尿素氮含量血中尿素氮含量差异有显著性差异有显著性, ,即透析即透析可以降低可以降低血中尿素氮含量血中尿素氮含量。计量资料统计推断PPT课件1. 1. 正确理解假设检验的结论(概率性)正确理解假设检验的结论(概率性) 假设检验的结论是根据概率推断的,所以不是绝对假设检验的结论是根据概率推断的,所以不是绝对正确的:正确的:(1)(1)当当ppp , , 不能拒绝不能拒绝H H0 0, , 不能接受不能接受H H1 1,按不能接按不能接受受H H1 1下结论,也可能犯错误;下结论,也可能犯错误;七、均数假设检验的注意事项七、均数假设检验的注意事项计量资料统计推断PPT课件2. 2. 第第第第I I I I类错误和第类错误和第类错误和第类错误和第IIIIIIII类错误类错误类错误类错误 假设检验的结果有两种假设检验的结果有两种假设检验的结果有两种假设检验的结果有两种: : : :J(1)(1)当当拒绝拒绝H H0 0时时, ,可能犯错误,可能可能犯错误,可能拒绝了实际上拒绝了实际上成立的成立的H H0 0,称为称为类错误(类错误(“弃真弃真”的错误),其的错误),其概率大小用概率大小用表示表示。 J(2(2)当)当不能拒绝不能拒绝H H0 0 时,也可能犯错误,时,也可能犯错误,没有拒绝没有拒绝实际上不成立的实际上不成立的H H0 0, , 这类称为这类称为IIII类错误(类错误(“存伪存伪”的错误)的错误), ,其概率大小用其概率大小用表示表示, ,值一般不能值一般不能确切的知道确切的知道。计量资料统计推断PPT课件II II 类错误的概率类错误的概率 值的两个规律:值的两个规律:1.1.当样本量一定时当样本量一定时, , 愈小愈小, , 则则愈大,反之愈大,反之;2.2.当当一定时一定时, , 样本量增加样本量增加, , 减少。减少。计量资料统计推断PPT课件3.3.统计学中的差异显著或不显著,和日常生活中统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同所说的差异大小概念不同(不仅区别于均数差异(不仅区别于均数差异的大小,还区别于均数变异的大小的大小,还区别于均数变异的大小) )。4.4.4.4.其它注意事项其它注意事项其它注意事项其它注意事项选择假设检验方法要注意符合其应用条件;选择假设检验方法要注意符合其应用条件;当不能拒绝当不能拒绝H H0 0时,即差异无显著性时,应考虑时,即差异无显著性时,应考虑 的因素:可能是样本例数不够;的因素:可能是样本例数不够;单侧检验与双侧检验的问题单侧检验与双侧检验的问题计量资料统计推断PPT课件
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号