资源预览内容
第1页 / 共72页
第2页 / 共72页
第3页 / 共72页
第4页 / 共72页
第5页 / 共72页
第6页 / 共72页
第7页 / 共72页
第8页 / 共72页
第9页 / 共72页
第10页 / 共72页
亲,该文档总共72页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
会计学1抽样误差与假设检验抽样误差与假设检验(jinyn)t检验检验(jinyn)第一页,共72页。n n几个概念:几个概念:几个概念:几个概念:n n计量资料:测定每个观察单位某项指标量的大小得到计量资料:测定每个观察单位某项指标量的大小得到计量资料:测定每个观察单位某项指标量的大小得到计量资料:测定每个观察单位某项指标量的大小得到(ddo)(ddo)(ddo)(ddo)的数据(资料)。的数据(资料)。的数据(资料)。的数据(资料)。n n总体:研究对象(某项变量值)的全体。总体:研究对象(某项变量值)的全体。总体:研究对象(某项变量值)的全体。总体:研究对象(某项变量值)的全体。n n样本:总体中随机抽取的一部分研究对象的某项变量样本:总体中随机抽取的一部分研究对象的某项变量样本:总体中随机抽取的一部分研究对象的某项变量样本:总体中随机抽取的一部分研究对象的某项变量值。值。值。值。n n统计量:从样本计算出来的统计指标。统计量:从样本计算出来的统计指标。统计量:从样本计算出来的统计指标。统计量:从样本计算出来的统计指标。n n参数:总体的统计指标叫总体参数。参数:总体的统计指标叫总体参数。参数:总体的统计指标叫总体参数。参数:总体的统计指标叫总体参数。第1页/共71页第二页,共72页。n n统计推断:用样本信息推论总体特征的过程。统计推断:用样本信息推论总体特征的过程。统计推断:用样本信息推论总体特征的过程。统计推断:用样本信息推论总体特征的过程。n n包括:包括:包括:包括:n n参数估计参数估计参数估计参数估计:运用统计学原理,用从样本计算出来的统运用统计学原理,用从样本计算出来的统运用统计学原理,用从样本计算出来的统运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。计指标量,对总体统计指标量进行估计。计指标量,对总体统计指标量进行估计。计指标量,对总体统计指标量进行估计。n n假设检验:又称显著性检验,是指由样本间存在的差假设检验:又称显著性检验,是指由样本间存在的差假设检验:又称显著性检验,是指由样本间存在的差假设检验:又称显著性检验,是指由样本间存在的差别别别别(chbi)(chbi)(chbi)(chbi)对样本所代表的总体间是否存在着差别对样本所代表的总体间是否存在着差别对样本所代表的总体间是否存在着差别对样本所代表的总体间是否存在着差别(chbi)(chbi)(chbi)(chbi)做出判断。做出判断。做出判断。做出判断。n n方法:均数的参数估计、均数方法:均数的参数估计、均数方法:均数的参数估计、均数方法:均数的参数估计、均数tttt检验检验检验检验第2页/共71页第三页,共72页。一、抽样误差与标准误一、抽样误差与标准误(一)概念(一)概念1、抽样误差:是伴随抽样所产生、抽样误差:是伴随抽样所产生的样本统计量与参数之间的差别。的样本统计量与参数之间的差别。2、标准误、标准误 :符号:符号 ,表示,表示(biosh)抽样误差大小抽样误差大小的指标;也称为样本均数的标准的指标;也称为样本均数的标准差;反映了用样本均数代替总体差;反映了用样本均数代替总体均数的可靠性程度的大小,增加均数的可靠性程度的大小,增加样本容量可以降低抽样误差。样本容量可以降低抽样误差。 抽样抽样(chu yn)误差与误差与抽样抽样(chu yn)分布分布第3页/共71页第四页,共72页。(二)、表达式与计算(二)、表达式与计算(二)、表达式与计算(二)、表达式与计算(jsun)(jsun)(jsun)(jsun) 样本均数的标准差,也称为标准样本均数的标准差,也称为标准误,反映了样本均数间的离散误,反映了样本均数间的离散(lsn)程度,也反映了样本均数与总程度,也反映了样本均数与总体均数的差异。体均数的差异。例例4.1 某市随机抽查某市随机抽查12岁男孩岁男孩(nn hi)100人,得身高均数人,得身高均数139.6cm,标准差标准差6.85cm,计算标计算标准误。准误。第4页/共71页第五页,共72页。标准标准标准标准(biozhn)(biozhn)(biozhn)(biozhn)差与标准差与标准差与标准差与标准(biozhn)(biozhn)(biozhn)(biozhn)误联系误联系误联系误联系与区别与区别与区别与区别标准差标准差标准误标准误含含义义测量值的离散程度测量值的离散程度样本均数的离散程度样本均数的离散程度(统计量对参数的散度)(统计量对参数的散度)计计算算大大小小大大小小用用途途描述测量值离散程度、描述测量值离散程度、计算计算cv、计算正常值范、计算正常值范围、计算标准误围、计算标准误参数可信区间的估计参数可信区间的估计假设检验,表达误差的内涵假设检验,表达误差的内涵联联系系都是离散程度的指标都是离散程度的指标,标准误是通过标准差来计算标准误是通过标准差来计算第5页/共71页第六页,共72页。二、抽样二、抽样二、抽样二、抽样(chuyn)(chuyn)(chuyn)(chuyn)分布分布分布分布从正态总体中抽样,样本均数(从正态总体中抽样,样本均数( )的抽样分布的抽样分布(fnb):1. n较大时(较大时(n50), 服从正态分服从正态分布布(fnb),经过标准化转换经过标准化转换 服从标准正态分布服从标准正态分布(fnb)即即 u分布分布(fnb)2. n较小时(较小时(n50),), 是非正态的是非正态的单峰对称分布单峰对称分布(fnb) 就有小样本统计量就有小样本统计量( )的的转换值服从转换值服从t分布分布(fnb)(是一组曲线)。(是一组曲线)。 第6页/共71页第七页,共72页。抽样抽样(chu yn)分布分布第7页/共71页第八页,共72页。n n英国统计学家:哥塞德在英国统计学家:哥塞德在英国统计学家:哥塞德在英国统计学家:哥塞德在19081908年以笔名年以笔名年以笔名年以笔名“student”“student”提出了著名的提出了著名的提出了著名的提出了著名的t t分布,故也称分布,故也称分布,故也称分布,故也称为为为为(chn wi)student t(chn wi)student t分布。分布。分布。分布。n nt t分布是描述小样本均值转换度的分布。分布是描述小样本均值转换度的分布。分布是描述小样本均值转换度的分布。分布是描述小样本均值转换度的分布。1、从正态总体中抽样、从正态总体中抽样(chu yn),大样本均数的,大样本均数的转换值服从标准正太分布转换值服从标准正太分布2、小样本均数的转换值服从、小样本均数的转换值服从t分布分布第8页/共71页第九页,共72页。(1)tu (n)(2)和和N(0, 1)一一样样都都是是单单峰峰分分布布,以以0为为中中心心对对称称(zhn xn du chn)(3) 越越小小,则则 越越大大,t值值越越分分散散,和和N(0, 1)相相比比,集集中中在在这这部部分分的的比比例例越越少少,尾尾部部翘翘得得越越高。高。2、t分布分布(fnb)的特的特征征第9页/共71页第十页,共72页。第10页/共71页第十一页,共72页。tttt分布分布分布分布(fnb)(fnb)(fnb)(fnb)(与(与(与(与uuuu分布分布分布分布(fnb)(fnb)(fnb)(fnb)比较的特比较的特比较的特比较的特点)点)点)点)第11页/共71页第十二页,共72页。 横横坐坐标标为为自自由由度度 ,纵纵坐坐标标为为概概率率p,表表中中数数字字(shz)表表示示自自由由度度为为 、p为为 、t的的界界值值,记记 如单侧如单侧 , =20可查得可查得 表示表示 由由t分布的对称性分布的对称性p(t-1.725)=0.05 t,以外尾部面积的百分数是以外尾部面积的百分数是3、t界值表界值表第12页/共71页第十三页,共72页。 的界值的界值第13页/共71页第十四页,共72页。与与u u分布分布(fnb)(fnb)比较比较n nU的临界值小于的临界值小于t曲线相应曲线相应(xingyng)的临的临界值的绝对值界值的绝对值n n当当n时,临界值相近。时,临界值相近。n n自由度越小,自由度越小,t的临界点越偏离的临界点越偏离u的临界点。的临界点。第14页/共71页第十五页,共72页。总体总体(zngt)(zngt)均数的均数的参数估计参数估计n n参数估计:是指由样本参数估计:是指由样本(yngbn)(yngbn)指标值(统计量)指标值(统计量)估计总体指标值(参数),估计总体指标值(参数),即用样本即用样本(yngbn)(yngbn)均数估均数估计总体均数,有两种估计方计总体均数,有两种估计方法:法: n n(1)(1)、点估计(近似、点估计(近似值)值)n n(2)(2)、区间估计(近、区间估计(近似范围)似范围)第15页/共71页第十六页,共72页。一、点估计一、点估计n点估计点估计: 用样本用样本(yngbn)均数直均数直接作为总体均数的估计值接作为总体均数的估计值,未考虑未考虑抽样误差。抽样误差。n如用如用 估计相应的估计相应的n当当 时时,样本样本(yngbn)均值趋近于总体均值均值趋近于总体均值.n 如果如果 ,则则 更可更可靠靠.第16页/共71页第十七页,共72页。二、区间二、区间二、区间二、区间(q(q(q(qjin)jin)jin)jin)估计估计估计估计n n1 1、概念、概念、概念、概念n n可信区间:也称为置信区间(可信区间:也称为置信区间(可信区间:也称为置信区间(可信区间:也称为置信区间(confidence confidence interval,CI),interval,CI),是按预先给定的概率估计未知总是按预先给定的概率估计未知总是按预先给定的概率估计未知总是按预先给定的概率估计未知总体均数的可能范围体均数的可能范围体均数的可能范围体均数的可能范围(fnwi).(fnwi).n n 事先给定的概率事先给定的概率事先给定的概率事先给定的概率1-1-称为可信度,常取称为可信度,常取称为可信度,常取称为可信度,常取95%95%或或或或99%99%n n总体均数的总体均数的总体均数的总体均数的95%95%(或(或(或(或99%99%)可信区间:表示该)可信区间:表示该)可信区间:表示该)可信区间:表示该区间包括总体均数区间包括总体均数区间包括总体均数区间包括总体均数 的概率为的概率为的概率为的概率为95%95%(或(或(或(或99%).99%).第17页/共71页第十八页,共72页。n n根据总体标准差根据总体标准差是否已知,以及样本含量是否已知,以及样本含量n n的大小的大小(dxio)(dxio)而异。而异。n n(1 1)t t分布法(分布法(n50n50n50)2、计算方法、计算方法第18页/共71页第十九页,共72页。(1 1 1 1)t t t t分布分布分布分布(fnb)(fnb)(fnb)(fnb)法(法(法(法(未知,未知,未知,未知,n50n50n50n50)n50)n总体均数的可信区间总体均数的可信区间(q jin).n已知已知:n未知但未知但n足够大足够大:第21页/共71页第二十二页,共72页。nu可以查表可以查表n某地某地12岁男孩身高岁男孩身高(shn o)均均数的数的95%的可信区间的可信区间.n本例中本例中:n=100, =139.6,s=6.85,un该地该地12岁男孩身高岁男孩身高(shn o)均均数的数的95%可信区间为可信区间为:n138.3(cm)141.0(cm) 第22页/共71页第二十三页,共72页。注意注意(zhy)(zhy)n n(1 1)统计)统计(tngj)(tngj)意义:从总意义:从总体中作大数次随机抽样,有体中作大数次随机抽样,有95%95%求得的可信区间包含总体均数。求得的可信区间包含总体均数。并不是做一次抽样求得可信区并不是做一次抽样求得可信区间包括间包括的概率是,对一次抽的概率是,对一次抽样而言只有两种可能,要么可样而言只有两种可能,要么可信区间包含信区间包含,要么不包含,要么不包含。n n(2 2)与医学正常值范围不同)与医学正常值范围不同第23页/共71页第二十四页,共72页。正常值范围正常值范围(fnwi)(fnwi)估计与可信估计与可信区间估计区间估计正常值范围正常值范围概念概念:绝大多数正常人的某绝大多数正常人的某指标范围。(指标范围。(95%,99%, 指绝大多数正常人)指绝大多数正常人)计算公式:计算公式:用途:用途:判断观察对象的判断观察对象的某项指标是否正常某项指标是否正常.可信区间可信区间概念:概念:总体均数所在的数值总体均数所在的数值范围(范围( 95%,99% 指可信指可信度)度)计算公式:计算公式:用途:用途:估计总体均数估计总体均数第24页/共71页第二十五页,共72页。假设检验的意义假设检验的意义假设检验的意义假设检验的意义(yy)(yy)(yy)(yy)和步骤和步骤和步骤和步骤n n假设检验(假设检验(假设检验(假设检验(hypothesistesthypothesistesthypothesistesthypothesistest)也称显著性检验)也称显著性检验)也称显著性检验)也称显著性检验(significancetest)(significancetest)(significancetest)(significancetest)。二十世。二十世。二十世。二十世纪二、三十年代纪二、三十年代纪二、三十年代纪二、三十年代NeymanNeymanNeymanNeyman和和和和PearsonPearsonPearsonPearson建立了统计假设检验问题的数学模型。建立了统计假设检验问题的数学模型。建立了统计假设检验问题的数学模型。建立了统计假设检验问题的数学模型。n n假设检验假设检验假设检验假设检验:建立在统计抽样建立在统计抽样建立在统计抽样建立在统计抽样(chuyn)(chuyn)(chuyn)(chuyn)分布分布分布分布, , , ,小概率事件原理基础上的对差小概率事件原理基础上的对差小概率事件原理基础上的对差小概率事件原理基础上的对差别性质进行风险推断的一种逻辑思维方法别性质进行风险推断的一种逻辑思维方法别性质进行风险推断的一种逻辑思维方法别性质进行风险推断的一种逻辑思维方法. . . .第25页/共71页第二十六页,共72页。假设检验:假设检验:假设检验:假设检验:1 1、原因、原因、原因、原因(yunyn)(yunyn)2 2、目的、目的、目的、目的3 3、原理、原理、原理、原理4 4、过程(步骤)、过程(步骤)、过程(步骤)、过程(步骤)5 5、结果、结果、结果、结果第26页/共71页第二十七页,共72页。1 1、假设检验的原因、假设检验的原因、假设检验的原因、假设检验的原因(yunyn)(yunyn) 由于由于由于由于(yuy)(yuy)个体差异的存在,即使从同个体差异的存在,即使从同个体差异的存在,即使从同个体差异的存在,即使从同一总体中严格的随机抽样,一总体中严格的随机抽样,一总体中严格的随机抽样,一总体中严格的随机抽样,X1X1、X2X2、X3X3、X4X4、,不同。、,不同。、,不同。、,不同。 因此,因此,因此,因此,X1X1、X2 X2 不同有两种(而且只有两种)可不同有两种(而且只有两种)可不同有两种(而且只有两种)可不同有两种(而且只有两种)可能:能:能:能:(1 1)分别所代表的总体均数相同,由于)分别所代表的总体均数相同,由于)分别所代表的总体均数相同,由于)分别所代表的总体均数相同,由于(yuy)(yuy)抽抽抽抽样误差造成了样本均数的差别。差别无显著性样误差造成了样本均数的差别。差别无显著性样误差造成了样本均数的差别。差别无显著性样误差造成了样本均数的差别。差别无显著性 。(2 2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。第27页/共71页第二十八页,共72页。n n 根据大量调查,已知健康成年根据大量调查,已知健康成年(chngnin)男子脉搏的均数为男子脉搏的均数为72次次/分,分,某医生在一山区随机调查了某医生在一山区随机调查了30名健康成年名健康成年(chngnin)男子,求得脉搏均数为次男子,求得脉搏均数为次/分分, 标准差为次标准差为次/分,能否据此认为该山区成年分,能否据此认为该山区成年(chngnin)男子的脉搏均数高于一般人男子的脉搏均数高于一般人?第28页/共71页第二十九页,共72页。 我我们们当当然然不不能能强强求求脉脉搏搏均均数数恰恰为为72次次/分分时时,才才认认为为山山区区成成年年男男子子的的脉脉搏搏均均数数和和一一般般人人一一样样,因因为为即即使使一一样样由由于于抽抽样样误误差差的的存存在在,样样本本(yngbn)均均数数未未必必等等于于72,造造成成山山区区健健康康成成年年男男子子的的脉脉搏搏样样本本(yngbn)均均数数与与一一般般人人不不同的原因有同的原因有: 抽样误差抽样误差 环境因素的影响环境因素的影响要回答这一问题就是假设检验问题要回答这一问题就是假设检验问题第29页/共71页第三十页,共72页。2 2、假设检验的目的、假设检验的目的、假设检验的目的、假设检验的目的(md)(md) l判断是由于何种原因造成的不同,以做出决判断是由于何种原因造成的不同,以做出决策。策。(推断参数推断参数(cnsh)是否相等是否相等)无效假设无效假设备择假设备择假设(jish)第30页/共71页第三十一页,共72页。3 3、假设检验的原理、假设检验的原理、假设检验的原理、假设检验的原理(yunl)/(yunl)/思想思想思想思想n n反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能A A A A和和和和B B B B,为了肯定其中的一种情况,为了肯定其中的一种情况,为了肯定其中的一种情况,为了肯定其中的一种情况A A A A,但又不能直接证实但又不能直接证实但又不能直接证实但又不能直接证实A A A A,这时否定另一种可能,这时否定另一种可能,这时否定另一种可能,这时否定另一种可能B B B B,则间接的肯定了,则间接的肯定了,则间接的肯定了,则间接的肯定了A A A A。n n小概率事件原理小概率事件原理小概率事件原理小概率事件原理:小概率事件在一次抽样中不可能发生小概率事件在一次抽样中不可能发生小概率事件在一次抽样中不可能发生小概率事件在一次抽样中不可能发生. . . .n n概率论:事件的发生不是绝对概率论:事件的发生不是绝对概率论:事件的发生不是绝对概率论:事件的发生不是绝对(judu)(judu)(judu)(judu)的,只是可能性大小而已。即的,只是可能性大小而已。即的,只是可能性大小而已。即的,只是可能性大小而已。即, , , ,带有风带有风带有风带有风险性的推断险性的推断险性的推断险性的推断. . . .第31页/共71页第三十二页,共72页。4 4、假设检验的一般、假设检验的一般、假设检验的一般、假设检验的一般(ybn)(ybn)步步步步骤骤骤骤 建立一对假设建立一对假设建立一对假设建立一对假设( (注意单双侧注意单双侧注意单双侧注意单双侧) )确定显著性水准(确定显著性水准(确定显著性水准(确定显著性水准( ): : 无效假设无效假设无效假设无效假设(H0)(H0):两个总体均数相等;:两个总体均数相等;:两个总体均数相等;:两个总体均数相等; 备择假设备择假设备择假设备择假设(H1)(H1):与:与:与:与 H0 H0 相反相反相反相反; ; 预先给定的概率值预先给定的概率值预先给定的概率值预先给定的概率值(或或或或0.01),0.01),区分大小概率事件的标准区分大小概率事件的标准区分大小概率事件的标准区分大小概率事件的标准. . 如上例,如上例,如上例,如上例,H0H0:1=72 1=72 H1 H1:172172 = = 计算统计量:计算统计量:计算统计量:计算统计量:( (选择不同的统计方法:选择不同的统计方法:选择不同的统计方法:选择不同的统计方法:u u检验检验检验检验, t, t检验检验检验检验,F,F检验等检验等检验等检验等) ) 确定概率值确定概率值确定概率值确定概率值p p和做出统计推断结论和做出统计推断结论和做出统计推断结论和做出统计推断结论:(p:(p值实际值实际值实际值实际(shj)(shj)得到犯一类错误的可能性得到犯一类错误的可能性得到犯一类错误的可能性得到犯一类错误的可能性,p,p,H1;p,则统计推断为按则统计推断为按则统计推断为按则统计推断为按 检验水准检验水准检验水准检验水准, ,不拒绝不拒绝不拒绝不拒绝H0H0。) )第32页/共71页第三十三页,共72页。5 5、假设检验的结果、假设检验的结果、假设检验的结果、假设检验的结果(ji gu)(ji gu)n n不拒绝无效假设不拒绝无效假设不拒绝无效假设不拒绝无效假设n n拒绝无效假设拒绝无效假设拒绝无效假设拒绝无效假设n n正确理解结论的概率正确理解结论的概率正确理解结论的概率正确理解结论的概率(gil)(gil)(gil)(gil)性(都隐含着犯错误性(都隐含着犯错误性(都隐含着犯错误性(都隐含着犯错误的可能性)。的可能性)。的可能性)。的可能性)。第33页/共71页第三十四页,共72页。六、均数的假设检验六、均数的假设检验n nt检验(t test)也称student t检验,是计量资料中最常用的假设检验方法(fngf),它以t分布为基础.n n本章将要介绍n n单个样本的t检验 (样本均值与总体均值的比较)n n配对样本t检验n n两独立样本的t检验 (两样本均值的比较,方差一致)第34页/共71页第三十五页,共72页。单个样本单个样本(yngbn)t(yngbn)t检验检验n单个样本单个样本t检验检验:是样本均数是样本均数 代表的总体均数代表的总体均数 和已知总体和已知总体均数均数 的比较的比较.n 适用条件:适用条件:n(1) 已知一个总体均数;已知一个总体均数;n(2) 可得到可得到(d do)一个样本均一个样本均数及该样本标准误;数及该样本标准误;n(3) 样本量小于样本量小于50;n(4) 样本来自正态或近似正态总样本来自正态或近似正态总体。体。第35页/共71页第三十六页,共72页。n n例例:根据大量调查根据大量调查(dioch),(dioch),已知健康成年男子的脉搏均数已知健康成年男子的脉搏均数为为7272次次/ /分分. .某医生在某山区随某医生在某山区随机调查机调查(dioch)30(dioch)30名健康男子名健康男子, ,求得脉搏均数为次求得脉搏均数为次/ /分分, ,标准差标准差为次为次/ /分分. .能否认为该山区的成能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数高于一般成年男子的脉搏均数年男子的脉搏均数? ?第36页/共71页第三十七页,共72页。因本例已知因本例已知 =72次次/分次分次/分次分次/分分,n=30, 由于已知由于已知 ,故选用故选用(xunyng)单样本单样本t检验检验n1 1、建立检验假设,确定概率水准、建立检验假设,确定概率水准n 山区成山区成年男子年男子(nnz)(nnz)平均脉搏数与一般成平均脉搏数与一般成年男子年男子(nnz)(nnz)相同。相同。n 山区成年男子山区成年男子(nnz)(nnz)平均脉搏数与平均脉搏数与一般成年男子一般成年男子(nnz)(nnz)不同。不同。n2 2、计算检验统计量、计算检验统计量n在在= 0= 0成立的条件下成立的条件下, ,计算统计计算统计量为量为: :第37页/共71页第三十八页,共72页。 3 3 3 3、确定、确定、确定、确定p p p p值,做出推断值,做出推断值,做出推断值,做出推断(tudun)(tudun)(tudun)(tudun)结论结论结论结论查表查表2,可得,可得 t 0.05/2(29) 今今t0.05,无统计学意义,按无统计学意义,按水准,不拒绝水准,不拒绝H0,尚不能认为该山区成年男子,尚不能认为该山区成年男子(nnz)平均每分钟平均每分钟脉搏数高于一般成年男子脉搏数高于一般成年男子(nnz)。第38页/共71页第三十九页,共72页。n n配对样本均数配对样本均数配对样本均数配对样本均数t t t t检验简称配对检验简称配对检验简称配对检验简称配对t t t t检验检验检验检验(paired t test),(paired t test),(paired t test),(paired t test),又称非独立两样本均数又称非独立两样本均数又称非独立两样本均数又称非独立两样本均数t t t t检验检验检验检验, , , ,适用于配适用于配适用于配适用于配对设计计量资料均数的比较对设计计量资料均数的比较对设计计量资料均数的比较对设计计量资料均数的比较, , , ,其比较目的是检验两相关样本均数所代表的未知总体均数是否其比较目的是检验两相关样本均数所代表的未知总体均数是否其比较目的是检验两相关样本均数所代表的未知总体均数是否其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。有差别。有差别。有差别。 n n配对设计配对设计配对设计配对设计(paired design)(paired design)(paired design)(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两是将受试对象按某些重要特征相近的原则配成对子,每对中的两是将受试对象按某些重要特征相近的原则配成对子,每对中的两是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予个个体随机地给予个个体随机地给予个个体随机地给予(jy)(jy)(jy)(jy)两种处理。两种处理。两种处理。两种处理。配对样本配对样本(yngbn)t(yngbn)t检验检验第39页/共71页第四十页,共72页。(1 1 1 1)两种同质受试对象分别接受两种处理:)两种同质受试对象分别接受两种处理:)两种同质受试对象分别接受两种处理:)两种同质受试对象分别接受两种处理: 如:把同窝、同性别和体重相近的动物配如:把同窝、同性别和体重相近的动物配如:把同窝、同性别和体重相近的动物配如:把同窝、同性别和体重相近的动物配成一对。成一对。成一对。成一对。(2 2 2 2)同一受试对象或同一样本的两个部分,分别)同一受试对象或同一样本的两个部分,分别)同一受试对象或同一样本的两个部分,分别)同一受试对象或同一样本的两个部分,分别接受两种不同处理:接受两种不同处理:接受两种不同处理:接受两种不同处理: 如:把服用两种降糖药的病人配成对如:把服用两种降糖药的病人配成对如:把服用两种降糖药的病人配成对如:把服用两种降糖药的病人配成对(3 3 3 3)同一受试对象处理(实验或治疗)前后的结)同一受试对象处理(实验或治疗)前后的结)同一受试对象处理(实验或治疗)前后的结)同一受试对象处理(实验或治疗)前后的结果比较果比较果比较果比较(bjio)(bjio)(bjio)(bjio): 如:对高血压患者治疗前后如:对高血压患者治疗前后如:对高血压患者治疗前后如:对高血压患者治疗前后配对设计资料主要配对设计资料主要(zhyo)有三种类型:有三种类型:应用配对设计可以减少实验的误差和控制非处理因素,提高应用配对设计可以减少实验的误差和控制非处理因素,提高(t go)统计处理的效率。统计处理的效率。第40页/共71页第四十一页,共72页。配对配对(pidu)(pidu)样本样本t t检验检验的原理的原理n配对样本配对样本t检验实际上是配对设检验实际上是配对设计的差值均数与总体计的差值均数与总体(zngt)均均数数0比较的比较的t检验检验n配对样本配对样本t检验的基本原理是假检验的基本原理是假设两种处理的效应相同设两种处理的效应相同,即即1=2,则则1-2=0(即即,已知总体已知总体(zngt)均数均数d =0),即检验差值即检验差值的样本均数的样本均数 所代表的未知总所代表的未知总体体(zngt)均数均数d 与与0的比较的比较.第41页/共71页第四十二页,共72页。n公式:公式:n自由度:对子数自由度:对子数 - 1n适用条件:两组配对计量资料。样适用条件:两组配对计量资料。样本来自正态分布本来自正态分布(fnb)总体,配总体,配对对t检验要求差值服从正态分布检验要求差值服从正态分布(fnb),实际应用时单峰对称分,实际应用时单峰对称分布布(fnb)也可以;大样本时,用也可以;大样本时,用u 检验,且正态性要求可以放宽;检验,且正态性要求可以放宽;第42页/共71页第四十三页,共72页。患者编号(1)舒张压(Kpa)治疗前后差数d(4)(2)(3)d2(5)=(4)*(4)手术前(2)手术后(2)1 16.0 12.0 4.0 16.002 12.0 13.3 -1.3 1.693 14.6 10.6 4.0 16.00 4 13.3 12.0 1.3 1.695 12.0 12.0 0 06 12.0 10.6 1.4 1.967 14.6 10.6 4.0 16.008 14.6 14.6 0 09 12.0 12.7 -0.7 0.4910 13.3 13.3 0 0合计 12.7 53.83第43页/共71页第四十四页,共72页。例例例例 某医院在研究肾动脉成形术前后血液动力学的某医院在研究肾动脉成形术前后血液动力学的某医院在研究肾动脉成形术前后血液动力学的某医院在研究肾动脉成形术前后血液动力学的 改变中,观察了改变中,观察了改变中,观察了改变中,观察了10101010例病人手术前后的例病人手术前后的例病人手术前后的例病人手术前后的 血压血压血压血压(xuy)(xuy)(xuy)(xuy)变化情况见表,试问手术前后舒张压有无变化?变化情况见表,试问手术前后舒张压有无变化?变化情况见表,试问手术前后舒张压有无变化?变化情况见表,试问手术前后舒张压有无变化?n1 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准nH0: d=0, H0: d=0, 即假设手术前后舒张即假设手术前后舒张压无变化压无变化(binhu)(binhu),样本,样本n 是从差数是从差数均数为均数为0 0的总体中抽得。的总体中抽得。nH1H1:d 0d 0,即手术前后舒张压,即手术前后舒张压有变化有变化(binhu)(binhu)。n第44页/共71页第四十五页,共72页。n2 2、计算、计算(j sun)(j sun)检验统计量检验统计量n先计算先计算(j sun)(j sun)差值差值d d及及d2,d2,得得n计算计算(j sun)(j sun)差值均数差值均数 n计算计算(j sun)(j sun)差值的标准差差值的标准差 计算计算(j sun)(j sun)差值的标准误得差值的标准误得第45页/共71页第四十六页,共72页。计算计算计算计算(j sun)t(j sun)t(j sun)t(j sun)t值值值值、确定、确定p p值,作出推断结论值,作出推断结论自由度自由度n-1=10-1=9,n-1=10-1=9,t 0.05/2(9)t 0.05/2(9)本例本例t t t0.05/2(9), p t0.05/2(9), p0.05, 0.05, 按按检验水准,不拒绝检验水准,不拒绝H0, H0, 即还不能认为手术前后即还不能认为手术前后(qinhu)(qinhu)的舒张压的舒张压不同。不同。第46页/共71页第四十七页,共72页。两独立两独立(dl)(dl)样本的样本的t t检验检验n目的:由两个样本均数的差别推断目的:由两个样本均数的差别推断两样本两样本 n 所代表的总体均数间有所代表的总体均数间有无无(yu w)差别。差别。 n计算公式及意义:计算公式及意义:n 公式:公式: 第47页/共71页第四十八页,共72页。n n应用条件应用条件应用条件应用条件(tiojin):(tiojin):(tiojin):(tiojin):n n(1 1 1 1)已知)已知)已知)已知/ / / /可计算两个样本均数及它们的标可计算两个样本均数及它们的标可计算两个样本均数及它们的标可计算两个样本均数及它们的标准差准差准差准差 ;n n(2 2 2 2)两个样本之一的例数少于)两个样本之一的例数少于)两个样本之一的例数少于)两个样本之一的例数少于50505050;n n(3 3 3 3)样本来自正态或近似正态总体;)样本来自正态或近似正态总体;)样本来自正态或近似正态总体;)样本来自正态或近似正态总体;n n(4 4 4 4)方差齐。)方差齐。)方差齐。)方差齐。自由度:自由度:第48页/共71页第四十九页,共72页。两独立样本两独立样本t t检验检验实例实例(shl)(shl)分析分析n n例例5.3 255.3 25例糖尿病患者随机分成两组,甲例糖尿病患者随机分成两组,甲组单纯用药物治疗组单纯用药物治疗(zhlio)(zhlio),乙组采用药,乙组采用药物治疗物治疗(zhlio)(zhlio)合并饮食疗法,二个月后合并饮食疗法,二个月后测空腹血糖测空腹血糖(mmol/L)(mmol/L)如表如表5-2 5-2 所示,问两所示,问两种疗法治疗种疗法治疗(zhlio)(zhlio)后患者血糖值是否相后患者血糖值是否相同?同?第49页/共71页第五十页,共72页。第50页/共71页第五十一页,共72页。两独立两独立(dl)(dl)样本样本t t检验检验检验步骤检验步骤n n1 1 1 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准、建立检验假设,确定检验水准、建立检验假设,确定检验水准n nH0H0H0H0: 1=1=1=1= 2 2 2 2,两种疗法治疗后患者血糖值的总体均数相同,两种疗法治疗后患者血糖值的总体均数相同,两种疗法治疗后患者血糖值的总体均数相同,两种疗法治疗后患者血糖值的总体均数相同; ; ; ;n nH1H1H1H1: 1 1 1 12 2 2 2,两种疗法治疗后患者血糖值的总体均数不同,两种疗法治疗后患者血糖值的总体均数不同,两种疗法治疗后患者血糖值的总体均数不同,两种疗法治疗后患者血糖值的总体均数不同(b (b (b (b tn)tn)tn)tn);n n。n n2 2 2 2、计算检验统计量、计算检验统计量、计算检验统计量、计算检验统计量第51页/共71页第五十二页,共72页。两独立样本两独立样本两独立样本两独立样本(yngbn)t(yngbn)t(yngbn)t(yngbn)t检验检验检验检验检验步骤检验步骤检验步骤检验步骤代入公式代入公式(gngsh)(gngsh),得,得: :第52页/共71页第五十三页,共72页。两独立样本两独立样本两独立样本两独立样本(yngbn)t(yngbn)t(yngbn)t(yngbn)t检验检验检验检验实例分析实例分析实例分析实例分析n n按公式计算,算得按公式计算,算得: :n n3 3、确定、确定P P值,作出推断结论值,作出推断结论n n两独立两独立(dl)(dl)样本样本t t检验自由度为检验自由度为n n =n1+n2-2 =n1+n2-2=12+13-2=23=12+13-2=23;n n 查查t t界值表,界值表,t0.05/2(23)t0.05/2(23),t0.01/2(23)=2.807. t0.01/2(23)=2.807. 第53页/共71页第五十四页,共72页。两独立样本两独立样本t t检验检验实例实例(shl)(shl)分析分析t t t0.05/2(23) t0.05/2(23),P P ,按按的水准拒绝的水准拒绝H0H0,接受,接受H1H1,差异,差异(chy)(chy)有统有统计学意义。计学意义。故可认为该地两种疗法治疗糖尿病患者二个月后故可认为该地两种疗法治疗糖尿病患者二个月后测得的空腹血糖值的均数不同。测得的空腹血糖值的均数不同。第54页/共71页第五十五页,共72页。配对配对配对配对t t t t检验检验检验检验(jinyn)(jinyn)(jinyn)(jinyn)与两样本的与两样本的与两样本的与两样本的tttt检验检验检验检验(jinyn)(jinyn)(jinyn)(jinyn)的比的比的比的比较较较较配对配对两样本两样本随机分配随机分配多次对间随机多次对间随机完全随机完全随机计算方法计算方法误差内涵误差内涵测量误差测量误差抽样误差抽样误差误差大小误差大小小小大大效率效率高高低低第55页/共71页第五十六页,共72页。两样本含量两样本含量(hnling)(hnling)较大时均较大时均数的比较数的比较n当样本当样本(yngbn)含量较大时,含量较大时,可用可用u检验法检验法n某医院对某医院对4050岁年龄组的男、岁年龄组的男、女不同性别的健康人群测定了女不同性别的健康人群测定了 脂蛋白有无差别?脂蛋白有无差别?性别性别 人数人数 均值均值 标准差标准差男男 193 3.97 1.04女女 128 3.58 0.90第56页/共71页第五十七页,共72页。n n1 1、建立假设并确定检验水准、建立假设并确定检验水准、建立假设并确定检验水准、建立假设并确定检验水准n nH0: 1=2H0: 1=2,即不同性别健康,即不同性别健康,即不同性别健康,即不同性别健康(jinkng)(jinkng)人群人群人群人群 脂蛋白无差别;脂蛋白无差别;脂蛋白无差别;脂蛋白无差别;n nH1H1:1212,即不同性别健康,即不同性别健康,即不同性别健康,即不同性别健康(jinkng)(jinkng)人群人群人群人群 脂蛋白有差别;脂蛋白有差别;脂蛋白有差别;脂蛋白有差别;n n 第57页/共71页第五十八页,共72页。n n2 2、计算、计算、计算、计算(j sun)u(j sun)u值值值值 第58页/共71页第五十九页,共72页。n3、确定、确定P值值 不必查表,双侧检验以不必查表,双侧检验以u时、时、P,今,今u,故,故p。按。按的水准,拒绝的水准,拒绝H0,接受,接受H1。认为。认为(rnwi)男性男性 脂蛋白含量高于女脂蛋白含量高于女性性 脂蛋白含量。脂蛋白含量。第59页/共71页第六十页,共72页。t检验检验(jinyn)中的注意事项中的注意事项 1. 1. 1. 1. 要有严密的抽样研究计划要有严密的抽样研究计划要有严密的抽样研究计划要有严密的抽样研究计划 要保证样本是从同质总体中随机抽取。要保证样本是从同质总体中随机抽取。要保证样本是从同质总体中随机抽取。要保证样本是从同质总体中随机抽取。 除了对比除了对比除了对比除了对比(dub)(dub)(dub)(dub)的因素外,其它影响结果的因素应一致。的因素外,其它影响结果的因素应一致。的因素外,其它影响结果的因素应一致。的因素外,其它影响结果的因素应一致。2 2 2 2选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件要要要要了了了了解解解解变变变变量量量量的的的的类类类类型型型型是是是是计计计计量量量量的的的的还还还还是是是是计计计计数数数数的的的的,设设设设计计计计类类类类型型型型是是是是配配配配对对对对设设设设计计计计还还还还是是是是成成成成组组组组设设设设计计计计,是大样本还是小样本。是大样本还是小样本。是大样本还是小样本。是大样本还是小样本。第60页/共71页第六十一页,共72页。假设检验的结论是根据概率推断的,所以不是绝对正假设检验的结论是根据概率推断的,所以不是绝对正假设检验的结论是根据概率推断的,所以不是绝对正假设检验的结论是根据概率推断的,所以不是绝对正确的:确的:确的:确的:(1)(1)(1)(1)当当当当ppppppp,不能拒绝不能拒绝不能拒绝不能拒绝H0,H0,H0,H0,不能接受不能接受不能接受不能接受(jishu)H1(jishu)H1(jishu)H1(jishu)H1,按不能接受,按不能接受,按不能接受,按不能接受(jishu)H1(jishu)H1(jishu)H1(jishu)H1下结论,也可能犯错下结论,也可能犯错下结论,也可能犯错下结论,也可能犯错误;误;误;误;3.3.正确理解假设检验的结论正确理解假设检验的结论(jiln)(jiln)(概(概率性)率性)第61页/共71页第六十二页,共72页。4.4.4.4.正确理解差别有无显著性的统计意义正确理解差别有无显著性的统计意义正确理解差别有无显著性的统计意义正确理解差别有无显著性的统计意义差差差差别别别别有有有有显显显显著著著著性性性性,或或或或有有有有统统统统计计计计意意意意义义义义,指指指指我我我我们们们们有有有有很很很很大大大大的的的的把把把把握握握握认认认认为为为为原原原原假假假假设设设设(jish)(jish)(jish)(jish)不不不不正正正正确确确确,并并并并非非非非是是是是说它们有较大的差别。说它们有较大的差别。说它们有较大的差别。说它们有较大的差别。差差差差别别别别无无无无显显显显著著著著性性性性,或或或或无无无无统统统统计计计计意意意意义义义义,我我我我们们们们只只只只是是是是认认认认为为为为以以以以很很很很大大大大的的的的把把把把握握握握拒拒拒拒绝绝绝绝原原原原假假假假设设设设(jish)(jish)(jish)(jish)的的的的理理理理由由由由还还还还不够充分,并不意味着我们很相信它。不够充分,并不意味着我们很相信它。不够充分,并不意味着我们很相信它。不够充分,并不意味着我们很相信它。5.5.5.5.统统统统计计计计显显显显著著著著性性性性与与与与其其其其它它它它专专专专业业业业上上上上的的的的显显显显著著著著性性性性的的的的意意意意义义义义不不不不同同同同第62页/共71页第六十三页,共72页。6 6 6 6、可信区间与假设检验的联系、可信区间与假设检验的联系、可信区间与假设检验的联系、可信区间与假设检验的联系(linx)(linx)(linx)(linx)与区与区与区与区别别别别假设检验用以推断总体均数间是否相同,而可信区假设检验用以推断总体均数间是否相同,而可信区假设检验用以推断总体均数间是否相同,而可信区假设检验用以推断总体均数间是否相同,而可信区间则用于估计总体均数所在的范围间则用于估计总体均数所在的范围间则用于估计总体均数所在的范围间则用于估计总体均数所在的范围(fnwi)(fnwi)(fnwi)(fnwi),两者既有,两者既有,两者既有,两者既有联系又有区别。联系又有区别。联系又有区别。联系又有区别。根据研究的目的和专业知识来决定单双侧,根据研究的目的和专业知识来决定单双侧,在没有特别说明的情况在没有特别说明的情况(qngkung)(qngkung)下通常采取双侧。下通常采取双侧。7.7.单侧检验与双侧检验单侧检验与双侧检验第63页/共71页第六十四页,共72页。假设检验中两类错误假设检验中两类错误(cuw)(cuw)第第II类错误类错误(cuw)(cuw)和第和第IIII类错误类错误(cuw)(cuw)假设检验的结果假设检验的结果(ji gu)有两种。有两种。(1) 当拒绝拒绝 H0 时时, 可能犯错误,可能可能犯错误,可能拒绝了实际上成立的拒绝了实际上成立的H0, 称为称为 类错误(类错误( “弃真弃真”的错误的错误 ),其概率大小用),其概率大小用 表示。表示。 (2)当)当不能拒绝不能拒绝 H0 时,也可能犯错误,时,也可能犯错误,没有拒绝实际上不成立的没有拒绝实际上不成立的H0 , 这类称为这类称为 II 类错误(类错误( “存伪存伪”的错误)的错误), 其概率大小用其概率大小用 表示表示, 值一般不能确切的知道。值一般不能确切的知道。第64页/共71页第六十五页,共72页。真实情况真实情况假设检验结论假设检验结论拒绝,接受拒绝,接受接受接受H0成立成立类错误(类错误()推断正确(推断正确(1- )H0不成立即不成立即H1成立成立推断正确(推断正确(1- )类错误(类错误( )表表 假设检验的两类错误假设检验的两类错误(cuw)第65页/共71页第六十六页,共72页。第66页/共71页第六十七页,共72页。是非判断:是非判断:()1 1标准误是一种特殊的标准差,其表示抽样标准误是一种特殊的标准差,其表示抽样误差的大小。误差的大小。()2 2N N一定时,测量值的离散程度越小,用样本一定时,测量值的离散程度越小,用样本(yngbn)(yngbn)均数估计总体均数的抽均数估计总体均数的抽样误差就越小。样误差就越小。()3 3假设检验的目的是要判断两个样本假设检验的目的是要判断两个样本(yngbn)(yngbn)均数的差别有多大。均数的差别有多大。第67页/共71页第六十八页,共72页。选择题:选择题:选择题:选择题: 按按按按水准做水准做水准做水准做t t t t检验,不能认为检验,不能认为检验,不能认为检验,不能认为(rnwi)(rnwi)(rnwi)(rnwi)两总体均两总体均两总体均两总体均数不相等,此时若推断有错,其错误的概率为(数不相等,此时若推断有错,其错误的概率为(数不相等,此时若推断有错,其错误的概率为(数不相等,此时若推断有错,其错误的概率为( )。)。)。)。 A A A A大于大于大于大于0.10 B0.10 B0.10 B0.10 B,而而而而未知未知未知未知 C C C C小于小于小于小于0.10 D0.10 D0.10 D0.10 D1-,1-,1-,1-,而而而而未知未知未知未知 2 2 2 2某地正常成年男子红细胞的普查结果,均数为某地正常成年男子红细胞的普查结果,均数为某地正常成年男子红细胞的普查结果,均数为某地正常成年男子红细胞的普查结果,均数为480480480480万万万万/mm3/mm3/mm3/mm3,标准差为万,标准差为万,标准差为万,标准差为万/mm3/mm3/mm3/mm3,后者反映(,后者反映(,后者反映(,后者反映( )A A A A个体变异个体变异个体变异个体变异 B B B B抽样误差抽样误差抽样误差抽样误差 C C C C总体均数不同总体均数不同总体均数不同总体均数不同 D D D D均数间变异均数间变异均数间变异均数间变异第68页/共71页第六十九页,共72页。n n3.两个样本均数比较,经t检验,差异有显著性,p越小,说明()n nA两样本均数差别越大 n nB两总体差别越大n nC越有理由认为(rnwi)两总体均数不同n nD越有理由认为(rnwi)两样本均数不同 第69页/共71页第七十页,共72页。思考题:思考题:思考题:思考题:1.标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3. 一类错误(cuw)和二类错误(cuw)的区别第70页/共71页第七十一页,共72页。内容(nirng)总结会计学。(1)tu (n)。(2)和N(0, 1)一样都是单峰分布,以0为中心对称。要回答这一问题就是假设检验问题。(4) 样本来自正态或近似(jn s)正态总体。(3)样本来自正态或近似(jn s)正态总体。H0:1=2,两种疗法治疗后患者血糖值的总体均数相同。H1:12,两种疗法治疗后患者血糖值的总体均数不同。2.可信区间和参考值范围有何不同第七十二页,共72页。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号