资源预览内容
第1页 / 共28页
第2页 / 共28页
第3页 / 共28页
第4页 / 共28页
第5页 / 共28页
第6页 / 共28页
第7页 / 共28页
第8页 / 共28页
第9页 / 共28页
第10页 / 共28页
亲,该文档总共28页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
总体均数的估计和总体均数的估计和t检验检验何平平何平平北京大学医学部流行病与卫生统计学系北京大学医学部流行病与卫生统计学系Tel:82801619一、均数的抽样误差及总体均数置信区间的估计一、均数的抽样误差及总体均数置信区间的估计 (一)均数的抽样误差(一)均数的抽样误差1.1.定义定义 在抽样研究中,由于抽样造成的样本均数与在抽样研究中,由于抽样造成的样本均数与总体均数之间的差异或者样本均数之间的差异,称总体均数之间的差异或者样本均数之间的差异,称为均数的抽样误差(为均数的抽样误差(sampling errorsampling error)。抽样误差)。抽样误差是不可避免的,造成抽样误差的根本原因是个体变是不可避免的,造成抽样误差的根本原因是个体变异的客观存在。异的客观存在。2.2. 计算计算3.3.性质性质(1 1)抽样误差的大小,即标准误,与标准差)抽样误差的大小,即标准误,与标准差成正比,与样本含量的平方根成反比。成正比,与样本含量的平方根成反比。 (2 2)在实际工作中,减小抽样误差的有效方)在实际工作中,减小抽样误差的有效方法是增大样本含量。法是增大样本含量。标准误的标准误的精确值精确值标准误的标准误的估计值估计值(二)(二)t t分布分布 1.1.定义定义若从正态分布若从正态分布N N( , , 2 2)总体中随机抽取若干个样本含量为)总体中随机抽取若干个样本含量为n n的样本,的样本,样本均数也服从正态分布样本均数也服从正态分布N N( , , )。则)。则 服从标准正态分布服从标准正态分布N N(0, 10, 1)。)。在实际工作中,当在实际工作中,当 未知时,常用未知时,常用 来代替,则来代替,则 服从自由度服从自由度 = = n n 1 1的的t t分布分布 2.2.性质性质 一一组组与与自自由由度度 有有关关的的曲曲线线,随随着着自自由由度度 的的增增大大接近标准正态分布。接近标准正态分布。(三)总体均数(三)总体均数9595置信区间的估计置信区间的估计 1.1.定义定义根据样本均数计算出有(根据样本均数计算出有(1-1- )的把握包含总体均数的一个数)的把握包含总体均数的一个数值范围,这个数值范围称为总体均数的置信区间,该(值范围,这个数值范围称为总体均数的置信区间,该(1-1- )称为置信度。一般称为置信度。一般 取取0.050.05或或0.010.01,则置信度为,则置信度为95%95%或或99%99%,即,即一般估计总体均数的一般估计总体均数的95%95%或或99%99%置信区间。置信区间。置信区间的估计是有概率性的:置信区间的估计是有概率性的:总体均数的总体均数的95%95%置信区间即有置信区间即有95%95%的概率(可能性)认为计算出来的置信区间包含了总体均的概率(可能性)认为计算出来的置信区间包含了总体均数;这意味着不能认为总体均数肯定落在此可信区间内,即总数;这意味着不能认为总体均数肯定落在此可信区间内,即总体均数仍有体均数仍有5%5%的可能性不在此置信区间内。的可能性不在此置信区间内。 2. 2. 计算计算总体均数的总体均数的95%95%置信区间为置信区间为 t t0.05,0.05, 二、假设检验二、假设检验 (t 检验检验)假设检验的基本思想假设检验的基本思想 假设检验的目的:假设检验的目的: = = 0 0? 0 ,考虑差异来源有两种可能性:考虑差异来源有两种可能性: (1 1) = = 0 (同一总体),(同一总体), 0 0仅由抽样误差造成。仅由抽样误差造成。 (2 2) 0 (不同总体),(不同总体), 0 0主要由两总体之间的主要由两总体之间的不同造成。不同造成。小概率原理小概率原理假假设设有有一一前前提提条条件件H0: = 0成立成立 t t0.05/2 , P 0.05 对立条件对立条件H1: 0 拒绝拒绝同时接受同时接受假设检验方法假设检验方法小概率原理小概率原理接受接受假假设设有有一一前前提提条条件件H0: = 0成立成立 t 0.05 假设检验方法假设检验方法检验水准:检验水准:亦称为显著性水准(亦称为显著性水准(significance levelsignificance level),符号为),符号为 。 是是预先规定的概率值,它是预先规定的概率值,它是“是否拒绝是否拒绝H H0 0的界限的界限”。研究者可以。研究者可以根据研究目的规定根据研究目的规定 的大小,通常的大小,通常 取取0.050.05。 检验假设:检验假设:H0:无效假设无效假设H1:备择假设备择假设(一)样本均数与总体均数的比较的(一)样本均数与总体均数的比较的t t检验检验又称为单样本又称为单样本t t检验。已知的检验。已知的“总体均数总体均数”一般为理论值、一般为理论值、标准值或经过大量观察所得到的稳定值等。令已知总体标准值或经过大量观察所得到的稳定值等。令已知总体均数为均数为 0 0,样本均数所代表的未知总体均数为,样本均数所代表的未知总体均数为 ,假设,假设检验的目的:推断样本均数所代表的未知总体均数检验的目的:推断样本均数所代表的未知总体均数 与与已知总体均数已知总体均数 0 0是否相等(双侧检验)。是否相等(双侧检验)。 , = = n n 1 1假设检验的目的假设检验的目的 推断两个推断两个总体总体均数是否相等(双侧检验:均数是否相等(双侧检验:1 = 2?,单侧检验:单侧检验: 1 2? 或者或者1 0.05,尚不能认为该地难产男婴出生体重,尚不能认为该地难产男婴出生体重均数与正常男婴不同。均数与正常男婴不同。(二)两个独立样本均数比较的(二)两个独立样本均数比较的t t检验检验 又称为完全随机设计的又称为完全随机设计的t t检验或成组检验或成组t t检验。是指分别从检验。是指分别从两个研究总体中随机抽取样本,目的是推断这两个独立两个研究总体中随机抽取样本,目的是推断这两个独立样本所代表的未知总体均数样本所代表的未知总体均数 1 1与与 2 2是否相等。是否相等。 例:例:某医师测得某医师测得12名正常人和名正常人和13名病毒性肝炎患者血清名病毒性肝炎患者血清转铁蛋白含量(转铁蛋白含量(g/L),结果如下),结果如下(见数据文件(见数据文件p193.sav)。问病毒性肝炎患者和正常人血清转铁蛋白。问病毒性肝炎患者和正常人血清转铁蛋白含量有无差异?含量有无差异?病毒性肝炎患者:病毒性肝炎患者:2.34 2.47 2.22 2.31 2.36 2.38 2.15 2.57 2.19 2.25 2.28 2.31 2.42正常人:正常人:2.61 2.71 2.73 2.64 2.68 2.81 2.76 2.55 2.91 2.85 2.71 2.64变量说明:变量说明:groupgroup:分组,:分组,1 1患者;患者;2 2正常人。正常人。X X:血:血清转铁蛋白。清转铁蛋白。SPSS操作步骤:操作步骤:独立样本独立样本t t检验检验组别组别需要检验的变量需要检验的变量F值值P值值校正校正的的t值值t值值P值值方差齐性检验方差齐性检验当当P0.10,选择,选择t检验;当检验;当P 0.10 ,选择,选择校正校正t检验。检验。分别给出两组的分别给出两组的均数、标准差及均数、标准差及标准误标准误结论:结论:经经Levene方差齐性检验,方差齐性检验,P0.10,认为两组方差齐,因此采用,认为两组方差齐,因此采用t检验,检验,得到得到t8.812,P0.05,所有尚不能认为新药和常规药降低,所有尚不能认为新药和常规药降低血清总胆固醇的效果不同。血清总胆固醇的效果不同。假设检验的假设检验的P值不能反映总体均数差别的大小。值不能反映总体均数差别的大小。 P值越小,越有理由(越有把握)认为两总体均数不相等。值越小,越有理由(越有把握)认为两总体均数不相等。假设检验的结论具有概率性。假设检验的结论具有概率性。 H0原本正确原本正确, , 但但P 0.050.05,拒绝拒绝H0 :第一类错误(:第一类错误( ) H0原原本本不不正正确确, ,但但P 0.050.05,不不拒拒绝绝H0 :第第二二类类错错误误( ) 为为事事先先指指定定的的检检验验水水平平(一一般般取取0.050.05), 未未知知; 越越小小, 越越大大; 越越大大, 越越小小;增增大大样样本本量量n,可可以以同同时时减减小小 和和 。 假设检验的注意事项假设检验的注意事项 注:在临床或者基础科研中,可能会由于样本量不足,从注:在临床或者基础科研中,可能会由于样本量不足,从而增大了第二类错误的概率,导致而增大了第二类错误的概率,导致“差别无统计学意义差别无统计学意义”的错误结论。的错误结论。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号