资源预览内容
第1页 / 共73页
第2页 / 共73页
第3页 / 共73页
第4页 / 共73页
第5页 / 共73页
第6页 / 共73页
第7页 / 共73页
第8页 / 共73页
第9页 / 共73页
第10页 / 共73页
亲,该文档总共73页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
医学统计学医学统计学李国春李国春 医学博士医学博士e-mail : e-mail : liguochuncn163.comliguochuncn163.comCell-phone: 13913841075 Cell-phone: 13913841075 第第5 5讲讲( (上上) t) t检验和检验和u u检验检验(Medical statistics)Singapore College of TCM2009.9t testt test单单样本均数样本均数 t 检验检验配对样本均数的配对样本均数的t检验检验两个独立样本均数的两个独立样本均数的t 检验检验正态性检验正态性检验两样本的方差齐性检验两样本的方差齐性检验两总体方差不等时均数比两总体方差不等时均数比较的较的 检验检验案例案例 练习和思考练习和思考 小结小结主要内容-contents-contents- t t 检验是假设检验中最见的一种方法,它检验是假设检验中最见的一种方法,它是是以以t t分布分布为基础。由于为基础。由于t t分布的发现使得小样本统分布的发现使得小样本统计推断成为可能,因而,它被认为是统计学发展史计推断成为可能,因而,它被认为是统计学发展史中的里程碑之一,在医学统计学中,中的里程碑之一,在医学统计学中,t t检验是非常活检验是非常活跃的一类假设检验方法。跃的一类假设检验方法。什么是t检验?t 检验的分类:t t 假设检验的应用条件:假设检验的应用条件:(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;)样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两)两样本均数比较时还要求所对应的两总体方差相等(总体方差相等( 1 12 2 = = 2 22 2 ),),即方差齐即方差齐性(性(Homogeneity of VarianceHomogeneity of Variance););(4 4)独立性。独立性。 在实际应用中,与上述条件略有偏离,在实际应用中,与上述条件略有偏离,但对结果影响不大。但对结果影响不大。问题:问题:已知,或已知,或n n较大时,用什么检验?较大时,用什么检验? f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3z z 检验检验 t t 检验是根据检验是根据t t分布判断样本概率而进分布判断样本概率而进行的假设检验,而当样本量行的假设检验,而当样本量n n很大时,很大时,t t分布就接分布就接近标准正态分布,标准正态分布也称为近标准正态分布,标准正态分布也称为u u分布,而分布,而国外教科书则称为国外教科书则称为Z Z分布,这时候根据分布,这时候根据u u分布判断分布判断概率所进行的假设检验称为概率所进行的假设检验称为u u检验。检验。应用条件:应用条件: 已知或者已知或者未知且未知且n n足够大(如足够大(如n100n100)。)。复习复习(1 1)样本均数与总体均数的比较)样本均数与总体均数的比较目的目的: :推断该样本是否来自某已知总体;推断该样本是否来自某已知总体; 样本均数代表的总体均数样本均数代表的总体均数 与与 0 0是否相等。是否相等。总体均数总体均数 0 0一般为理论值、标准值或经大量观察所得一般为理论值、标准值或经大量观察所得并为人们接受的公认值、习惯值。并为人们接受的公认值、习惯值。 未知总体未知总体已知总体已知总体0?t t 检验检验例例3.16 3.16 根据大量调查,已知健康成年男子听到最根据大量调查,已知健康成年男子听到最高声音频率的平均数为高声音频率的平均数为18000Hz18000Hz。某医生随机抽查某医生随机抽查2525名接触噪声作业的男性工人,测得可以听到的最高声名接触噪声作业的男性工人,测得可以听到的最高声音频率的均数为音频率的均数为17200Hz17200Hz,标准差为标准差为650Hz650Hz。试问能否试问能否认为接触噪声作业工人的听力水平与正常成年男性的认为接触噪声作业工人的听力水平与正常成年男性的听力水平不同?听力水平不同?0=18000Hz总体总体健康成年男子健康成年男子样本样本接触噪声接触噪声作业工人作业工人总体总体=未知总体未知总体?1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(=。)。)接触噪声作业工人的听力接触噪声作业工人的听力水平与正常成年男性的听力水平相同。水平与正常成年男性的听力水平相同。H H1 1 ( 。 )接触噪声作业工人的接触噪声作业工人的听力水平与正常成年男性的听力水平不同。听力水平与正常成年男性的听力水平不同。 =0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量t t值。值。n =25 n =25 ,X=17200HzX=17200Hz,s =650Hzs =650Hz, 。=18000Hz=18000Hz统计量统计量t t表示,在标准误的尺表示,在标准误的尺度下,样本均数与总体均数的度下,样本均数与总体均数的偏离。这种偏离称为标准偏离。这种偏离称为标准t t离离差(差(standard t deviationstandard t deviation)假设检验步骤:假设检验步骤:3 3、确定、确定P P值,作出推断结论。值,作出推断结论。查查t t界值表双侧界值表双侧0t =6.154现有统计量现有统计量t=6.1542.797t=6.1542.797,P0.01P0.01。按。按=0.05=0.05水准,拒绝水准,拒绝H H。,。,接受接受H1H1,差异有差异有统计学意义。结合本题统计学意义。结合本题有理由认为接触噪声作业有理由认为接触噪声作业的男性工人平均听力水平的男性工人平均听力水平低于正常成年男性。低于正常成年男性。-tt0-2.0642.0640 =240.0250.025t0.05,24=2.064 P =P ( |t| 2.064 )=0.05 P=P(|t|5.4545)0.050.05思路解析:思路解析:0=18000Hz总体总体健康成年男子健康成年男子样本样本总体总体=未知总体未知总体00=18000Hz总体总体样本样本假设该样本来自已知总体假设该样本来自已知总体0=18000Hz总体总体样本样本这些样这些样本是什本是什么分布么分布规律?规律?这些样本是什么分布规律?这些样本是什么分布规律?(1 1)这些样本的均数服从正态分)这些样本的均数服从正态分布:布:这里这里0=18000Hz,未知,因此未知,因此这种正态分布往往这种正态分布往往是未知的,这样就没办法求目前手头这个样本(是未知的,这样就没办法求目前手头这个样本( )在样本抽样分布中出现的概率就无法确认。即无)在样本抽样分布中出现的概率就无法确认。即无法获得等于及大于(或等于及小于)法获得等于及大于(或等于及小于)现有样本均数的现有样本均数的概率,也就无法概率,也就无法判断是否是小判断是否是小概率。概率。?只知道它服从正只知道它服从正态分布,至于是态分布,至于是什么样的正态分什么样的正态分布,不清楚布,不清楚这些样本的均数服从正态分布,但至于是什么样的正这些样本的均数服从正态分布,但至于是什么样的正态分布,往往未知,这时我们不去追究,而是回避这态分布,往往未知,这时我们不去追究,而是回避这个问题,采用个问题,采用t t分布来解决。分布来解决。(2 2)由这些样本的均数和标准差导出的新的统计量)由这些样本的均数和标准差导出的新的统计量t t服从的不是正态分布,而是服从的不是正态分布,而是t t分布。分布。都是已都是已知的知的服从自由度为服从自由度为n-1n-1的的t t分布,分布,即即v=25-1=24v=25-1=24的的t t分布。分布。 f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3t 仅分布与自由度有关仅分布与自由度有关-tt0不同自由度下不同自由度下t t界值对应的概率有差异界值对应的概率有差异t 仅分布与自由度有关仅分布与自由度有关 f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3-tt0P0.01对这个样本是否来自对这个样本是否来自这个总体产生了怀疑,这个总体产生了怀疑,因此从已知总体中抽因此从已知总体中抽样,获得这样的样本样,获得这样的样本的概率太少了的概率太少了P0.01P100n100)。)。(n(n较大时较大时) )(。已知时已知时) )这些样本是什么分布规律?这些样本是什么分布规律? 这些样本的均数服从正态分布:这些样本的均数服从正态分布: 。它服从正态分布,它服从正态分布,至于是什么样的至于是什么样的正态分布,是清正态分布,是清楚的。楚的。(。已知时已知时) )(n(n较大时较大时) ) f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3u 分布分布例例3.18 3.18 为了解医学院学生的心理健康状况,随机抽为了解医学院学生的心理健康状况,随机抽查某医科大学在校大学生查某医科大学在校大学生210210名,用名,用SCLSCL9090症状自评量症状自评量表进行测定,得出因子总分的均数为表进行测定,得出因子总分的均数为142.6142.6,标准差,标准差为为31.2531.25。已知全国。已知全国SCLSCL9090因子总分的均数(常模)为因子总分的均数(常模)为130130。试问该医科大学在校学生的。试问该医科大学在校学生的SCLSCL9090因子总分是否因子总分是否与全国水平相同?与全国水平相同?0=130总体总体全国水平全国水平样本样本某医学大学某医学大学在校学生在校学生总体总体=未知总体未知总体?(n(n较大时较大时) ) f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3u 分布分布1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(=。)。)该医科大学在校学生的该医科大学在校学生的SCL90SCL90因子总分与全国水平相同。因子总分与全国水平相同。H H1 1 ( 。 )医科大学在校学生的医科大学在校学生的SCL90SCL90因子总分与全国水平不同。因子总分与全国水平不同。 =0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量u u值。值。n =210100 n =210100 ,X=142.6X=142.6,s =31.25s =31.25, 。=130=130假设检验步骤:假设检验步骤:3 3、确定、确定P P值,作出推断结论。值,作出推断结论。查查u u界值表双侧,即界值表双侧,即t t界值表中界值表中v v为为时的一行,双侧:时的一行,双侧:0u =5.843现有统计量现有统计量u=5.8432.58u=5.8432.58,P0.01P0.20; 在慢性实验中,应保持配对因素的可比性,即实验全程配对因素应保持齐同; 在实际资料处理时,配对可能是成功的(属配对设计),也可能是不成功的,是完全随机设计。设计模式:设计模式:研究研究对象对象N N合格合格对象对象NeNe组组组组D D0 0D D1 1C C因素因素T T1 1因素因素统统计计分分析析分组分组 施加因素施加因素 效应效应配对配对P P随机随机R R若两处理因素的效应无差别,差值若两处理因素的效应无差别,差值d d的总体均数的总体均数 d d应该为应该为0 0,故可将该检验理解为样本均数与总体均,故可将该检验理解为样本均数与总体均数数 d d =0=0的比较的比较差值均数的大小及其抽样误差差值均数的大小及其抽样误差反应因素的效应反应因素的效应 配对设计配对设计t t检验的思路:检验的思路:例例3.19 3.19 为研究某心理干预措施对抑郁症患者的疗效,为研究某心理干预措施对抑郁症患者的疗效,对对1010名抑郁症患者于干预前、干预后分别进行生活满名抑郁症患者于干预前、干预后分别进行生活满意度指数意度指数B B(LSIBLSIB)的心理测试,结果如表的心理测试,结果如表3-73-7所示。所示。问该干预措施是否有效?问该干预措施是否有效?12345678910编号编号 干预前干预前 干预后干预后 差值(差值(d) d2129106581311109151216101291918151133647167529936164913649254合计合计 d=44 d2=234 表表3-7 10抑郁症患者干预前后心理指标抑郁症患者干预前后心理指标LSIB测试结果测试结果d=0总体总体总体总体=?1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(d d =0=0) 干预措施实施前后无差别干预措施实施前后无差别H H1 1 ( d d 0 0 )干预措施实施前后有差别干预措施实施前后有差别 =0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量t t值。值。n =10 n =10 ,d= d= d/n=44/10=4.4 ,假设检验步骤:假设检验步骤:3 3、确定、确定P P值,作出推断结论。值,作出推断结论。查查t t界值表双侧界值表双侧0t =6.563现有统计量现有统计量t=6.5633.250t=6.5633.250,P0.01P50n50时)时),自由度足够大,可用,自由度足够大,可用u u检验。检验。两个样本均数差值的标准误两个样本均数差值的标准误例例3.21 3.21 为评价交通污染对交通警察心理健康状况的为评价交通污染对交通警察心理健康状况的影响,某医生随机抽取某市交警大队外勤警察影响,某医生随机抽取某市交警大队外勤警察212212名名(男性)作为暴露组,进行(男性)作为暴露组,进行SCL90SCL90评定,测得均数为评定,测得均数为152.51152.51,标准差为,标准差为35.2735.27。已知全国(男性,。已知全国(男性,n=724n=724)常模的均数为常模的均数为129.96129.96,标准差为,标准差为38.7638.76。试问该市交。试问该市交警心理状况警心理状况SCL90SCL90评分是否高于全国常模?评分是否高于全国常模?暴露组暴露组 对照组对照组或常模组或常模组假设检验步骤:假设检验步骤:(1)(1)、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(1 1=2 2)该市交警心理状况该市交警心理状况SCL90SCL90评分评分与全国常模与全国常模相同相同H H1 1 ( 1 12 2 )该市交警心理状况该市交警心理状况SCL90SCL90评评分高于全国常模分高于全国常模 =0.05=0.05针针对对总总体体(2)(2)、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量u u值。值。n 1=212 n 1=212 ,X=152.51X=152.51, s1 =35.27 s1 =35.27n 2=724 n 2=724 ,X=129.96X=129.96, s2 =38.76 s2 =38.76(3)(3)、确定、确定P P值,作出推断结论。值,作出推断结论。查查u u界值表双侧,即界值表双侧,即t t界值表中界值表中v v为为时的一行,双侧:时的一行,双侧:0u =8.001现有统计量现有统计量u=8.0012.58u=8.0012.58,P0.01P 0.50.050.50.05,差差别别无无统统计计学意义,可以还不能认为学意义,可以还不能认为13-1613-16岁居民腭弓深度有性别差异。岁居民腭弓深度有性别差异。 正态性检验正态性检验(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两)两样本均数比较时还要求所对应的两总体方差相等(总体方差相等( 1 12 2 = = 2 22 2 ),),即方差齐即方差齐性(性(Homogeneity of VarianceHomogeneity of Variance););(4 4)独立性。独立性。方差齐性检验方差齐性检验(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;)样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两两样本均数比较时还要求所对应的两总体方差相等(总体方差相等( 1 12 2 = = 2 22 2 ),),即方差齐即方差齐性(性(Homogeneity of VarianceHomogeneity of Variance););(4 4)独立性。独立性。两样本所属总体方差不等(两样本所属总体方差不等(SatterthwaiteSatterthwaite近似法)近似法) 如果如果1 12 =2 =2 22 2 ,两样本所属总体方差不相等,如果两样本所属总体方差不相等,如果两总体为正态分布,分别记为两总体为正态分布,分别记为N N(1 1,2 2)和(和( 2 2,2 2 ),),检验假设为:检验假设为:H H0 0:1 1=2 2H H1 1: 1 1 2 2t t(v)分布分布例例6-5 6-5 为探讨硫酸氧钒对糖尿病性白内障的防治作为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的用,研究人员将已诱导糖尿病模型的2020只大鼠随机分只大鼠随机分成为两组。一组用硫酸氧钒治疗(成为两组。一组用硫酸氧钒治疗(DVDV组),另一组作组),另一组作对照观察(对照观察(D D组),组),1212周后测大鼠血糖含量周后测大鼠血糖含量(mmolmmol/L/L)。)。结果为,结果为,DVDV组组1212只,样本均数为只,样本均数为6.5mmol/L6.5mmol/L,标准差为标准差为1.34mmol/L1.34mmol/L;D D组组8 8只,样本均只,样本均数为数为13.7mmol/L13.7mmol/L,标准差为标准差为4.21mmol/L4.21mmol/L。试问两组动试问两组动物血糖含量的总体均数是否相同?物血糖含量的总体均数是否相同?H H0 0:1 1=2 2 ,H H1 1: 1 1 2 2双侧双侧 =0.05=0.05检验假设检验假设DVDV组组D D组组提示方差不齐提示方差不齐04.68174.6817配对设计与完全随机设计比较配对设计与完全随机设计比较由于配对设计的抽样误差较小,它的实验效率往往优于完全随机设计,在实际工作中多数情况也如此,但也有特殊情况,主要有两个方面原因:(1)标准误的大小若采用两组的标准差计算配对设计的标准误:(r为两列数据相关系数)当样本量相等时,完全随机设计的两组差值均数的标准误为:因此,当r0配对成功,当r100n100)。)。大样本均数比较的u检验(1)样本均数与总体均数比较的u检验假定样本数据X1、X2、X n 服从正态分布 ,当检验假设H。: =0 成立时,样本均数 服从正态分布 ,这里的总体均数0一般是指已知的理论值、标准值或经过大量观察所得到的稳定值, 为总体方差,检验统计量为:当总体标准差 未知,n60时,可用样本标准差S作为 的估计值,即:例例7-1 7-1 根据根据19831983年大量调查结果,已知某地成年男子的年大量调查结果,已知某地成年男子的脉搏均数为脉搏均数为7272次次/ /分钟。某医生分钟。某医生20032003年在该地随机调查年在该地随机调查了了7575名成年男子,求得其脉搏均数为名成年男子,求得其脉搏均数为74.274.2次次/ /分钟,标分钟,标准差为准差为6.56.5次次/ /分钟,能否据此认为该地成年男子的脉搏分钟,能否据此认为该地成年男子的脉搏数不同于数不同于19831983年?年?0=72次次/分钟分钟总体总体19831983年年大量大量调查结果调查结果样本样本20032003年调查年调查总体总体=未知总体未知总体假设检验的步骤:假设检验的步骤:步骤一:建立检验假设,确定检验水准H。: =72,即该地成年男子的平均脉搏没有变化即该地成年男子的平均脉搏没有变化H1 : 72,即该地成年男子的平均脉搏与即该地成年男子的平均脉搏与1983年不同年不同=0.05 (=0.05 (认为这个事件不可能发生认为这个事件不可能发生) )步骤二:计算检验统计量-u值步骤三:确定P值,作出推断结论因此P0.05,按预先设定=0.05的检验水准,不拒绝H。,统计结论为差别无统计学意义,根据本试验结果尚不能推断补锌对新生儿出生体重有影响。案案 例例案例案例6-2 为研究不同药物对肥胖患者的疗效,将BMI28的肥胖患者随机分成两组,每组10人,测得他们服药前及服药2个月后体重的变化(教材表6-10)。试评价:A、B两种药物对肥胖患者是否有效。A、B两种药物的疗效有无差别。 案例辨析案例辨析 “同一受试对象处理前后的比较”严格地说不是合格的配对设计,因为处理前的个体接受的是空白处理,而处理后的同一个体接受的是“处理(长跑)+时间(5个月)”,因此,即便长跑前后的晨脉次数有差别,也不能就判断是长跑的作用,因为有5个月的时间效应混杂在其中。正确做法正确做法 处理此类问题的最好办法是加一个平行对照,使“时间效应”在两组比较时互相抵消,从而可以更真实地揭示“长跑与否”产生的效应之间的差别有无统计学意义。练习与思考练习与思考
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号