资源预览内容
第1页 / 共43页
第2页 / 共43页
第3页 / 共43页
第4页 / 共43页
第5页 / 共43页
第6页 / 共43页
第7页 / 共43页
第8页 / 共43页
第9页 / 共43页
第10页 / 共43页
亲,该文档总共43页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
掌握掌握正态分布的主要特征;正态分布的主要特征;医学参考值范围的概念、计算方法。医学参考值范围的概念、计算方法。熟悉熟悉标准正态分布;标准正态分布;制定医学参考值范围的注意事项。制定医学参考值范围的注意事项。复习复习第二节第二节第三节第三节 均数的抽样误差与均数的抽样误差与 总体均数的估计总体均数的估计23掌握:掌握:n 抽样误差与标准误的概念及计算;抽样误差与标准误的概念及计算;n参数估计的概念、计算及含义。参数估计的概念、计算及含义。熟悉熟悉nt t 分布图形及特点、分布图形及特点、t t界值表的应用。界值表的应用。本节课学习目的与要求本节课学习目的与要求41均数的抽样误差与标准误均数的抽样误差与标准误2t 分布分布参数估计参数估计3总体均数的估计总体均数的估计5用样本信息来推用样本信息来推断总体的特征,断总体的特征,称为统计推断。称为统计推断。假设检验假设检验hypothesis test统计推断统计推断statistical inference参数估计参数估计parameter estimate用样本指标(统计量)来用样本指标(统计量)来估计总体指标(参数),估计总体指标(参数),称为参数估计。称为参数估计。6样本样本参数参数统计量统计量总体总体 抽样抽样统计推断统计推断统计描述统计描述抽样误差抽样误差(sampling error)是指在没有是指在没有系统误差和过失误差的前提下,单纯由系统误差和过失误差的前提下,单纯由于随机抽取样本而产生的样本指标于随机抽取样本而产生的样本指标(统统计量计量)间或样本指标与总体指标间或样本指标与总体指标(参数参数)之间的随机性误差。之间的随机性误差。1 均数的抽样误差与标准误均数的抽样误差与标准误7均数的抽样误差均数的抽样误差已知十堰地已知十堰地2013年年18岁岁女女生身高服从均数生身高服从均数为为155.4cm,标准差为,标准差为5.3cm的正态分布。的正态分布。 153.2154.1154.8157.4nj=30100个个 =155.4cm =5.3cmX1,X2,X3,Xi8n 抽样研究的目的抽样研究的目的是用样本信息推断总体是用样本信息推断总体特征。特征。n 因随机抽样造成的因随机抽样造成的样本均数与总体均数样本均数与总体均数之间差异或之间差异或各样本均数各样本均数之间差异称为之间差异称为均数均数的抽样误差的抽样误差。 抽样实验:抽样实验:(a)样本均数的分布特点:样本均数的分布特点: 1.1.各样本均数未必等于总体均数;各样本均数未必等于总体均数; 2.2.样本均数之间存在差异;样本均数之间存在差异; 3.3.样本均数的分布很有规律,围绕样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,着总体均数,中间多,两边少,左右基本对称,也服从正态分布。也服从正态分布。11 常将样本均数的标准差称为常将样本均数的标准差称为均数的标均数的标准误准误。反映。反映样本均数间样本均数间的离散程度,也反的离散程度,也反映样本均数与总体均数间的差异。映样本均数与总体均数间的差异。 标准误标准误是表示抽样误差大小的指标。是表示抽样误差大小的指标。12标准误的计算标准误的计算13例例11 某地某地 150 名名 3 岁女孩平均身高为岁女孩平均身高为 92.8 cm,标准差为标准差为4.6 cm,求其标准误。,求其标准误。已知:已知:已知:已知: 92.8 cm92.8 cmS S 4.6 cm 4.6 cm 14n 反映反映样本均数样本均数的的可靠性可靠性: 同质的资料标准误越小,抽样误差越小,样本均同质的资料标准误越小,抽样误差越小,样本均数越接近总体均数,说明由样本均数推断总体均数越接近总体均数,说明由样本均数推断总体均数的可靠性越大。数的可靠性越大。n 估计估计总体均数:总体均数: 结合样本均数结合样本均数 可对总体均数可对总体均数 做区间估计做区间估计n 假设检验假设检验:进行均数的进行均数的 t 检验检验标准误的标准误的应用应用15标准差与标准误的区别标准差与标准误的区别 标准差标准差 (S) 标准误(标准误(SX)意义意义 个体变量值变异度大小,个体变量值变异度大小, 样本均数抽样误差大小,样本均数抽样误差大小, 即原始变量值的离散程度。即原始变量值的离散程度。 即样本均数的离散程度。即样本均数的离散程度。应用应用 医学参考值范围,对某一医学参考值范围,对某一 区间估计,对总体均数的区间估计,对总体均数的 变量值是否在正常范围内变量值是否在正常范围内 大小作出初步判断;大小作出初步判断; 作出初步判断作出初步判断 ;计算变异;计算变异 用于假设检验。用于假设检验。 系数、标准误。系数、标准误。-16 t 分布于分布于 1908 年由英国统计学家年由英国统计学家W.S. Gosset以以“ Student ”笔名发表,故又称笔名发表,故又称Student t分布(分布(Studentt-distribution)或)或称为称为“ 学生氏学生氏 t 分布分布”。 t 分布主要用于解决分布主要用于解决小样本小样本的问题。的问题。2. t 分布(分布(t-distribution)17随机变量随机变量的的标准正态分布标准正态分布=0,=1=0, =1样本均数样本均数的的标准正态分布标准正态分布1819实际工作中,实际工作中, 往往是未知的,常用往往是未知的,常用 s 作为作为 的估计值,为与的估计值,为与 u 转换区别,称为转换区别,称为 t 变换,变换,t 值的分布为值的分布为 t 分布分布。 t 分布是抽样分布中的一种连续型分布,分布是抽样分布中的一种连续型分布,主要用主要用于于 t 检验检验和和总体均数的区间估计总体均数的区间估计。20t 分布的特征分布的特征l以以0为中心,左右对称为中心,左右对称l其形态变化与自由度其形态变化与自由度的大小有关的大小有关 越小,越小,t值分布越离散,曲线峰高越矮尾部越高值分布越离散,曲线峰高越矮尾部越高 越大,越大,t值分布越集中,曲线峰高上移尾部降低值分布越集中,曲线峰高上移尾部降低 趋近趋近+,t分布分布趋近标准正态分布趋近标准正态分布21tf(t) = (标准正态分布标准正态分布) = 5 = 1图图15-5 自由度分别为自由度分别为1、5、的的t分布分布0.200.1022 在在t界值表中列出了界值表中列出了t 分布曲线下尾端分布曲线下尾端的面积的面积,其中:,其中: 一侧尾部的面积称为单侧概率,对应的一侧尾部的面积称为单侧概率,对应的t值表示为值表示为t . ; 两侧尾部的面积称为双侧概率,对应的两侧尾部的面积称为双侧概率,对应的t值表示为值表示为t /2. 。t 界界值表表2324 由由 t 界值表可知:界值表可知:相同自由度时,相同自由度时,t越大,概率越大,概率P越越 小。小。 相同相同 t 值时,双侧概率是单侧概率的两倍。值时,双侧概率是单侧概率的两倍。 =时,时,t 分布即为分布即为u分布,故分布,故t界值表中最界值表中最 后一行是后一行是u界值。界值。25tB0AP26 t 分布主要用于:分布主要用于:n 总体均数置信区间的估计总体均数置信区间的估计n t 检验检验27点点估计估计(point estimation)区间区间估计估计(interval estimation) 统计推断统计推断 参数估计参数估计假设检验假设检验3. 总体均数的估计总体均数的估计用样本指标(统计量)来用样本指标(统计量)来估计总体指标(参数),估计总体指标(参数),称为参数估计。称为参数估计。 X ,即认为即认为20002000年该地所有健康成年男年该地所有健康成年男性血红蛋白量的总体均数为性血红蛋白量的总体均数为125125g/L。1)点估计:点估计:用样本统计量直接作为总体参数的估计值。用样本统计量直接作为总体参数的估计值。例如例如于于2000年测得某地年测得某地2727例健康成年男性血例健康成年男性血红蛋白量的样本均数为红蛋白量的样本均数为125125g/L,试估计其总体均,试估计其总体均数。数。29n 均数的区间估计:均数的区间估计:指按预先给定的概指按预先给定的概率,确定的未知参数的可能范围。率,确定的未知参数的可能范围。n 估计错误的概率为估计错误的概率为,估计正确的概率估计正确的概率为为1-。2)区间估计区间估计30n 1-称称可信度可信度或或置信度置信度(confidence level ),常取常取 95% 或或 99% 。n 可信限可信限(confidence limit,CL):下限):下限(lower limit,L ),上限(),上限(upper limit,U )n 根据一定的可信度估计得到的区间,称根据一定的可信度估计得到的区间,称为为可信区间可信区间(confidence interval,CI)。)。1、 已知时已知时, -1.96u +1.96 根据已知条件,可信区间的估计有根据已知条件,可信区间的估计有3 3种方法种方法:2、 未知,但未知,但n足够大时足够大时(n30):):3、 未知且未知且n小小(n30)时:时:34例例12 随机抽查某地随机抽查某地 10 名男孩出生体重名男孩出生体重 , 得其得其平均体重为平均体重为 3.21kg , 标准差为标准差为 0.47kg , 试估计试估计该地男孩出生体重均数的该地男孩出生体重均数的 95% 可信区间。可信区间。35查查 t 值表值表:t(0.05/2,9)=2. 262 该地男孩出生体重均数的该地男孩出生体重均数的95%可信区间为可信区间为: 2.873.55 kg36例例 某地抽查某地抽查 150 名名 3 岁女孩岁女孩 , 得身高均数为得身高均数为 92.8cm ,标准误为标准误为 0.38cm , 试估计该地试估计该地 3 岁女岁女孩身高总体均数的孩身高总体均数的 95% 可信区间。可信区间。37该地该地 3 岁女孩身高总体均数的岁女孩身高总体均数的 95% 可信可信区间为区间为:92.1 - 93.5cm38 从理论上讲,进行从理论上讲,进行 100 次抽样,可算得次抽样,可算得100 个可信区间,平均有个可信区间,平均有 95% 或或 99% 的可的可信区间包含了总体参数。信区间包含了总体参数。39例:例:若若=0.05,反复抽样反复抽样 100次,根据样本均次,根据样本均数可估计得到数可估计得到100个可信区间,这个可信区间,这100个区间个区间中约有中约有95个包含个包含,有有5个不包含个不包含。 40可信区间的可信区间的两个要素两个要素可信度可信度 1- 精度精度即可信区间即可信区间的宽度的宽度可信区间的可信区间的注意事项注意事项是可信区间包含是可信区间包含总体均数总体均数的概率的概率41置信度和精度置信度和精度互相制约互相制约。为了提高可信度,得放大置信区间,降低为了提高可信度,得放大置信区间,降低精度;精度;反之提高了精度,必然会使可信度降低。反之提高了精度,必然会使可信度降低。42均数的可信区间与参考值范围的区别均数的可信区间与参考值范围的区别 区别点区别点 均数的可信区间均数的可信区间 参考值范围参考值范围意义意义计算计算公式公式 用途用途按预先给定的概率按预先给定的概率(1 )确定的包含总确定的包含总体均数的可能范围体均数的可能范围 指正常人的解剖、指正常人的解剖、生理、生化某项指生理、生化某项指标的波动范围标的波动范围估计总体均数估计总体均数判断某项指标判断某项指标是否正常是否正常43掌握:掌握:n 抽样误差与标准误的概念及计算;抽样误差与标准误的概念及计算;n参数估计的概念、计算及含义。参数估计的概念、计算及含义。熟悉熟悉nt t 分布图形及特点、分布图形及特点、t t界值表的应用。界值表的应用。本次课学习目的与要求本次课学习目的与要求
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号