资源预览内容
第1页 / 共46页
第2页 / 共46页
第3页 / 共46页
第4页 / 共46页
第5页 / 共46页
第6页 / 共46页
第7页 / 共46页
第8页 / 共46页
第9页 / 共46页
第10页 / 共46页
亲,该文档总共46页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1,第五章 正态分布及其应用,主讲人:余小金 公共卫生学院流行病与卫生统计学系,2,一个问题,一个1.72米的男生和一个1.72米的女生哪个高?,3,该直方图给了我们什么信息?,120名7岁男童的身高分布的频率分布图,身高低于116厘米的儿童累计频率为多少?,身高(cm),身高大于1 24厘米的儿童累计频率 为多少?,4,表2.1 120名7岁男童身高的频数(率)分布,5,如果观察的是远大于120的研究总体呢?,关于总体的概率分布 第五章 正态分布与二项分布 正态分布是最基础的一种理论分布,6,主要内容,正态分布历史-关于误差的分布 正态分布的特征 正态分布在生物医学中的应用,7,正态分布的历史,德国数学家Gauss 法国数学家Laplace误差函数 最早用于物理学、天文学 Gaussian distribution,8,从频率分布到概率分布,9,正态分布的概率密度函数,如果随机变量X的概率密度函数 则称X服从正态分布,记作XN(,2),其中, 为分布的均数, 为分布的标准差。,(- X +),10,正态分布的特征,正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。 充分统计量 高峰在均数处; 均数两侧完全对称。 正态曲线下的面积分布有一定的规律。,11,正态分布图示 bell-shaped curve,x,0,.1,.2,.3,.4,f(x),12,方差相等、均数不等的正态分布图示,13,均数相等、方差不等的正态分布图示,1,14,正态曲线下的面积规律,X轴与正态曲线所夹面积恒等于1 。 对称区域面积相等。,S(-,-X),S(X,)S(-,-X),15,正态曲线下的面积规律,对称区域面积相等。,S(-x1, -x2),-x1 -x2 x2 x1,S(x1,x2)=S(-x2,-x1),16,正态曲线下的面积规律,-4 -3 -2 -1 0 1 2 3 4,-3 -2 - + +2 +3,S(-, -3)=0.0013,S(-, -2)=0.0228,S(-, -1)=0.1587,S(-, )=0.5,S(-, +3)=0.9987,S(-, +2)=0.9772,S(-, +1)=0.6587,S(-, )=1,17,正态曲线下的面积规律,-4 -3 -2 -1 0 1 2 3 4,-3 -2 - + +2 +3,1-S(-3 , +3)=0.0026,1-S(-2 , +2)=0.0456,1-S(- , +)=0.3174,18,正态曲线下的面积规律,-4 -3 -2 -1 0 1 2 3 4,-3 -2 - + +2 +3,S(-, -3)=0.0013,S(-, -2)=0.0228,S(-, -1)=0.1587,S(-, )=0.5,S(-, +3)=0.9987,S(-, +2)=0.9772,S(-, +1)=0.6587,S(-, )=1,19,正态曲线下的面积规律,-3 -2 - + +2 +3,S(-, -3)=0.0013 S(-, -2)=0.0228 S(-, -1)=0.1587 S(-, -0)=0.5,S(-3, -2)=0.0115 S(-2, -1)=0.1359 S(-1, )=0.3413,-4 -3 -2 -1 0 1 2 3 4,20,正态曲线下的面积规律,-3 -2 - + +2 +3,S(-, -3)=0.0013 S(-, -2)=0.0228 S(-, -1)=0.1587 S(-, -0)=0.5,S(-3, -2)=0.0115 S(-2, -1)=0.1359 S(-1, )=0.3413,21,正态曲线下的面积规律,-3 - + +3 -2 +2,S(-3, -2)=0.0115 S(-2, -1)=0.1359 S(-1, )=0.3413,S(-, -3)=0.0013 S(-, -2)=0.0228 S(-, -1)=0.1587 S(-, -0)=0.5,22,正态曲线下的面积规律,-1.96,+1.96,2.5%,2.5%,95%,23,正态曲线下的面积规律,24,正态曲线下的面积规律,-2.58,+2.58,0.5%,0.5%,99%,25,正态曲线下的面积规律小结,正态曲线下面积总和为1; 正态曲线关于均数对称;对称的区域内面积相等; 对任意正态曲线,按标准差为单位,对应的面积相等; -1.64 +1.64内面积为90%; -1.96 +1.96内面积为95%; -2.58 +2.58内面积为99%。 小于-3的面积为 0.13%; 小于-2的面积为 2.28%; 小于- 的面积为15.87%。,26,标准正态分布,标准正态分布(standard normal distribution)是均数为0,标准差为1的正态分布。 记为N(0,1)。 标准正态分布是一条曲线。 概率密度函数:,(- u +),27,正态分布转换为标准正态分布,若 XN(,2),作变换: 则u服从标准正态分布。 u称为标准正态离差(standard normal deviate),28,标准正态分布曲线下面积(u),u 0.00 -0.02 -0.04 -0.06 -0.08 -3.0 0.0013 0.0013 0.0012 0.0011 0.0010 -2.5 0.0062 0.0059 0.0055 0.0052 0.0049 -2.0 0.0228 0.0217 0.0207 0.0197 0.0188 -1.9 0.0287 0.0274 0.0262 0.0250 0.0239 -1.6 0.0548 0.0526 0.0505 0.0485 0.0465 -1.0 0.1587 0.1539 0.1492 0.1446 0.1401 -0.5 0.3085 0.3015 0.2946 0.2877 0.2810 0 0.5000 0.4920 0.4840 0.4761 0.4681,0,u,29,关于正态分布总结,正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一; 正态分布的优良性质-函数的分布 正态分布是由两个参数决定的一簇分布 正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。,30,正态分布的应用,二次大战期间们,英国生物学家peter blackett 向海军部建议组建科研小组协助解决战略,战术问题运筹学(operational research)诞生 应用到企业管理,制造业等 统计模型和科学思维的应用当条件满足时用正态分布去解决问题,31,正态分布的应用,估计频数分布 正态分布的假定简化了数据处理 质量控制 确定临床参考值范围,32,估计频数分布,例2.1 120名7岁男童的身高,计算得均数为119.41cmg,标准差为4.38cm.试估计该7岁男童110cm以下的比例。 首先计算标准离差: 查标准正态分布表: (-2.15)=0.0158 估计低体重儿的比例为1.58%.,33,质量管理 quality management,质量控制的意义 监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。 医院质量管理 实验室质量管理 六西格玛管理 (6) 参考阅读:周纪芗 茆诗松 质量管理统计方法 中国统计出版社,34,关于六西格玛管理,拯救摩托罗拉的开始 70-80年代 GE公司 六西格玛水平为99.99966%的合格率,也就是每百万次出错机会中只出现3.4个错误。,35,质量控制图(quality control chart),36,质量控制图(quality control chart),UCL (上控制限) UWL(上警戒限) CL (中心线) LWL(下警戒限) LCL (下控制限),样本编号、取样时间,M+2.58SD M+1.96SD M M-1.96SD M-2.58SD,37,质量控制图(quality control chart),1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 取样时间,M+3SD M+2SD M M-2SD M-3SD,38,医学参考值范围,问题 医学诊断检验中所用的正常范围是什么意思? 如何得到的?,39,参考值范围的定义(reference interval),又称正常值范围(normal range)。 参考值范围的经典定义: 绝大多数正常人的某解剖,生理,生化等指标观察值所在的范围。 绝大多数:90%,95%,99%等等。 参考值范围的扩展(extension) 用于分类判别与综合评价的所有相关领域 环境媒介中化学物含量标准(容许区间);标准动物指标;医院管理等. “正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。,40,参考值范围确定的原则与步骤,抽取足够例数的正常人样本 同质定义明确(性别年龄等) 准确而统一的测量-控制检测误差 决定单、双侧问题 选择适当的百分界值(90%,95%) 估计界值,41,单侧与双侧参考值范围,双侧 (在界值范围内为正常):白细胞计数,血清总胆固醇 单侧 上限(低于界值为正常) : 尿铅,发汞 ,牛奶中的三聚氰胺 下限(高于界值为正常):肺活量,IQ, 根据医学专业知识确定!,42,正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠 (单侧),43,正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠 (单侧),44,正常人,病人,假阳性率,假阴性率,病人,正常人与病人的数据分布重叠 (双侧),45,参考值范围的估计方法,46,谢谢您的专心听讲!,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号