资源预览内容
第1页 / 共62页
第2页 / 共62页
第3页 / 共62页
第4页 / 共62页
第5页 / 共62页
第6页 / 共62页
第7页 / 共62页
第8页 / 共62页
第9页 / 共62页
第10页 / 共62页
亲,该文档总共62页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
二项分布及其应用二项分布 Binomial distribution在医学上常遇到一些事物,其结局只有两种 互相对立的结果。如在毒理试验中,动物的生存与死亡;在动物诱 癌试验中,动物的发癌与不发癌;在临床治疗中 ,病人的治愈与未愈;理化检验结果的阴性与阳 性等等。均表现为两种互相对立的结果,每个个 体的观察结果只能取其中之一。为了解这些随机现象的规律性,在 相同条件下进行多次试验。发现其 共同特点:(1)对立性(2)独立性(3)重复性满足这些条件的n次重复独立试验为n重贝 努利试验,简称贝努利(Bernoulli)试验 或贝努利试验模型。应用条件二项分布的定义XB(n,):随机变量X服从以n,为参数的 二项分布。任意一次试验中,只有事件A发生和不发生两种 结果,发生的概率分别是: 和1 若在相同的条件下,进行n次独立重复试验,用X 表示这n次试验中事件A发生的次数,那么X服从 二项分布,记做 XB(n,),也叫Bernoulli分布。二项分布的概率例2.12:假设小白鼠接受一定剂量的毒物时, 其死亡概率是80%。对每只小白鼠来说, 其死亡事件A发生的概率是0.8,生存事件 A的发生概率是0.2。试验用3只小白鼠,请列举可能出现的试验结果及发生的概率 。Page21所有可能结结 果每种结结果的概率死亡 数生存数不同死亡数的概率甲、乙、丙XnX生 生 生0.20.20.2=0.2303生 生 死0.20.20.8=0.80.22生 死 生0.20.80.2=0.80.2212死 生 生0.80.20.2=0.80.22生 死 死0.20.80.8=0.820.2死 生 死0.80.20.8=0.820.221死 死 生0.80.80.2=0.820.2死 死 死0.80.80.8=0.8330 1.0001.000三只小白鼠存亡的排列和组合方式及其概率的计算 死亡 1个死亡 0个死亡 2个死亡 3个( 0.2 +0.8 )3 = (0.2)3+3(0.2)2(0.8)+3(0.2)(0.8)2+(0.8)3三生 二生一死 一生二死 三死0.008 0.096 0.384 0.512事件A(死亡)发生的次数X(1,2, 3.n)的概率P:如已知n=3,=0.8,则恰有例阳性的概率P(1)为: 二项分布的性质若XB(n,):X的总体均数为X的方差为X的标准差为均数与标准差若均数与标准差不用绝对数而用相对数即率 表示时,即对原式分别除以n:样本率的总体标准差,又称样本率的标准 误,反映样本率的抽样误差的大小。当未知时,常以样本率p来估计:样本率的 总体均数例:已知某地钩虫感染率为6.7,如 果随机抽查该地150人,记样本钩虫感 染率为p,求p的抽样误差p。本例n150,0.067累计概率结果A最多有K次发生的概率:结果A最少有K次发生的概率:从阳性率为的总体中随机抽取n个个体,则递推公式:例:据以往经验,用某药治疗小儿上呼吸道感染、支 气管炎,有效率为85,今有5个患者用该药治疗, 问:至少3人有效的概率为多少?最多1人有效的 概率为多少?本例=0.85,1-=0.15,n=5P(X3)=P(X=3)+P(X=4)+P(X=5)则P(X3)=0.1382+0.3915+0.44370.9734二项分布的图形在正态分布或其他连续性分布中, 常用分布曲线下的面积表示某区间 的概率;在二项分布中,则用线段 的长短表示取某变量值时的概率。二项分布图形形状取决于n和的大小。当0.5时,分布对称;当 0.5时,分布呈偏态;当0.5时,分布呈正偏态;当 0.5时,分布呈负偏态。特别是当n不是很大时,偏离 0.5越远,分布越偏随着n的增大,二项分布逐渐接近正态 分布。一般地说,如果常可用正态近似原理处理二项分布问题, 以简化计算。二项分布的应用条件各观察单位只能有互相对立的两种 结果之一。如阳性或阴性,生存或死亡等, 不允许考虑“可疑”等模糊结果,属于 二分类资料。观察单位数n必须事先确定。已知发生某一结果的概率不变,其 对立结果的概率则为(1- )。实际工作中要求是从大量观察中获 得的比较稳定的数值。n次试验在相同条件下进行,且各观 察单位的结果互相独立。即每个观察单 位的观察结果不会影响到其他观察单位 的结果。如要求疾病无传染性、无家族聚集 性等。二项分布的应用统计推断:统计推断: 总体率的区间估计 样本率和总体率的比较 两样本率的比较总体率的区间估计1.1.查表法查表法当n50,p很接近0或1时,查附表6。例:某医生用某药物治疗31例脑血管梗塞患者,其中 25例患者治疗有效,试求该药物治疗脑血管梗塞有效 概率的95可信区间。n=31,X=25n/2,n-X=6查表得可信区间:(1-37.5%, 1-7.5%)=(62.5%,92.5%)Page392.2.正态近似法正态近似法例:从某地人群中随机抽取144人,检查乙型肝炎表面抗原携 带状况,阳性率为9.03,求该地人群的乙型肝炎表面抗原阳性 率的95可信区间。 n=144,p=9.03%95%可信区间为即(4.35,13.71)单个总体率的假设检验目的:目的:推断样本所代表的总体率与一个已 知总体率0是否相等。1.1.直接计算概率法直接计算概率法根据二项分布的概率分布计算概率或累计概率累计概率 ,依据小概率事件原理,作出统计推断。例:新生儿染色体异常率为0.01,随机抽取 某地400名新生儿,发现1名染色体异常,请 问当地新生儿染色体异常是否低于一般?H0 : = 0.01 H1 : 0.05Poisson分布Poisson分布也是一种离散型 分布,用以描述罕见事件发 生次数的概率分布。Page22 每升水中大肠菌群数的分布/单位空间中某些野生动物或昆虫数的分布 单位体积内粉尘的计数/单位面积内细菌计数 放射性物质单位时间内的放射次数 每天交通事故发生数的分布 血细胞或微生物在显微镜下的计数 人群中患病率很低的非传染性疾病的患病数例如:例如:Poisson分布可以看作是发生的概率(或未 发生的概率1-)很小,而观察例数n很大时 的二项分布。除二项分布的三个基本条件以 外,Poisson分布还要求或(1-)接近于0 或1。有些情况和n都难以确定,只能以观察单位(时 间、空间、面积等)内某种稀有事件的发生数X 来表示,如每毫升水中的大肠杆菌数,只要细菌 在观察单位内的分布满足以上条件,就可以近似 视为Poisson分布。Poisson分布的定义如果某事件的发生是完全随机的,则单位 时间或单位空间内,随机事件X发生0次、 1次、2次的概率为:则称该事件的发生服从参数为的 Poisson分布,记为XP()。P22:Poisson分布的总体均数X:观察单位内某稀有事件的发生次数e:自然对数的底,2.71828Poisson分布的图形Poisson分布的形状取决于的大小。Poisson分布为正偏态分布,且愈小分 布愈偏;随着的增大, =20时分布逐 渐趋于对称;当50时,Poisson分布 近似正态分布,可按正态分布原理处理 。Poisson分布的性质1.Poisson分布的总体均数与总体方差相等 ,均为,即:即为均数,表示单位空间或单位时间内事 件平均发生的次数,又称强度参数。当未知时,常用样本均数X/n作为 的估计值,则n表示单位空间或单位时间数2.Poisson分布具有可加性 观察某一现象的发生数时,如果它呈Piosson分布 ,那么把若干个小单位合并为一个大单位后,其总 计数亦呈Piosson分布。 如果X1P(1), X2P(2), XKP(K),那 么X=X1+ X2+ +XK , 1 2 k ,则XP()。因此Poisson分布资料可利用可加性原 理使50,然后用正态近似法处理。3.Poisson分布与二项分 布及正态分布的关系Poisson分布是二项分布的特例,某现 象的发生率很小,而样本例数n很大时 ,则二项分布接近于Piosson分布。此 时可用 Piosson替代二项分布来简化计 算。Possion分布的累积概率计算n 常用的有左侧或右侧累计概率。单位空间或时 间内事件发生的次数 最多为k次的概率: 最少为k次的概率:计算时可借助下列递推公式。,P(X+1)= P(X) /(X+1 )Poisson分布的应用条件 由于Piosson分布是二项分布的特例,所以,二项分布的三个条件也就是Poisson分布的适用条件。“大量、有或无” “小概率、重复” “独立性” 另外,单位时间、面积或容积、人群中观察事件 的分布应该均匀,才符合Poisson分布。如细菌在牛奶中成集落存在,钉螺在繁殖 期成窝状散步时,不服从Poisson分布。Poisson分布的应用统计推断:统计推断: 总体均数的区间估计(p41) 样本均数和总体均数的比较 (p83) 两样本均数的比较P41,p83总体均数的区间估计1.1.正态近似法正态近似法X502.2.查表法(附表查表法(附表7 7)X50例4.6 用计数器两次测得某放射性物质5分钟内发 出的脉冲数分别为42和48个。假设单位时间内发射 的脉冲数符合Poisson分布,试估计该放射性物质每 5分钟平均发射脉冲数的95%可信区间。(901.96,901.96)=(71.4,108.6) 则每单位时间(5分钟)该放射性物质平均发出脉冲数 为45.0个/5分钟,其95%CI 为:35.754.3个/5 分钟。用公式(4.15)计算,结果一样。 解:由X=42+48=90 ,得 例4.7 从一份混合均匀的自来水中取1升 水样,检出3个大肠菌群。试估计自来水 中平均每升水中大肠杆菌数的95可信 区间。 查附表7,得平均每升自来水中大肠杆菌群的95 可信区间为:0.628.77(个/升) 单个总体均数的假设检验1.1.直接计算概率法直接计算概率法2.2.正态近似法正态近似法50例:某溶液原来平均每毫升有细菌80个, 现想了解某低剂量辐射能的杀菌效果。研 究者以此剂量照射该溶液后取1毫升,培 养得细菌40个。请问该剂量的辐射能是否 有效?解:一、建立检验假设,确定检验水准 H0 : = 80 H1 : 1.645, P0.05,按 0.050.05 拒绝 H0,接受H1。可以认为该剂量的辐射能有效 。两个总体均数的假设检验两个样本观察单位相同时,计算统计量两个样本观察单位不同时,计算统计量 例7.12 分别用甲、乙两种培养基对同一 水样作细菌培养,每份水样均取1ml,各 培养8次,得细菌个数如下:甲培养基分 别为8,6,7,8,5,6,4,7;乙培 养基分别为10,8,11,11,9,8,9, 9。试比较两种培养基的效果有无差别? 解:一、建立检验假设,确定检验水准 H0:两培养基效果相同,12; H1:两培养基效果不同,12。 = 0.05。 (二)计算检验统计量 据题意,本例为观察单位相同(均为1ml水样)的有重复试 验,且重复次数亦相同(n1 = n2 =8)。故=2.1381解:三、确定P值,下结论。2.1381u0.05=1.96,P0.05,按 = 0.05水准拒绝H0,接受H1,差 异有统计学意义。故可认为两种培养基 效果不同,结合资料可认为乙培养基培 养效果较好。 例7.13 某车间在改革生产工艺前,测取 三次粉尘浓度,每升空气中分别有38、 39、36颗粉尘;改革生产工艺后,测取 两次,分别有25、28颗粉尘。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号