资源预览内容
第1页 / 共54页
第2页 / 共54页
第3页 / 共54页
第4页 / 共54页
第5页 / 共54页
第6页 / 共54页
第7页 / 共54页
第8页 / 共54页
第9页 / 共54页
第10页 / 共54页
亲,该文档总共54页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第一节第一节 事事 件件 与与 概概 率率事件与概率的定义事件与概率的定义事件的相互关系事件的相互关系计算事件概率的法则计算事件概率的法则第五讲第五讲 理论分布与抽样分布理论分布与抽样分布一、基本概念一、基本概念1、事件、事件(event)必然事件必然事件 不可能事件不可能事件 随机事件随机事件2、概率概率(probability):一个事件出现的可能一个事件出现的可能性性统计概率统计概率:通过大量数据统计得出的发生概率通过大量数据统计得出的发生概率理论概率理论概率:事件未发生之前就已预料的发生频率事件未发生之前就已预料的发生频率0 a n,0 p 1如果在同一条件下,试验或观察的次数如果在同一条件下,试验或观察的次数n逐渐增逐渐增大,随机事件大,随机事件A发生的频率趋于稳定,这种性质发生的频率趋于稳定,这种性质叫频率的稳定性。叫频率的稳定性。二、事件间的关系二、事件间的关系小概率原理:小概率原理:若事件若事件A发生的概率较小(如小于发生的概率较小(如小于0.05或或0.01),),则认为事件则认为事件A在一次试验中不太可能发生。在一次试验中不太可能发生。 不同研究领域的小概率标准不同不同研究领域的小概率标准不同 此处是指在特定的单次试验中此处是指在特定的单次试验中1、和事件:、和事件: 事件事件A和和B至少有其一发生而构成的新事件至少有其一发生而构成的新事件记为记为AB 可推广到可推广到n个事件的和事件个事件的和事件 事件事件A和和B同时发生而构成的新事件。同时发生而构成的新事件。记为记为AB推广到推广到n个事件则为个事件则为2、积事件、积事件3、互斥事件:事件、互斥事件:事件A和事件和事件B不可能同时不可能同时发生,即发生,即AB为不可能事件为不可能事件记做记做AB =V4、对立事件:事件对立事件:事件A和和B不可能同时发生,不可能同时发生,但必发生其一,即但必发生其一,即A+B为必然事件为必然事件 (记做(记做A+B=U)AB为不可能事件(记做为不可能事件(记做AB =V)5、完全事件系:即事件、完全事件系:即事件A1、A2、An两两互斥,且每次必发生其一两两互斥,且每次必发生其一6、事件的独立性:即两事件各自发生的可、事件的独立性:即两事件各自发生的可能性彼此不受对方影响能性彼此不受对方影响三、计算事件概率的法则三、计算事件概率的法则1、加法定律、加法定律a.互斥事件:互斥事件:b.对立事件:对立事件:c.完全事件系:完全事件系:a.非独立事件:非独立事件:b.独立事件:独立事件:2、乘法定律、乘法定律一、二项总体的分布及其参数一、二项总体的分布及其参数1.二项总体二项总体(binary population)的定义的定义如:检测一批种子的发芽情况如:检测一批种子的发芽情况(发芽发芽 : 不发芽不发芽)赋值:发芽赋值:发芽=1,不发芽,不发芽=0(二项总体又称(二项总体又称0、1总体)总体)可以人为划分成二项总体(如基因型的划分)可以人为划分成二项总体(如基因型的划分) 总体只包含两种互斥的情况,而总体中总体只包含两种互斥的情况,而总体中的每个个体只发生两种互斥的情况之一,这的每个个体只发生两种互斥的情况之一,这种总体称为二项总体。种总体称为二项总体。第二节第二节 二项总体的理论分布与抽样分布二项总体的理论分布与抽样分布2. 二项总体的分布及参数二项总体的分布及参数=p, yff(y)红花(红花(1)7500.75 (p)白花(白花(0)2500.25 (q)二、二项总体的抽样分布二、二项总体的抽样分布2. 抽样分布:抽样分布:用复置抽样的方法,可以从总体抽用复置抽样的方法,可以从总体抽取许多样本,每个样本都可以算出一些统计数,取许多样本,每个样本都可以算出一些统计数,这些样本统计数的分布称为抽样分布。这些样本统计数的分布称为抽样分布。1. 抽样方法抽样方法:复置抽样复置抽样不放回抽样不放回抽样总和数抽样分布总和数抽样分布平均数抽样分布平均数抽样分布平均数差数抽样分布平均数差数抽样分布4. 二项总体的各种抽样分布二项总体的各种抽样分布1)样本总和数的抽样分布)样本总和数的抽样分布2)样本平均数的抽样分布)样本平均数的抽样分布3)样本平均数差数的抽样分布)样本平均数差数的抽样分布二项概率公式:二项概率公式:3. 二项分布二项分布(binomial distribution)的定义:的定义: 每次独立抽取每次独立抽取0-1总体的总体的n个个体,则所得变个个体,则所得变量量y将可能有将可能有0、1、n共共n+1个,由这个,由这n+1个个变量及其概率就构成了二项式概率分布,简称二变量及其概率就构成了二项式概率分布,简称二项式分布或二项分布,记做项式分布或二项分布,记做 yB(n,p)二项总体及其抽样分布参数的比较二项总体及其抽样分布参数的比较p值不同的二项分布比较值不同的二项分布比较不同的二项分布曲线不同的二项分布曲线n值不同的二项分布比较值不同的二项分布比较第三节 泊松分布泊松分布二项总体的两种极限分布情况二项总体的两种极限分布情况p=q,n ,服从正态分布服从正态分布p、q相差很大,相差很大,n 相当大,服从另一种相当大,服从另一种极限分布泊松分布极限分布泊松分布是一种稀有现象的分布规律是一种稀有现象的分布规律泊松分布的概率计算公式泊松分布的概率计算公式:若令若令m=np,p=m/n(m的意义为在观察次数为的意义为在观察次数为n时,某事时,某事件出现的平均次数,对于某总体来说是一个常数),则件出现的平均次数,对于某总体来说是一个常数),则1泊松分布的参数泊松分布的参数=2=m,即,即在观察次数为在观察次数为n时,某事件出时,某事件出现的平均次数现的平均次数【例例5 5】矮糯的资料,矮糯的资料,p=0.0625p=0.0625,若,若n=20n=20,问出现两株或以上矮糯的概率有多大?问出现两株或以上矮糯的概率有多大?具有不同具有不同m值的泊松分布曲线形状值的泊松分布曲线形状第四节 正态总体的理论分布正态总体的理论分布 与抽样分布与抽样分布一、正态分布的基本概念一、正态分布的基本概念是一个曲线系列,是一个曲线系列,是随是随和和的改变的改变而改变的一组曲而改变的一组曲线,线, 决定曲线决定曲线的位置,的位置, 决定决定曲线的形状曲线的形状二、计算正态分布曲线任意区间面二、计算正态分布曲线任意区间面积的方法(积的方法(p62)1、正态分布密度函数曲线面积的求解、正态分布密度函数曲线面积的求解aa bbabba ba 2、标准正态分布、标准正态分布称称=0,2=1的正态分布为标准正态分布的正态分布为标准正态分布(standard normal distribution)。标准正态分布的分布函数及累积概率密度函标准正态分布的分布函数及累积概率密度函数分别记作数分别记作 (u)和和(u): 随机变量随机变量u服从标准正态分布,记作服从标准正态分布,记作uN(0,1)标准正态分布的区间概率估计标准正态分布的区间概率估计 设设u服从标准正态分布,则服从标准正态分布,则 u 在区间在区间u1,u2 )内取值的概率为内取值的概率为:(u1)与与(u2)可由附表可由附表2查得查得3、任意正态分布的区间概率估计、任意正态分布的区间概率估计 对于任何一个服从正态分布对于任何一个服从正态分布N(,2)的随机的随机变量变量x,都可以通过标准化变换:都可以通过标准化变换: u=(x-)将其变换为服从标准正态分布的随机变量将其变换为服从标准正态分布的随机变量u。 u 称为标准正态变量或标准正态离差称为标准正态变量或标准正态离差(standard normal deviate)。P(-1-1uP(-2-2u2 2)=0.95450.9545P(-3-3u3 3)=0.9973=0.9973P(-1.96-1.96u1.961.96)=0.95=0.95P (-2.58(-2.58u2.58)=0.992.58)=0.991 1)=0.6827=0.6827两尾概率:P(u ? )0.95P(u ? )0.95P(u ? )0.99P(u ? )0.99一尾概率:4、举例、举例【例例1】 已知一个正态总体已知一个正态总体xN(16, 4) ,求求 a:P(x20)=?; b:x落在落在1020之间的概率是多少?之间的概率是多少?解:解:i.进行标准正态离差转换进行标准正态离差转换ii.查得查得F(u)值值iii.求区间概率求区间概率【例例2】 xN(30,25),求求26x 40的概率?的概率?(p63)解:解:i.标准正态转换标准正态转换ii.查得查得F(u)值值iii.求区间概率求区间概率注:总体参数未知情况下用注:总体参数未知情况下用大大群体或重复试验群体或重复试验结果的统计数(结果的统计数( )代替)代替【例例3 3】 一个棉花品种的纤维长度一个棉花品种的纤维长度( (单位:单位:mm) )资料,资料,多年测定的结果为,多年测定的结果为,x xN N(29.83, 1.045(29.83, 1.0452 2) ),请问:请问:变量在区间变量在区间(28.785, 30.875)(28.785, 30.875)、(27.74, 31.92)(27.74, 31.92)、(26.695, 32.965)(26.695, 32.965)的概率分别为多少?的概率分别为多少?若淘汰掉小于若淘汰掉小于2929mm的单株,淘汰率为多少?若选的单株,淘汰率为多少?若选大于大于3131mm的单株,当选率为多少?的单株,当选率为多少?若希望选择若希望选择5050株纤维长度大于等于株纤维长度大于等于3232mm的单株,的单株,群体应种多大?群体应种多大? 解i.标准正态转换标准正态转换ii.查得查得F(u)值值iii.求区间概率求区间概率 解i.标准正态转换标准正态转换ii.查得查得F(u)值值iii.求区间概率求区间概率 解i.标准正态转换标准正态转换ii.查得查得F(u)值值iii.求区间概率求区间概率即在此品种的群体中,纤维长度大于等于即在此品种的群体中,纤维长度大于等于32mm的的单株出现的概率为单株出现的概率为0.0188,因此,要得到,因此,要得到50株这样株这样的单株,需要群体规模的单株,需要群体规模(n)为:为:三、正态总体的抽样分布三、正态总体的抽样分布1、正态总体分布参数与样本统计数的关系、正态总体分布参数与样本统计数的关系正态总体抽样统计数的分布特点正态总体抽样统计数的分布特点:2、样本平均数的分布及其参数(、样本平均数的分布及其参数(p67)不同样本容量抽样平均数的分布不同样本容量抽样平均数的分布 样本平均数分布特点样本平均数分布特点:中心极限定理的应用:中心极限定理的应用:抽样平均数的分布为正态分布的情况抽样平均数的分布为正态分布的情况基础总体为正态分布基础总体为正态分布样本容量足够大,样本容量足够大,n=30为一个公认的大小样为一个公认的大小样本的界限本的界限可以通过可以通过u变换来估计抽样平均数的概率变换来估计抽样平均数的概率区间,此时区间,此时【例例4】某某“岱字棉岱字棉”原种纤维长度符合原种纤维长度符合N(29.83, 1.0452)的分布,试求分别以的分布,试求分别以n=4和和n=25株随机抽样时,样本平均数大于株随机抽样时,样本平均数大于30.33mm的概率各自为多少?的概率各自为多少?3、样本总和数的分布及其参数、样本总和数的分布及其参数样本总和数的总体参数:样本总和数的总体参数:4、样本平均数差数的分布及其参数、样本平均数差数的分布及其参数N=3(2, 4, 6)=42=8/3=2.667=1.633N=2(3, 6)=4.52=9/4=2.25=1.2247n=2n=3样本平均数差数总体的参数:样本平均数差数总体的参数:平均数差数抽样分布的特性:平均数差数抽样分布的特性:P47: 3.2、3.3、3.4、3.6作业:作业:P72: 4.3、4.4、4.6、4.7、4.10
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号