资源预览内容
第1页 / 共47页
第2页 / 共47页
第3页 / 共47页
第4页 / 共47页
第5页 / 共47页
第6页 / 共47页
第7页 / 共47页
第8页 / 共47页
第9页 / 共47页
第10页 / 共47页
亲,该文档总共47页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章第二章 统计假设测验及统计假设测验及T T测验测验第一节第一节 理论分布与抽样分布理论分布与抽样分布 Sampling distributions第二节第二节 统计假设测验统计假设测验 Test of statistical hypothesis第三节第三节 平均数的假设检验平均数的假设检验 Test of mean hypothesis第四节第四节 二项资料的百分数假设检验二项资料的百分数假设检验 Test of percent hypothesis第五节第五节 参数的区间估计参数的区间估计 Estimate of confidence interval第一节第一节 理论分布与抽样分布理论分布与抽样分布Sampling Distributions1. 二项式分布二项式分布 Binomial distribution2. 泊松分布泊松分布 Poisson distribution3. 正态分布正态分布 Normal Distribution4. 抽样分布抽样分布 Sampling distribution连续性资料的数据分布连续性资料的数据分布1772151979712315924511911913114915216710416121412517521911819217617595136199116165214951588313780138151187126196134206137989712914317917415916513610810114114816816317610219414517375130149150161155111158131189911421491541521631232051491551312091839711981149187131215111186118150155197116254239160172179151198124179135164168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159 水稻产量水稻产量 g/120cm整理结果 分组数列组中点值次数(f)67.5 82.575.282.5 97.590.797.5 112.5105.7112.5 127.5120.13127.5 142.5135.15142.5 157.5150.20157.5 172.5165.25172.5 187.518021187.5 202.5195.13202.5 217.52109217.5 232.52253232.5 247.5240.2247.5 262.5255.1总次数 (n)140 1772151979712315924511911913114915216710416121412517521911819217617595136199116165214951588313780138151187126196134206137989712914317917415916513610810114114816816317610219414517375130149150161155111158131189911421491541521631232051491551312091839711981149187131215111186118150155197116254239160172179151198124179135164168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159概率概率 一般而论,当计算或计量一系列观察个体时,不论周围条件控制得如何严格,这些观察值总是表现出一定的变异类型,服从一些有规律的法则。从科学试验可以看到,这些变异类型多数表现以平均数为中心,次数最多,离平均数愈远,次数愈少,向两极端值作对称的分布; 但也有各种不同程度的非对称分布称或偏斜分布。由于变数的次数分布有各种类型,因之相应地有其各种理论分布或法则。 这些理论法则乃科学试验的实际变异类型的数学模型,是统计理论的基础。 1、二项式分布、二项式分布 binomial distribution1、二项式分布、二项式分布 binomial distribution 计算二项式的组合公式:n相当于样本数,x相当于具有某个特性的个体数。这一分布也称贝努里分布,并有二项分布二项分布 调查2000株棉花,盲椿象的受害率为35(p=0.35),则未受害的概率为 q=10.35=0.65。 若每次调查5株(n=5),则受害1、2、3、4、5株的概率各是多少?其累计函数为:受害i次的概率为:二项分布二项分布2000株棉花,盲椿象受害概率的计算结果受害株数概率函数P(y)P(x)F(x)NP(x)P(0)C050.3500.6550.11600.116046.4P(1)C150.3510.6540.31240.4284124.96P(2)C250.3520.6530.33640.7648134.56P(3)C350.3530.6520.18110.945972.44P(4)C450.3540.6510.04880.994719.52P(5)C550.3550.6500.00531.00002.12二项分布二项分布每次抽5株,抽N=400次。 NP(x)= P(x)400盲椿象受害的概率函数图和累计概率函数图二项分布二项分布概率P(y)P(0)P(1)P(2)P(3)P(4)P(5)P(x)F(x)0.11600.11600.31240.42840.33640.76480.18110.94590.04880.99470.00531.0000 若盲椿象的受害率为p=1/2,则未受害的概率q=1-p=1/2,此时受害概率的分布为p=q的形式。P=q=0.5p=0.35, q=0.65当n很大时,既是pq,概率函数也会呈对称分布。二项分布二项分布2、泊松分布、泊松分布二项分布的一种极限分布二项分布的一种极限分布Poisson distribution2、泊松分布、泊松分布二项分布的一种极限分布二项分布的一种极限分布Poisson distribution而n又相当大(50),足以使np或nq为一个适当大的值,例如界乎0与10之间,这样二项分布即为一种极限事例,称泊松概率分布,或简称泊松分布。Poisson distribution 应用二项分布时,当概率p或q很小,例如小于0.1,泊松分布泊松分布如果将np = m,接近分布为: 式中,x=1,2, ,为任意项的项数。m以平均数估计。凡观察次数n(相当大),某事件出现的平均次数却很少,则该事件符合泊松分布。泊松分布的平均数、方差、标准差为:泊松分布泊松分布 在棉铃虫产卵盛期调查2000株棉花,数据如表,按照泊松分布计算各分布概率。x01234nmF18521092810120000.0995Px0.90530.090080.004480.0001480.0000036FN1810.6180.168.960.2960.0072泊松分布泊松分布3、正态分布、正态分布Normal Distribution(二项分布的极限)(二项分布的极限)研究正态分布的意义:1.客观世界的许多现象的数据是服从正态分布规律的。2.在适当条件下,正态分布可以用来作二项分布及其它间断性变数或连续性变数分布的近似分布。3.虽然某些总体不作正态分布,但从总体中随机抽出的样本平均数及其它一些统计数的分布,在样本容量适当大时仍然趋于正态分布。正态分布正态分布正态分布图正态分布正态分布正态分布曲线的特点正态分布曲线的特点:1.曲线以平均数为对称轴,左右对称;2.算术平均数、中数、众数三位合一;3.正态分布曲线是以平均数和标准差的不同而表现为一系列曲线;4.正态分布资料的次数分布表现为多数次数集中在算是平均数附近,距之俞远,次数俞少;5.正态分布曲线在离开平均数一个标准差处有拐点,且曲线是以x轴为渐进线;6.正态分布曲线与x轴间的面积为1,任何两个x定值间的面积或概率由平均数和标准差确定。正态分布正态分布以平均数和标准差不同的正态分布系列曲线区间区间面积或概率面积或概率10.682720.954530.99731.9600.95002.5760.9900正态分布正态分布正态分布曲线区间面积或概率的计算方法正态分布曲线区间面积或概率的计算方法:正态分布曲线区间(xa)面积或概率的计算方法:正态分布正态分布 为了简化,一般以一个新数U代替x,即将x离开其平均数的差数以标准差为单位进行转换,U称为正态离正态离差差,经转换后的分布为具有平均数0,标准差1的标准化正态分布。转换后的正态分布曲线为:正态分布正态分布例:假定x为一随机数且具有正态分布特性,平均数为 30,标准差为5,请计算x26, x40, 26x40时的概率值。解:查附表2可得:当U=0.8时,FN(x)=0.2119即即x26的概率为0.2119。计算x 40时得概率值。同理: x40时,当U=2时,查表得FN(x)= =0. 9773 即即x40时的概率为0. 9773。正态分布正态分布正态分布正态分布计算:26x40时的概率值。 P(x)=P(2640)时的概率值。P(x40)= 1P(x40) 10.97730.0227正态分布正态分布4. 抽样分布 Sampling distribution 统计数统计数或或统计量统计量的分布称为抽样分布。的分布称为抽样分布。 目的目的: : 从样本推断总体。从样本推断总体。(1)从总体到样本的方向:)从总体到样本的方向: 其目的是研究从总体中抽出所有可能样本统计量的其目的是研究从总体中抽出所有可能样本统计量的分布及其与原总体的关系。分布及其与原总体的关系。(2)从样本到总体的方向:用样本对总体作出推断。)从样本到总体的方向:用样本对总体作出推断。研究总体和样本之间的研究总体和样本之间的关系可从两个方向进行:关系可从两个方向进行:抽样方式:抽样方式:(1)复置抽样)复置抽样(2)不复置抽样)不复置抽样抽样试验方法:抽样试验方法:(1)直接研究法:从一个总体抽取样本而计算其统计数。)直接研究法:从一个总体抽取样本而计算其统计数。(2)MonteCarlo研究法:当研究法:当N或或n很大时,直接法研究有很大时,直接法研究有困难,可采用从已知概率分布的总体中按拟定样本容量,用困难,可采用从已知概率分布的总体中按拟定样本容量,用随机方法抽出相当多的样本,从这些样本计算统计数,列出随机方法抽出相当多的样本,从这些样本计算统计数,列出其次数分布表。这些抽样分布结果也可以大概证实总体的参其次数分布表。这些抽样分布结果也可以大概证实总体的参数和分布律。数和分布律。抽样分布样本总体与母体的关系样本总体与母体的关系1. 样本平均数的抽样样本平均数的抽样分布平均数和方差的推导不同样本容量的样本平均数 的抽样分布n=1n=2n=4n=8 ffff2122122.0122.00122.258182.54102.5036902.751123083263.010303.002667983.2550416383.516563.5078427443.751 016381041443124.019764.001 10744284.251 01643184.516724.5078435284.75504239452105.010505.0026613305.251125885.54225.50361985.758466166166.0166.00166总和31293681324656126244均数12/3= (4)36/9= (4)324/ 81 =(4)26244 / 6561= (4)方差8/34/32/31/3总体N=3(2、4、6)样本容量n=1、2、4、8证明证明2. 样本总和数的抽样分布抽样分布的平均数 与母总体平均数的关系正态总体抽样的分布抽样分布的方差 与母总体方差的关系正态总体抽样的分布3. 两个独立随机样本平均数差数平均数差数的抽样分布 该抽样分布的平均数与母体的平均数相等平均数与母体的平均数相等。若若两个总体各作正态分布,则其样本平均数差数准两个总体各作正态分布,则其样本平均数差数准确地遵循正态分布,无论样本容量大或小。确地遵循正态分布,无论样本容量大或小。该抽样分布的方差与母体方差的关系为:两个独两个独立的样本平均数的差数分布的方差等于两个总体立的样本平均数的差数分布的方差等于两个总体的样本的样本平均数的方差总和平均数的方差总和:两个独立随机样本平均数差数的抽样分布例题:第一个总体有三个观察值2、4、6 (N13), 样本容量为(n12),全部样本数为Nn=32=9,总体平均数14 ,总体方差 8/3 第二个总体有两个观察值3、6 (N22),样本容量为(n23),全部样本数为Nn=23=8,总体平均数24.5 ,总体方差 两个独立随机样本平均数差数的抽样分布 (样本观察值)f (样本观察值)f2 (2,2)123(3、3、3;)133 (2,4、4,2;)264 (3,6,3、3,3,6、6,3,3)3124 (2,6、6,2、4,4)3125 (3,6,6、6,3,6、6,6,3)3155 (4,6、6,4)2106 (6、6、6)166 (6,6)16总和936836N1=3, n1=2N2=2, n2=31 =41 =4.5从两个总体抽出样本平均数的次数分布 2、4、6(N13) (n12), 3、6 (N22) (n23)两个独立随机样本平均数差数的抽样分布样本平均数差数的次数分布x1222233334 4 445 5 5 5666 6总和x2345634563 4 563 4 5 6345 6x1-x2-1-2-3-40-1-2-31 0-1-22 1 0-1321 0f133126623 9 932 6 6 2133 1 72样本平均数差数分布的平均数和方差x1-x2ff(x1-x2)(x1-x2+0.5)(x1-x2+0.5)2f(x1-x2+0.5)2-41-4-3.512.2512.25-35-15-2.56.2531.25-212-24-1.52.2527.00-118-18-0.50.254.501800.50.254.5112121.52.2527.0025102.56.2531.253133.512.2512.25总72-36150.0两个独立随机样本平均数差数的抽样分布两种方法计算结果相同两种方法计算结果相同两个独立随机样本平均数差数的抽样分布平均数差数的方差算法平均数差数的方差算法1平均数差数的方差算法平均数差数的方差算法2平均数差数平均数差数中心极限定理(中心极限定理(Central Limit Theorem) 从正态总体抽取样本,无论样本容量大与小,其样从正态总体抽取样本,无论样本容量大与小,其样本平均数的抽样分布必呈正态分布,具有平均数和方差本平均数的抽样分布必呈正态分布,具有平均数和方差分别为:分别为:平均数的分布一般记为:平均数的分布一般记为: 当当总体不是正态分布的,但它具有总体不是正态分布的,但它具有2和和,那么,当那么,当样本容量样本容量n增大时,从该总体抽出的样本平均数的抽样分增大时,从该总体抽出的样本平均数的抽样分布亦必趋近正态分布,具有平均数布亦必趋近正态分布,具有平均数和和方差方差2/n,在,在实际实际应用时,当应用时,当n30时,就可以应用这一定理。时,就可以应用这一定理。二项总体抽样的分布(1). 二项总体的分布参数二项总体的分布参数(2). 样本平均数抽样分布样本平均数抽样分布(3). 样本综合数的抽样分布样本综合数的抽样分布 (1). 二项总体的分布参数二项总体的分布参数例:一个总体内有5个个体,分别为0、1、0、1、1。则:( 01 0 1 1 )50.6所以 p2(0-0.6)2+(1-0.6)2+(0-0.6)250.24(2). (2). 样本平均数抽样分布样本平均数抽样分布平均数,平均数, 方差,方差,标准误,标准误,(每次取一个样,即: n =1)(3). (3). 样本综合数的抽样分布样本综合数的抽样分布二项总体抽样的分布二项总体的平均数二项总体的平均数p,方差2 p(1-p)=pq标准差为样本平均数抽样分布样本平均数抽样分布 平均数,平均数, 方差,方差, 标准误,标准误,部分希腊字母的读音英语读音英语读音英语读音AlphakappaRhoBetalambdaSigmaGammaMuTauDeltaNuUpsilouepsilonXiPhiZetaOmicronKaietapiomega
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号