资源预览内容
第1页 / 共90页
第2页 / 共90页
第3页 / 共90页
第4页 / 共90页
第5页 / 共90页
第6页 / 共90页
第7页 / 共90页
第8页 / 共90页
第9页 / 共90页
第10页 / 共90页
亲,该文档总共90页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第五讲第五讲 概率及其二项分概率及其二项分 布布前面所讲的制表、绘图、求集中量、差异量、偏态量、峰态量等,都是对实际观察的数据所进行的整理、描述工作。但我们的工作更是要做出具有一定可靠程度的估计和推断。从本章开始进入推理统计。本章的概率分布理论就是讲解这种可靠程度的依据。概率论是研究随机变量取值规律的科学,它用一个个概率分布来描述随机变量的取值规律,是进行统计推断的基础。一、概率的定义后验概率后验概率(或统计概率)随机事件A在n次实验中出现m次,m与n的比值,就是随机事件A出现的频率。用公式即为当n无限增大时,随机事件A的频率会稳定在一个常数P,这个常数就是随机事件A概率的估计值。这样获得的概率称为后验概率。用公式表示就是: (5.1 )(5.2 )例如:在体育课上,老师想考查学生的 投篮水平,让学生站在距篮板一定的距离投十 个球。假定投了十次,进了六个。那么把球投 进篮筐这个随机事件发生的频率为多少?解:答:球投进篮筐发生的频率是0.60。如前边投篮的例子。投10次时频率是0.60, 现在老师让学生投100次,结果进了55次。这时频 率又变成0.55。假如老师又让这个学生投1000次, 结果投进500次,这时频率又变成0.50。假定 这个频率逐渐稳定在0.51。这时0.51就是这位学生 投篮概率的估计值。通过这种方法求得的概率,称 为后验概率。再如:抛掷一枚质地均匀的硬币,正面朝上(随机事件A)的概率是多少?先抛掷一次,结果正面朝上,这时频率是1/1,即1;第二次试验,结果正面朝下,这时频率变为1/2,即0.50;再抛一次,结果正面朝上,频率变为2/3,即0.67;第四次抛,正面朝下,频率变为2/4,即0.50;再抛,结果朝下,这时频率变为2/5,即0.40;最后这个频率逐渐接近于0.50,这时就可说硬币正面朝上的后验概率为0.50。后验概率即为频率的稳定性。先验概率又叫古典概率,可以通过简单计算得来。但需满足两个条件:试验的所有结果是有限的;每一种可能结果出现的可能性(概率)相等。若所有可能结果的总数为n,随机事件A包括m个可能结果,则随机事件A出现的概率计算公式为: (5.3 )例如:抛掷一枚硬币,考察其正面朝上 的概率。首先,看是否符合先验概率计算所要 求的两个条件。抛掷一枚硬币只有两种可能, 即n=2;朝上朝下的频率相等。解:答:正面朝上的概率为0.50 。再如:有一付新买来的扑克牌,从中抽一张,问抽到红桃的概率是多少?抽到老K的概率是多少?抽到大王的概率是多少?解 :(1)13/54=0.2407; (2)4/54=0.0741; (3)1/54=0.0185答:抽到红桃的概率是0.2407,抽到老K的概率 是0.0741,抽到大王的概率是0.0185。二概率的公理系统1任何随机事件任何随机事件的概率都是在0与1之间的正数,即0 P(A)12不可能事件不可能事件的概率等于零,即 P(V)= 0 3必然事件必然事件的概率等于1,即 P(U)= 1 三概率的加法定理和乘法定 理概率的加法定理概率的加法定理 若事件发生,则事件就一定不发生,这样的两个事件为互不相容事件。两互不相容事件互不相容事件和的概率,等于这两个事件概率之和,即(54) (55) 有限个互不相容事件和的概率,等于这些事 件概率之和,即例如:抛掷一枚硬币,正面朝上和正面 朝下的概率各为0.50,问在实验中,硬币正面 朝上或朝下的概率是多少。答:硬币正面朝上或朝下的概率是1。解:答:获得一、二、三等奖的概率分别为 :0.002、0.005和0.993;获奖的概率为1。解 :同理得再如:在学校里,有的老师喜欢用口试 ,假设这位老师共编了5个试题,每个学生只 能抽到1道题,现在请问学生抽到第3题或第5 题的概率是多少。 解 :答:学生抽到第3题或第5题的概率是0.40。概率的乘法定理若事件发生不影响事件是否发生,这样的两个事件为互相独立事件。两个互相独立事件积互相独立事件积的概率,等于这两个事件概率的乘积,即 (56) (57) 例如:有红、绿、兰3个球放在一个布袋子里,在一次抽取中,摸到红、绿、兰各种颜色的球的概率各为1/3。现在让抽取了一次后,把球放回去再抽取一次,问两次都摸着红球的概率是多少?若每次摸完球后都放回去,那么连续四次都摸到红球的概率是多少?解:再如:在学校里,有的老师喜欢用口试,假设这位老师共编了5个试题,每个学生只能抽到1道题,现在请问两个学生同时抽到第1题的概率是多少。解:答:两个学生同时抽到第1题的概率是0.04。概率的加法和乘法可以同时混合计算。 如:有一个人同时掷两个骰子,问这个人掷 出2点的概率和掷出3点的概率各为多少。解:(1)(2)答:掷出2点和3点的概率分别为0.0278和0.0556。四、概率分布类型概率分布(probability distribution)是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。依不同的标准,对概率分布可作不同的分类。、离散型分布与连续型分布依随机变量的类型,可将概率分布分为离散型概率分布离散型概率分布与连连续型概率分布续型概率分布。心理与教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。 、经验分布与理论分布依分布函数的来源,可将概率分布分为经验分布与理论分布。 经验分布经验分布(empirical distribution)是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。 理论分布理论分布(theoretical distribution)是按某种数学模型计算出的概率分布。 、基本随机变量分布与抽样分布依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布(sampling distribution)。 基本随机变量分布基本随机变量分布是随机变量各种不同取值情况的概率分布,抽样分布抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。五二项分布二项分布(bionimal distribution)是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。1二项试验满足以下条件的试验称为二项试验:一次试验只有两种两种可能的结果结果,即成功(某事件发生)和失败(某事件不发生);各次试验相互独立独立,即各次试验之间互不影响;各次试验中成功成功的概率相等,失败失败的概率也相等相等。2二项分布函数二项分布是一种离散型随机变量的概率分布。基本上属于理论分布。用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X0,1)的概率分布,叫做二项分布函数。二项展开式的通式(即二项分布函数):(5.8)X=0,1,2,n二项展开式的要点:项数:二项展开式中共有n1项。方次:p的方次,从0n为升幂;q的方次,从n0为降幂。每项p与q的方次之和等于n。系数:各项系数是成功事件次数的组合数。从两端起,等距项的系数相等;当项数为奇数时(n为偶数),中间一项的系数最大;当项数为偶数时(n为奇数),中间两项系数相等且最大。例:从男生占/的学校中随机抽取个学生,问正好抽到个男生的概率是多少?最多抽到个男生的概率是多少?解:将n=6,p=2/5,q=3/5,X=4代入上式,则恰好抽到4个男生的概率为最多抽到个男生的概率,等于 个也没有抽到、抽到个和抽到两个男生 的概率之和,即再如:假定有10道是非题,有个学生来做,但由于不懂,而完全靠猜测。现在问他猜对9道题和10道题的概率各是多少,至少答对9道题的概率又是多少。分析:根据已知n=10,把每次看作一次试验,猜对时我们就说这次试验成功,猜中9道题,则X=9,现在计算X等于9和10的概率各为多少。解:同理得答:猜对9道题和10道题的概率各是0.00977和0.00098, 至少答对9道题的概率是0.01075。3二项分布图以成功事件出现的次数为横坐标,以成功事件出现不同次数的概率为纵坐标,绘制直方图或多边图,即为二项分布图。二项分布是离散型分布,其概率直方图是跃阶式。 二项分布的性质从概率直方图可以看到,二项分布有如下性质:当p=q时,不管n有多大,二项分布呈对称形。当n很大时,二项分布接近于正态分布。当n趋近于无限大时,正态分布是二项分布的极限。当pq时,且n相当小时,直方图呈偏态。pq与pq时的偏斜方向相反。当pq且np5,或者pq且nq5时,二项分布可近 似看作正态分布,二项分布的概率可用正态分布的概率作为 近似值。4二项分布的平均数和标准差如果二项分布满足pq且 nq5(或者p q且 np5)时,二项分布接近于正态分布。 可用下面的方法计算二项分布的平均数和标准 差。 二项分布的平均数为二项分布的标准差为(5.9) (5.10) 例如:有一份试卷,共有50道选择题,并且都为四选一,假定一个学生一点都不会,只能凭猜测来回答。问凭猜测来回答,平均能猜对几道题,猜对题目数的标准差为多少。分析:因为完全不会做而只是靠猜测 ,因此属于二项分布的运用条件。解:答:凭猜测来回答,平均能猜对12.5道题, 猜对题目数的标准差为3.06。5二项分布的应用二项分布函数除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。 例如,一个学生凭猜测做10个是非题,平均可以猜对5题。什么情况下可以说他是真会而不是猜测呢?这种问题需要用累积概率来算。当做对题或题以上时,累积概率为0.989,也就是说,猜对题或10题的概率不足0.05。 表5-1 一个学生做10个正误题做对不同题数的概率分布做对题对题 目 数出现现方式 数概率P(X)累积积概率 010.0010.001 1100.0100.011 2450.0440.055 31200.1170.172 42100.2050.377 52520.2460.623 62100.2050.828 71200.1170.945 8450.0440.989 9100.0100.999 1010.0011.000 总总和10241.000例:一个教师对8个学生的作业成绩进行猜测,如果教师猜对的可能性为13,问:平均能猜对几个学生的成绩?假如规定猜对95,才算这个教师有一定的评判能力,那么这个教师至少要猜对几个学生?解: 六、正态分布及应用标准分数标准分数(standard score),又称为基分数或分数(Zscore),是以标准差为单位,表示一个原始分数在团体中所处位置的相对位置的量数。标准分数从分数对平均数的相对地位相对地位、该组分数的离中趋势离中趋势两个方面来表示原始分数的地位。 1.标准分数的计算标准分数的计算公式为或分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。把原始分数转换成分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位、以平均数为参照点的分数。 2.标准分数的性质分数无实际单位,是以平均数为参照点、以标准差为单位的相对量。 一组原始分数得到的分数既有正值,也有负值,所有原始分数的分数之和为零。 标准正态分布的平均值为,标准差为。3.标准分数的优点 可比性可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。 可加性可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。 明确性明确性:标准分数较原始分数的意义更为明确。 合理性合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地反映事实。4、标准分数的应用用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。 计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。 当研究需要合成不同质的数据时,如果已知这些不同质的观测值的次数分布为正态,这时可采用分数来计算不
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号