资源预览内容
第1页 / 共185页
第2页 / 共185页
第3页 / 共185页
第4页 / 共185页
第5页 / 共185页
第6页 / 共185页
第7页 / 共185页
第8页 / 共185页
第9页 / 共185页
第10页 / 共185页
亲,该文档总共185页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
十章概率与统计初步十章概率与统计初步10.1.1 10.1.1 随机事件的概念、关系和运算随机事件的概念、关系和运算 必然现象必然现象在一定的条件下,必然会发生的现象在一定的条件下,必然会发生的现象例如例如 向上抛一枚硬币,由于受到地心引力的作用,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落我们把这类现硬币上升到某一高度后必定会下落我们把这类现象称为必然现象同样,任何物体没有受到外力作象称为必然现象同样,任何物体没有受到外力作用时,必定保持其原有的静止或等速运动状态;导用时,必定保持其原有的静止或等速运动状态;导线通电后,必定会发热等等也都是必然现象。线通电后,必定会发热等等也都是必然现象。10.1随机事件的概率随机事件的概率特殊的随机事件:特殊的随机事件: 必然事件必然事件 在一定条件下必定发生的 事件,记为 不可能事件不可能事件在一定条件下一定不发生的事件,记为 .例例:某城市共有某城市共有500辆辆出租出租车车,其牌照,其牌照编编号从号从00011000之之间选间选取,取,记记事件事件A=偶然遇到一偶然遇到一辆辆出租出租车车,其牌照号,其牌照号码码中含有数字中含有数字8B=连续连续碰碰见见三三辆辆出租出租车车,其牌照号,其牌照号码码均含有数字均含有数字8都都是随机事件是随机事件C=该该城市中出租城市中出租车车牌照牌照编编号号为为8000为为不可能事件不可能事件. .例子例子 随机试验随机试验 随机事件例例 1 1 抛一枚硬币,观察出现的结果.A1=正面朝上, A2=反面朝上例例 2 2 从一批产品中任意取 10个样品,观测其中的次品数. B=取出的10个样品中有1至3个次品 例例 3 3 记录某段时间内电话交换台接到的呼唤次数. C=在该段时间内电话交换台接到的呼唤次数不超过8次 例例 4 4 测量某个零件的尺寸与规定尺寸的偏差 x(mm). D=测得零件的尺寸与规定尺寸的偏差小于 01mm l l引例引例例例从一批含有正品,次品的产品中,任取两件设有以从一批含有正品,次品的产品中,任取两件设有以下事件:下事件: A A1 1=两件中至少有一件是次品两件中至少有一件是次品 A A2 2=两件中恰有一件是次品两件中恰有一件是次品 A A3 3=两件全是次品两件全是次品 A A4 4=两件全是正品两件全是正品 A A5 5=两件中至多有一件次品两件中至多有一件次品 这些事件间存在着多种关系,这些事件间存在着多种关系,如如:(1 1)A A1 1发生,则发生,则A A4 4不会发生;不会发生;(2 2)A A4 4发生,则发生,则A A1 1不会发生;不会发生;(3 3)A A3 3与与A A4 4不会同时发生;不会同时发生;(4 4)当且仅当)当且仅当A A2 2与与A A3 3至少有一个发生时,至少有一个发生时,A A1 1发生;发生;(5 5)当且仅当)当且仅当A A2 2与与A A4 4至少有一个发生时发生至少有一个发生时发生,A A5 5发生发生 A 包含于B 事件事件A 发生必发生必导致事件导致事件B发生发生 A B 且1.事件的包含2.事件的相等事件事件A与事件与事件B至至少有一个发生少有一个发生的和事件的和事件A+B发生发生 3.事件的和(并)A与与B的和事件的和事件或或发生事件事件A 发生,但发生,但事件事件B不发生不发生 A与与B的差事件的差事件4.事件的差A与与B互相对立互相对立每次试验每次试验A、B中中有且只有一个发生有且只有一个发生称称B为为A的对立事件的对立事件(或逆事件或逆事件),记为记为5.事件的对立AA与与B互不相容互不相容A、B不可能同不可能同时发生时发生AB两两互不相容两两互不相容6.事件的互不相容( (互斥互斥) )注意:注意:“A与与B互相对立互相对立”与与“A与与B互斥互斥”是不同的概念是不同的概念若事件若事件A与事件与事件B是相互是相互对对立的立的两个事件,两个事件,则则它它们们一定互不相容;一定互不相容;反之不一定反之不一定.事件的关系及运算的概念类似于集合论中集合间的事件的关系及运算的概念类似于集合论中集合间的关系与运算的概念,其记号也是相对应的,列表对关系与运算的概念,其记号也是相对应的,列表对照说明如下:照说明如下:例例在在1,2,3,10十个数中任十个数中任选选一个,若一个,若选选取的数取的数为为1则记为则记为1,设设A=选选取的数取的数为为偶数偶数,B=选选取的数取的数为为小于小于5的偶数的偶数,C=选选取的数小于取的数小于5,D=选选取的数取的数为为奇数奇数则则 交换律交换律 A+B=B+A AB=BA结合律结合律A+(B+C)=(A+B)+C ; A(BC) =(AB)C 分配律分配律 (1) A(B+C)=AB+AC (第一分配律)(第一分配律) (2) A+BC=(A+B)(A+C)(第二分(第二分配律)配律)运算律运算律事件运算对应集合运算定理定理1 若事件若事件A,B互不相容,则互不相容,则 称为概率的称为概率的加法公式加法公式. .证明:证明: 设在某一条件下将试验重复进行设在某一条件下将试验重复进行 n n次,即基本次,即基本事件总数为事件总数为n. n. 其中事件其中事件A A包含的基本事件数为包含的基本事件数为 m m1 1,事,事件件B B包含的基本事件数为包含的基本事件数为 m m2 2, 加法公式加法公式 P(A)=,P(B)= 由于由于A与与B互不相容,故事件互不相容,故事件A+B包含的基本事件数包含的基本事件数为为m1+m2,同同样样由古典概率的定由古典概率的定义义有有故概率的加法公式成立故概率的加法公式成立.推论推论1若事件若事件 两两互不相容,两两互不相容,则则推论推论2 2 事件事件A A的对立事件的对立事件 的概率为的概率为 定理定理2设设A,B为任意两事件,则为任意两事件,则证明证明:因为因为A+B=,并且,并且 与与B互互不相容,于是不相容,于是 又由于又由于 因此对于三个随机变量,类似地有因此对于三个随机变量,类似地有 P(AP(A1 1+A+A2 2+A+A3 3)=P(A)=P(A1 1)+P(A)+P(A2 2)+P(A)+P(A3 3) -P(A) -P(A1 1A A2 2) ) -P(A-P(A1 1A A2 2) -P(A) -P(A2 2A A3 3)+P(A)+P(A1 1A A2 2A A3 3) ) 我们可划出维恩图说明其意义该结论又我们可划出维恩图说明其意义该结论又称为称为“多除少补原理多除少补原理”,对于事件的个数,这,对于事件的个数,这一原理还可推广到一原理还可推广到n n个的情形个的情形 于是有于是有因此因此 例例: :一批产品共一批产品共5050件,其中有件,其中有5 5件是次品,从这件是次品,从这批产品中任取批产品中任取3 3件,求其中有次品的概率件,求其中有次品的概率 解法解法1 1 设设A=A=取到的取到的3 3件产品中有次品件产品中有次品 ; A Ai i= = 取到的取到的3 3件产品中恰有件产品中恰有i i件次品件次品(i=1,2,3) (i=1,2,3) 则,则,由定理由定理1 1的推论的推论1 1得得 解法解法2设设A=取到的3件产品中有次品; =取到的3件产品中无次品,则有则有频频率率设在设在n次试验中,事件次试验中,事件A发生了发生了m 次,次,则称则称为事件为事件A 发生的发生的频频率率记作记作fn(A),其中其中m为为频数频数10.1.2随机事件的概率随机事件的概率试验试验序号序号 n=5 n=50 n=500 nA fn(A) nA fn(A) nA fn(A)12345678910 2315124233 0.40.60.21.00.20.40.80.40.60.6 22252125242118242731 0.440.500.420.500.480.420.360.480.540.622512492562532512462442582622470.5020.4980.5120.5060.5020.4920.4880.5160.5240.494 做做“抛掷硬币抛掷硬币”的试验,我们将一枚硬币抛掷的试验,我们将一枚硬币抛掷5 5次、次、5050次、次、500500次,各做次,各做1010遍,得到数据如表遍,得到数据如表1-11-1所示;所示;其中其中A=A=朝上的一面是正面朝上的一面是正面 ,n nA A表示事件表示事件A A发生的发生的频数频数, ,表示表示A A发生的频率发生的频率 抛硬币试验抛硬币试验 :频率的性质频率的性质q q 实践证明:在大量重复试验中,随机事实践证明:在大量重复试验中,随机事件的频率具有稳定性也就是说,在不同的件的频率具有稳定性也就是说,在不同的试验序列中,当试验次数试验序列中,当试验次数n n充分大时,随机事充分大时,随机事件件A A的频率的频率f fn n(A)(A)常在常在某个确定的数字某个确定的数字附近摆附近摆动动 在抛硬币的试验中,在抛硬币的试验中,“正面朝上正面朝上”这一这一随机事件随机事件A A的频率的频率f fn n(A)(A)稳定在数字稳定在数字0.50.5的附近的附近类似的例子还可以举出很多类似的例子还可以举出很多. . 频率的稳定性频率的稳定性试验者试验者 n nA fn(A)德德莫根莫根蒲蒲 丰丰KK皮尔逊皮尔逊K K皮尔逊皮尔逊 2048204840404040120001200024000 24000 10611061204820486019601912012 12012 0.51810.51810.50690.50690.50160.50160.50050.5005 历史上不少著名学者做过抛掷硬币试验,历史上不少著名学者做过抛掷硬币试验,历史上不少著名学者做过抛掷硬币试验,历史上不少著名学者做过抛掷硬币试验,得到的数据如下:得到的数据如下:得到的数据如下:得到的数据如下: 概率的统计定义概率的统计定义 在相同条件下重复进行的 n 次试验中, 如果事件 A 发生的频率f fn n(A)(A)稳定在某一数值P的附近摆动,且随n的增大,摆动幅度越来越小,则称P为随机事件A的概率,记作P(A)概率的统计定义也提供了一个近似计算概率的概率的统计定义也提供了一个近似计算概率的方法方法:当试验次数当试验次数n较大较大时有时有:事件发生事件发生的的概率概率事件发生事件发生的的频频率率 即当试验次数即当试验次数n充分大时充分大时,就常把事件就常把事件A的频的频率作为事件率作为事件A的概率的的概率的“近似值近似值”(或(或“估值估值”)比如:合格率,废品率,出生率,升学率,死比如:合格率,废品率,出生率,升学率,死亡率等等,都是频率亡率等等,都是频率1. 01. 0P(A)P(A)1;1; 2. 2. P()P()=1,=1,P()P()=0.=0.于是有下列于是有下列性质性质1 1条件概率的概念条件概率的概念 一一、条件概率、条件概率 在事件在事件B B发生的条件下,事件发生的条件下,事件A A发生的发生的概率称为概率称为条件概率。记为记为10.1.3几类常见的概率问题几类常见的概率问题2、条件概率的性质条件概率的性质 如果如果A A,B B是随机试验的两个随机事件,是随机试验的两个随机事件,且且P P(B B)00的,则称在事件的,则称在事件B B发生的前提下发生的前提下事件事件A A发生的概率为发生的概率为条件概率条件概率,记作记作 P P(A AB B)这个条件概率定义为这个条件概率定义为 P(AB)= 例例 两城市都处于长江中下游,根据近一百余年的气象两城市都处于长江中下游,根据近一百余年的气象资料记录,知道两城市的雨天所占的比例分别为资料记录,知道两城市的雨天所占的比例分别为20%20%和和18%18%,两城市同时下雨所占的比例为,两城市同时下雨所占的比例为12%12%,求:求:已知甲市为雨天时,乙市也为雨天的概率;已知甲市为雨天时,乙市也为雨天的概率; 已知乙市为雨天时,甲市也为雨天的概率已知乙市为雨天时,甲市也为雨天的概率. .解解 , 则有则有 . 把事件A发生的前提下事件B发生的条件概率条件概率,记作 P(BA)P(BA)=例例已知一批已知一批产产品的次品率品的次品率为为5%,正品率中的一,正品率中的一级级品率品率为为80%从中任取一件,从中任取一件,试试求它是一求它是一级级品的概率品的概率解解设设A=被取到的一件被取到的一件产产品是正品品是正品,B=被取到的一件被取到的一件产产品是一品是一级级品品依依题题意得意得=1-0.05=0.95因因为为P(B/A)=0.80, 所以 AB=B于是于是P(B)=P(AB)=P(A)P(B/A)乘法公式可以推广到有限个事件的情形乘法公式可以推广到有限个事件的情形对于事件对于事件 一般的有一般的有 由条件概率的定义可得:P P(ABAB)=P=P(B B)P P(A AB B)(当P(B)0时) 或P P(ABAB)=P=P(A A)P P(B BA A)(当P(A)0时) 此二公式称为概率的乘法公式乘法公式 注:当注:当P(AB)P(AB)不容易直接求得时,可考虑利不容易直接求得时,可考虑利用用P(A)P(A)与与P(BP(B A)A)的乘积或的乘积或P(B)P(B)与与P(A|B)P(A|B)的乘积的乘积间接求得。间接求得。 乘法公式乘法公式乘法公式可以推广到有限个事件的情形乘法公式可以推广到有限个事件的情形对于事件对于事件 一般的有一般的有 例例 一批产品的次品率为一批产品的次品率为4 4,正品中一等品率为,正品中一等品率为7575,现从这批产品中任意取一件,试求恰好取到一,现从这批产品中任意取一件,试求恰好取到一等品的概率。等品的概率。解:解: 记记A A 取到一等品取到一等品 ,B B 取到次品取到次品 , 取到正品取到正品 , 则则 由于由于 故故 于是于是 如果事件如果事件 构成一个完备事构成一个完备事件组,并且件组,并且 ,则对则对于任一事件于任一事件B,有,有称为称为全概公式全概公式二、全概率公式二、全概率公式例例三门火炮向同一目标射击,设三门火炮击中三门火炮向同一目标射击,设三门火炮击中目标的概率分别为目标的概率分别为0.3,0.6,0.8若有一门火炮若有一门火炮击中目标,目标被摧毁的概率为击中目标,目标被摧毁的概率为0.2;若两门火;若两门火炮击中目标,目标被摧毁的概率为炮击中目标,目标被摧毁的概率为0.6;若三门;若三门火炮击中目标,目标被摧毁的概率为火炮击中目标,目标被摧毁的概率为0.9试求试求目标被摧毁的概率目标被摧毁的概率解解 设事件B=目标被摧毁 显然,A1,A2,A3构成一个完备事件组,由全概公式可得:依题意知应用全概率公式,得 例例 某地区的初中毕业生有某地区的初中毕业生有70 70 报考普通高中,报考普通高中,2020报考中专,报考中专,10 10 报考职业高中,录取率分别为报考职业高中,录取率分别为9090,75 75 ,85 85 ,试求:试求:随机调查学生,他如愿以尝的概率;随机调查学生,他如愿以尝的概率; 若某位学生按志愿录取了,那么他报考高中的概率是多少?若某位学生按志愿录取了,那么他报考高中的概率是多少?解解 事件事件A=A=该生被录取该生被录取 B B1 1=该生报考普通高中该生报考普通高中 B B2 2=该生报考中专该生报考中专 B B3 3=该生报考职业高中该生报考职业高中 则有则有 从而从而 由全概率公式有由全概率公式有 (2 2) 由逆概率公式有由逆概率公式有 下面要介绍的逆概公式是全概公式的逆问题:下面要介绍的逆概公式是全概公式的逆问题:若已知若已知“结果结果”B”B已经发生了已经发生了, ,要求某一种要求某一种“原因原因”A”Aj j发发生的概率生的概率 此公式称为此公式称为逆概公式逆概公式(或(或贝叶斯贝叶斯(Bayes)(Bayes)公式公式)设设构成一个完备事件组构成一个完备事件组则对于任一事件则对于任一事件B B ,三、贝叶斯公式(三、贝叶斯公式(逆概率公式逆概率公式)证明 由条件概率的定义及乘法公式有由此,可得再将全概率公式代入上式, 即得例 设8支枪中有3支没有经过试射校正,5支经过试射校正一射手用校正过的枪射击时,中靶的概率为0.8,用未校正的枪射击时,中靶的概率为0.3,今从8支枪中任取一支进行射击,结果中靶求所用的这支枪是经过校正过的概率解解设A1=枪经过试射校正A2=枪没有经过试射校正,则A1,A2构成完备事件组由题意知由题意知P P(A1A1)=5/8=5/8, P P(A2A2)=3/8=3/8, 由全概公式可得:又由逆概公式得 引例引例 盒中有盒中有3个黑球和个黑球和2个白球,从中随机抽取个白球,从中随机抽取3个,考个,考虑取得的白球数。虑取得的白球数。抽取的白球数有三个可能结果:抽取的白球数有三个可能结果:0,1或或2,对于不,对于不同的抽取次数其结果可能不同。为此,引入一个变量同的抽取次数其结果可能不同。为此,引入一个变量,用,用表示表示“抽取的白球数抽取的白球数”,该变量的不同取值表达不,该变量的不同取值表达不同的随机事件,如同的随机事件,如(=0)表示表示“抽取的抽取的3个球中无白球个球中无白球”;(=1)表示表示“抽取的抽取的3个球中有个球中有1个白球个白球”;(2)表示)表示“抽取的抽取的3个球中至多有个球中至多有2个白球个白球”。10.2随机变量及其应用随机变量及其应用10.2.1随机变量的定义随机变量的定义如果一个随机试验的结果可以用一个变量如果一个随机试验的结果可以用一个变量的取值来表示,则称这个变量的取值来表示,则称这个变量为为随机变量随机变量。通常我们用希腊字母通常我们用希腊字母,或大写或大写英文字母英文字母X,Y,Z,表示随机变量。表示随机变量。例例抛掷一枚硬币,试验的结果为抛掷一枚硬币,试验的结果为“出现正面出现正面”和和“出现反面出现反面”,引入变量,引入变量,返回=1,出现正面,出现正面0,出现反面,出现反面则则为随机变量,为随机变量,(=0),(=1)便是随机事件。便是随机事件。例例在在2424小时内,程控电话交换机接转电小时内,程控电话交换机接转电话的次数话的次数是一个随机变量,它可取一切是一个随机变量,它可取一切非负整数非负整数0,1,2,.0,1,2,.同时,随机变量同时,随机变量取取不同的值就表示不同的随机事件,不同的值就表示不同的随机事件,例如例如( (=0)=0),( (=10)=10),(5(520)20)等等表示不同的随机事件。表示不同的随机事件。例例在一批灯泡中任意抽取一只,测试其寿命,在一批灯泡中任意抽取一只,测试其寿命,那么灯泡的寿命那么灯泡的寿命 ( (小时小时) )是一个随机变量,是一个随机变量,显然显然的一切可能取的值是非负实数值的一切可能取的值是非负实数值, ,返回即即R+0,而而(=1200),(5000),(1500)等都是等都是随机事件。随机事件。例例 用变量用变量表示某品种玉米穗位的高低表示某品种玉米穗位的高低(单位:厘米)。(单位:厘米)。 则则P P(120120130130)=0.2=0.2表示表示“玉米穗位在玉米穗位在120120厘米到厘米到130130厘米之间厘米之间”这这个事件的概率为个事件的概率为0.20.2。由于。由于 所以,只需知道所以,只需知道P(130)与)与P(120)就)就可以求出可以求出P(120130)了。)了。返回由此可知,随机试验的结果可以用变由此可知,随机试验的结果可以用变量来表示,但这种量来表示,但这种“变量变量”与微积分中的与微积分中的“变量变量”是有区别的是有区别的.以例中白球数以例中白球数这个这个变量为例,它有变量为例,它有:取值的随机性,也就是说取值的随机性,也就是说取哪一个取哪一个值,在抽样前无法确定;值,在抽样前无法确定;取值的统计规律性,也就是取值的统计规律性,也就是取取0,1,2这些值的概率是确定的。这些值的概率是确定的。两个特点两个特点随机变量的分类如如“取到次品的个数取到次品的个数”,“收到的呼叫数收到的呼叫数”等等.随随机机变变量量离散型离散型随机变量随机变量连续型连续型随机变随机变量量所有取值可以逐个所有取值可以逐个一一列举一一列举例如,例如,“电视机的寿命电视机的寿命”,实,实际中常遇到的际中常遇到的“测量误差测量误差”等等.全部可能取值不仅全部可能取值不仅无穷多,而且还不能无穷多,而且还不能一一列举,而是充满一一列举,而是充满一个区间一个区间.这两种类型的随机变量因为都是随这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处;机变量,自然有很多相同或相似之处;但因其取值方式不同,又有其各自的特但因其取值方式不同,又有其各自的特点点.随随机机变变量量连续型连续型随机变量随机变量离散型离散型随机变量随机变量学习时请注意它们各自的特点和描述方法学习时请注意它们各自的特点和描述方法.10.2.2常见离散型随机变量常见离散型随机变量 若随机变量若随机变量的所有可能取值是有限个或可列个的所有可能取值是有限个或可列个,则称则称为为离散型随机变量离散型随机变量设离散型随机变量设离散型随机变量的所有可能取值的所有可能取值为为 P 则称该式为则称该式为的的概率分布概率分布或或分布列分布列取这些值的概率为取这些值的概率为概率分布列也常常列成表格的形式:概率分布列也常常列成表格的形式:分布列的性质分布列的性质q 非负性q 归一性例例对于第一节中的例,求抽取的白球数对于第一节中的例,求抽取的白球数的分布的分布列。列。解解是离散型随机变量,取值为是离散型随机变量,取值为0,1,2,的分布的分布列为列为即即例例已知离散型随机变量的分布列为:已知离散型随机变量的分布列为:求 (1) (-16); (2) (=1)。解解 (1)注意到-16,离散型随机变量的可能取值只有三个,即0,3及6,所以P(-16) (2) 注意到的可能取值没有,说明事件(=1)是不可能事件, 所以 P(=1) =(1)两点分布两点分布(或(或01分布分布)凡试验只有两个结果, 常用0 1分布描述, 如产品是否合格、人口性别统计、系统是否正常、电力消耗是否超标等。 = xk 1 0pk p 1 - p(0 p 0 为常数显然显然,且,且例例假设某元件的寿命服从参数假设某元件的寿命服从参数=0.0015的的指数分布,求它使用指数分布,求它使用1000小时后还没有坏的小时后还没有坏的概率概率.解解设设为该元件的寿命,则为该元件的寿命,则(3) 正态分布正态分布若随机变量 的概率密度函数为则称 服从参数为 , 2 的正态分布记作 N ( , 2 )为常数,正态分布图象f(x)的性质的性质: 图形关于直线 x = 对称, 即1. 在 x = 时, f (x) 取得最大值2. 在 x = 时, 曲线 y = f (x) 在对应的 点处有拐点3. 曲线 y = f (x) 以 x 轴为渐近线4. 曲线 y = f (x) 的图形呈单峰状f ( + x) = f ( - x) 特别地,当特别地,当 时,即时,即 ,称为标准正态分布,它的概率密度函数为,称为标准正态分布,它的概率密度函数为显然显然,可以证明,可以证明不难验证不难验证, , 若若 对于对于 作标准化代换作标准化代换 则有则有 故故 即任意一个正态分布都可以通过标准化代换转化为标准正态分布即任意一个正态分布都可以通过标准化代换转化为标准正态分布. . 正态分布是概率论中最重要的分布之一正态分布是概率论中最重要的分布之一. . 例如,测量的误差、一批产品的质量指标、例如,测量的误差、一批产品的质量指标、人体的身高或体重、农作物的单位面积产量、人体的身高或体重、农作物的单位面积产量、炮弹弹着点的分布、气象中的月平均气温、炮弹弹着点的分布、气象中的月平均气温、湿度、降水量等都服从或近似服从正态分布湿度、降水量等都服从或近似服从正态分布. . 另外,正态分布又具有许多良好的性质,另外,正态分布又具有许多良好的性质,许多分布可用正态分布来近似,它能描述相许多分布可用正态分布来近似,它能描述相互独立的多个微小因素的综合效果,在数理互独立的多个微小因素的综合效果,在数理统计中解决实际问题时用得最多的就是正态统计中解决实际问题时用得最多的就是正态分布或与正态分布有关分布或与正态分布有关. .引例引例 甲、乙两射手,在同样条件下进行射击。他们命中的环数分别记为、,其概率分布列分别为:试问如何来评定两个射手的技术优劣?10.3随机变量的数字特征随机变量的数字特征10.3.1随机变量的数学期望随机变量的数学期望解解虽然分布列完整地描述了虽然分布列完整地描述了、的统计规律,的统计规律,但对于他们的技术优劣不能直接由分布列看出但对于他们的技术优劣不能直接由分布列看出结果若考虑平均射中的环数则可求得问题的结果若考虑平均射中的环数则可求得问题的答案,假定他们各射击答案,假定他们各射击100次,则次,则甲平均射中的环数约为乙平均射中的环数约为 (820+950+1030)=9.1(环)(830+910+1060)=9.3(环)故故从平均射中的环数看,甲的技术优于乙设离散型随机变量 的分布列是若级数的的数学期望数学期望或或平均值平均值(简称简称期望期望),记为记为E或或E()绝对收敛,则称其和为随机变量p p1 p2 p4 例例解解由由E的定义得的定义得设随机变量设随机变量的分布列为的分布列为 求求EE 例例设随机变量有分布列试求 的数学期望.解解此题显然不必考虑的绝对收敛性,因为它是有限和, =(-1)0.1+00.2+10.1+20.3+30.3=1.5常见离散的随机变量的数学期望常见离散的随机变量的数学期望(1)二点分布二点分布设服从二点分布,其分布列为:则 =1p+0q=p (q=1-p) (2)(2)二项分布二项分布二项分布二项分布设 B ( n , p )则则特例特例若若Y B (1 , p ),则则E(Y)=np 由此可见,当进行由此可见,当进行n n重贝努利试重贝努利试验时,如果每次成功的概率是验时,如果每次成功的概率是p p , ,则则n n次试验成功的平均次数是次试验成功的平均次数是npnp(3)泊松分布泊松分布设设服从参数为服从参数为的泊松分布,其分布列为的泊松分布,其分布列为则则*(4)几何分布)几何分布 设 服从几何分布,其分布列为则则分布期望概率分布二点分布二点分布p泊松泊松分布分布常见离散的随机变量的数学常见离散的随机变量的数学期望期望二项分布二项分布np 设连续型函数的随机变量的密度函数为f (x), 绝对收敛, 则称为随机变量的数学期望或平均值(简称期望)。如果否则称的数学期望不存在。连续型随机变量的数学期望连续型随机变量的数学期望例例解解注意注意不是所有的连续型随机变量都有数学期望不是所有的连续型随机变量都有数学期望分布期望概率密度均匀分布指数分布正态分布数学期望的简单性质数学期望的简单性质(1)E(c)=c;(c为常数为常数),即常量的数学期望常量本身即常量的数学期望常量本身(2)E(k+b)=kE()+b;k,b常数常数(3)E(+)=E()+E();(4)设设,相互独立相互独立,则则E()=E()E();注注:1.性性质质(3)和和(4)可可以以推推广广到到有有限限个个随随机机变变量量1,2, , n的情况;的情况;2.对对于于“和和”,不不要要求求1,2,n相相互互独独立立;对对于于“积积”要求要求1,2,n相互独立。相互独立。引例引例 甲、乙两射手各打了6 发子弹,每发子弹击中的环数分别为:甲 10, 7, 9, 8, 10, 6, 乙 8, 7, 10, 9, 8, 8, 问哪一个射手的技术较好?解解 首先比较平均环数首先比较平均环数甲 = 8.3, 乙 = 8.3有五个不同数有四个不同数10.3.2随机变量的数学期望随机变量的数学期望再比较稳定程度再比较稳定程度甲:乙:乙比甲技术稳定,故乙技术较好.进一步比较平均偏离平均值的程度进一步比较平均偏离平均值的程度甲乙 E - E()2若E - E2 存在, 则称其为随机称为 的均方差均方差或标准差标准差.定义定义 即 D ( ) = E - E2 变量 的方差方差, 记为D 或 D()两者量纲相同两者量纲相同D( ) 描述 的取值偏离平均值的平均偏离程度若 为离散型 随机变量,分布列为若 为连续型随机变量 ,概率密度为 f ()计算方差的常用公式:计算方差的常用公式:由数学期望的性质可知由数学期望的性质可知,对于连续型随机变量对于连续型随机变量 对于对于离散型离散型随机变量随机变量常见随机变量的方差分布方差概率分布两点分布p(1-p)二项分布np(1-p)泊松分布分布方差概率密度均匀分布指数分布指数分布正态分布正态分布 D (C) = 0 D (k ) = k2D()D(k+b ) = k2D()(c为常数,k为常数)特别地,若 , 相互独立,则 方差的简单性质10.4.1 10.4.1 区间估计区间估计 用点估计法来估计总体的参数十分简单易行用点估计法来估计总体的参数十分简单易行, , 但由于但由于样本的随机性样本的随机性, , 从一个样本算得估计量的值不一定恰好从一个样本算得估计量的值不一定恰好是所要估计的参数值那么估计量的值与参数之间到底是所要估计的参数值那么估计量的值与参数之间到底相差多少相差多少? ? 另一方面,不同的样本会得到总体的同一参另一方面,不同的样本会得到总体的同一参数的不同估计量,数的不同估计量, 如何最后确定总体的参数值呢?因此如何最后确定总体的参数值呢?因此,我们有必要进一步介绍新的估计方法,我们有必要进一步介绍新的估计方法. . 这种方法是根这种方法是根据估计量的分布据估计量的分布, , 在满足一定的可信度的条件下在满足一定的可信度的条件下, , 指出指出被估计的总体的参数的可能取值范围这就是参数的区被估计的总体的参数的可能取值范围这就是参数的区间估计所要解决的问题间估计所要解决的问题10.4区间估计与假设检验区间估计与假设检验则称区间则称区间 为为 的的置信度为置信度为1 1的的置置信区间信区间设设 为一给定的很小的正数为一给定的很小的正数 为两个统计量为两个统计量, , 称为置信度置信度(也称为置信概率置信概率或置信系数置信系数) 若若 成立成立 分别称为是置信区间的上分别称为是置信区间的上, ,下限下限 q 反映了估计的可信度反映了估计的可信度, 越小越小,越可靠越可靠.q置信区间的长度置信区间的长度反映了估计精度反映了估计精度 越小越小,1- 越大越大,估计的可靠度越高估计的可靠度越高,但但q 确定后确定后,置信区间置信区间的选取方法不唯一的选取方法不唯一,常选最小的一个常选最小的一个.几点说明几点说明越小越小,估计精度越高估计精度越高.这时这时,往往增大往往增大,因而估计精度降低因而估计精度降低通常取通常取 =0.05或或0.00.0正态总体期望的区间估计正态总体期望的区间估计(1 1)总体方差)总体方差 2 2已知设总体设总体为为总体的样本值总体的样本值,于是于是故故从而知从而知 由由N N(0 0,1 1)的分布规律知:)的分布规律知: 因此,对可作如下估计:以上两式可作为公式使用以上两式可作为公式使用. .例例 某农场试种新品种水稻,已知该新品种水稻亩某农场试种新品种水稻,已知该新品种水稻亩产量的方差为产量的方差为64. 64. 现从该农场的水稻田中随机抽现从该农场的水稻田中随机抽1616亩进行实割实测,得到平均亩产量为亩进行实割实测,得到平均亩产量为412.5kg.412.5kg.试以试以95%95%的置信度计算该新品种水稻的平均亩产量的置的置信度计算该新品种水稻的平均亩产量的置信区间信区间. .解解 已知已知 由于由于 故故 即即 即即 于是于是 的置信区的置信区间为间为 ()总体的方差未知()总体的方差未知对于总体的方差未知的随机变量对于总体的方差未知的随机变量 当是大样本时当是大样本时 n30n30时作为大样时作为大样本而本而n30n1.96 故概率为故概率为0.050.05的事件发生了的事件发生了. . 一般地,一般地,人们宁可相信把握性较大的事件会发生(概人们宁可相信把握性较大的事件会发生(概率为率为0.950.95),也不愿意相信把握性较小的事),也不愿意相信把握性较小的事件会发生(概率为件会发生(概率为0.050.05). . 因此,我们拒绝因此,我们拒绝H H0 0,即这批砖的平均抗断,即这批砖的平均抗断强度为强度为33.50kg/cm33.50kg/cm2 2不成立不成立. . 于是,备选假于是,备选假设设 H1 :成立 在统计上,通常把发生的概率小于在统计上,通常把发生的概率小于5 5的事件的事件称为称为小概率事件小概率事件. . 它在一次试验中是几乎不可它在一次试验中是几乎不可能发生的事件,这种思想称为小概率原理能发生的事件,这种思想称为小概率原理. . 例例1 1的检验就是利用了小概率原理的检验就是利用了小概率原理. . 其中临其中临界值界值可称为可称为显著性水平显著性水平, ,通常取通常取5 5或或1 1. .利用了小概率原理,可能犯两类错误:利用了小概率原理,可能犯两类错误: 第一类错误第一类错误去真错误去真错误存伪错误存伪错误第二类错误第二类错误正确正确正确正确假设检验的两类错假设检验的两类错误误 犯第一类错误的概率通常记为犯第一类错误的概率通常记为 犯第二类错误的概率通常记为犯第二类错误的概率通常记为 H0为真为真H0为假为假真实情况真实情况所作判断所作判断接受接受H0拒绝拒绝H0第一类错误第一类错误( (去真去真) )第二类错误第二类错误( (存伪存伪) )假设检验步骤 q根据实际问题所关心的内容根据实际问题所关心的内容, ,建立建立H H0 0与与H H1 1q在在H H0 0为真时为真时, ,选择合适的统计量选择合适的统计量V V, ,由由H H1 1确确给定显著性水平给定显著性水平 , ,其对应的拒绝域其对应的拒绝域定拒绝域形式定拒绝域形式q根据样本值计算根据样本值计算, ,并作出相应的判断并作出相应的判断. .对于以下几种情形,常常使用对于以下几种情形,常常使用U U检验检验(1)(1) 一个小样本是否来自某参数已知的正态总一个小样本是否来自某参数已知的正态总体;体;(2)(2) 一个大样本是否来自某参数已知的总体;一个大样本是否来自某参数已知的总体;(3)(3) 两个大样本间有无显著差异两个大样本间有无显著差异. .一、一、U U检验检验 0 0 0 0 0U U 检验法检验法( 2 2 已知已知) )原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域 例例 设某次考试的考生成绩(单位:分)设某次考试的考生成绩(单位:分)服从正态分布服从正态分布N N(7070,1616),从中随机地抽),从中随机地抽取取100100名考生的成绩,算得平均成绩为名考生的成绩,算得平均成绩为66.566.5分,若方差不变,问当显著性水平分,若方差不变,问当显著性水平=0.05=0.05时,是否可以认为全体考生的平均成绩仍为时,是否可以认为全体考生的平均成绩仍为7070分?分? 解解 这是一个大样本这是一个大样本(n=10030)(n=10030)是否是否来自某参数已知的正态总体的问题,来自某参数已知的正态总体的问题,因此用因此用U U检验检验. . 假设假设 即全体考生的平均成绩仍为即全体考生的平均成绩仍为70分分 备选假设备选假设 则应有则应有 或 检验检验 =8.751.96 故概率为故概率为0.050.05的事件发生了的事件发生了. . 因此拒绝因此拒绝H H0 0,即全体考生的平均成绩仍,即全体考生的平均成绩仍为为7070分不成立分不成立. . 于是,接受备选假设于是,接受备选假设 即不能认为全体考生的平均成绩仍为即不能认为全体考生的平均成绩仍为7070分分. . 例例 某校从经常参加体育锻炼的男生中随机地选出某校从经常参加体育锻炼的男生中随机地选出5050名,测得平均身高名,测得平均身高174.34174.34厘米;从不经常参加体育锻炼的厘米;从不经常参加体育锻炼的男生中随机地选男生中随机地选5050名,测得平均身高难度名,测得平均身高难度172.42172.42厘米厘米. .假设假设两种男生的身高都服从正态分布,标准差均为两种男生的身高都服从正态分布,标准差均为 厘米,问该校参加体育锻炼的男生是否比不常参加厘米,问该校参加体育锻炼的男生是否比不常参加体育锻炼的男生平均身高要高些?体育锻炼的男生平均身高要高些? 解解 这是两个大样本间有无显著差异的问题,这是两个大样本间有无显著差异的问题,因此用因此用U U检验检验. .假设假设 (备选假设(备选假设 )则应有)则应有: : 或或 (由于是大样本,故(由于是大样本,故 检验检验 所以拒绝原假设所以拒绝原假设H H0 0 , ,接受备选假设接受备选假设 H H1 ,1 ,又又 故该校参加锻炼的男生比不常参加锻炼的男生故该校参加锻炼的男生比不常参加锻炼的男生平均身高要明显地高一些平均身高要明显地高一些. .对于以下几种情形,常常使用对于以下几种情形,常常使用t t检验检验(1) 一个小样本是否来自某参数未知的正态总一个小样本是否来自某参数未知的正态总体;体;(2) 两个小样本间有无显著差异两个小样本间有无显著差异. .二、二、t t 检验检验T T 检验法检验法( 2 2 未知未知) ) 0 0 0 0 0原假设原假设 H0备择假设备择假设H1检验统计量及其检验统计量及其H0为真时的分布为真时的分布拒绝域拒绝域例例 某地九月份气温某地九月份气温 观察九天,算得观察九天,算得 ,S=0.9S=0.9, 能否据此样本认为该地区九月份平能否据此样本认为该地区九月份平均气温为均气温为31.5. 31.5. 解解 这是一个小样本是否来自某参数未知的这是一个小样本是否来自某参数未知的正态总体的问题,因此用正态总体的问题,因此用t t检验检验. .假设假设 即该地区九月份平均气温为即该地区九月份平均气温为31.531.5 备选假设备选假设 则应有则应有 或 检验检验 =52.306 故拒绝原假设故拒绝原假设H H0 0、接受备选假设、接受备选假设H H1 1,即不能据此,即不能据此样本认为该地区九月份平均气温为样本认为该地区九月份平均气温为31.5. 31.5. 例例2 2 9 9名学生到英语培训班学习,培训前后各进名学生到英语培训班学习,培训前后各进行了一次水平测试,成绩为行了一次水平测试,成绩为假设测试成绩服从正态分布,问在显著性水平假设测试成绩服从正态分布,问在显著性水平=0.05=0.05 下,判断对学生的培训效果是否显著?下,判断对学生的培训效果是否显著?解解 这是两个小样本间有无显著差异的问题,这是两个小样本间有无显著差异的问题,因此用因此用t t检验检验. .假设假设 (备选假设(备选假设 ) ) 即培训效果不显著则应有即培训效果不显著则应有: : 或或检验检验所以接受假设所以接受假设H H0,0,即对学生的培训效果不显著即对学生的培训效果不显著. .例例维尼纶纤维的耐热水性能好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素. 在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排了一批试验,获得如下数据:甲醛浓度x(克/升)18 20 22 24 26 28 30 缩醛化度y(克/升)26.86 28.35 28.7528.87 29.75 30.00 30.36可在直角坐标系下作图可在直角坐标系下作图从图中我们发现随着甲醛浓度从图中我们发现随着甲醛浓度x x的增的增加,缩醛化度加,缩醛化度y y也增加,且这些点也增加,且这些点(i=1,2,7)(i=1,2,7)近似地在一直线附近,但又近似地在一直线附近,但又不完全在一条直线上,引起这些点不完全在一条直线上,引起这些点与直线偏离的原因是由于在生产过程或测与直线偏离的原因是由于在生产过程或测试过程中,还存在着一些不可控的因素,它们试过程中,还存在着一些不可控的因素,它们都在影响着试验结果都在影响着试验结果. 这样就可以把试验结果这样就可以把试验结果y y看成是由两部分看成是由两部分叠加而成的,一部分是由叠加而成的,一部分是由x x的线性函数引起的线性函数引起的的. .记为记为a+bxa+bx,另一部分是由随机因素引起,另一部分是由随机因素引起的的, , 记为记为,即,即: : (其中其中 都不依赖于都不依赖于x.x.上式称为上式称为一元线性回归模一元线性回归模型型. . 则则 其中未知参数其中未知参数将将的值代入上式得的值代入上式得 即 为求式(为求式(5-85-8)中)中的估计值的估计值必须使必须使最小最小, ,记记 由最小二乘法可得由最小二乘法可得 或 于是可求出于是可求出a a,b b的估计值的估计值从而得方程从而得方程它称为它称为 关于的关于的 线性回归方程线性回归方程或或回归方程回归方程 其图形称为其图形称为回归直线回归直线. . 它刻划了维尼纶它刻划了维尼纶纤维的耐热水性能与纤维的耐热水性能与“缩醛化度缩醛化度”之间的之间的关系关系. .一般地,若n个点近直线,记根据微积分 中的极值原理及最小二乘法,有靠或 (5-9)解方程组(5-9),得到 (5-10)于是得到回归直线方程为:称为的最小二乘估计. 若将代入此上式,则线性回归方程变为:.这表明,对于样本观察这表明,对于样本观察值值 回归直线通过散点图的几何中心回归直线通过散点图的几何中心 若记 则 的估计值可写成的估计值可写成 (5-12)以下求例的线性回归方程以下求例的线性回归方程. . 由数据可得由数据可得则的线性回归方程为:的线性回归方程为: 二、非线性最小二乘拟合二、非线性最小二乘拟合 在实际问题中,变量之间的关系常常在实际问题中,变量之间的关系常常不象线性函数那样简单,未必呈线性趋势不象线性函数那样简单,未必呈线性趋势. . 但是其中有些作适当的变量代换,可使函但是其中有些作适当的变量代换,可使函数线性化,从而转化为一元线性回归问题数线性化,从而转化为一元线性回归问题. . 现将常见的可线性化函数列于下表:现将常见的可线性化函数列于下表:序序号号函函 数数线线 性性 化化 方方 法法线性化后所得的线性化后所得的线线 性性 函函 数数1(c c为常数且为常数且c0c0) u u = =lnylnyu=ax+lncu=ax+lnc(c c为常数且为常数且c0c0c0) u=lny u=lnyu=bv+lncu=bv+lnc3 y=bv+ay=bv+a4y=a+blnty=a+blntx=lntx=lnty=bx+ay=bx+a5y=a+bsinty=a+bsintx=sintx=sinty= bx+ay= bx+a 6 6 =a+bx =a+bxy= bx+ay= bx+a7 7 (c0)(c0)u=lny, v=lnxu=lny, v=lnxu=bv+lncu=bv+lnc8 8 u= v= u= v= u= u= 9 9u=log y,v=logxu=log y,v=logxu=bv+logau=bv+loga1010y=a+blogxy=a+blogxv=logxv=logxy= bv +ay= bv +a1111log y=a+bxlog y=a+bxu=logyu=logyu= bx +au= bx +a 有了这些常见的可线性化函数,利用有了这些常见的可线性化函数,利用最小二乘法可建立经验公式最小二乘法可建立经验公式. .例例 假定对二变量假定对二变量x x和和y y的联合观察得如下数据:的联合观察得如下数据:x10121315172021232528y10.19.287.57.46.56.26.55.55.2试求试求y y对对x x的线性回归方程的线性回归方程. .解解 如散点图如右图如散点图如右图 随着随着x x的增加的增加y y呈较快递降趋势呈较快递降趋势. . 会发会发现其趋势象双曲函数,我们试用形如现其趋势象双曲函数,我们试用形如的函数来逼近的函数来逼近. .此函数可线性化此函数可线性化为 其中其中 u=lny, =lna,t=lnx.经计算得经计算得和的最小二乘估计的最小二乘估计:从而,得从而,得 , , 的估计值的估计值: : 于是,得回归方程:于是,得回归方程: 为说明回归效果,我们将回归值为说明回归效果,我们将回归值与实际观测与实际观测(j=1,2,10)(j=1,2,10)进行比较:进行比较:x x 10 10 12 12 13 13 15 15 17 17 20 20 21 21 23 23 25 25 28 28y y 10.3 10.3 9.2 9.2 8.0 8.0 7.5 7.5 7.4 7.4 6.5 6.5 6.2 6.2 6.5 6.5 5.5 5.5 5.2 5.29.959.958.908.908.478.477.767.767.197.196.516.516.326.325.975.975.685.685.305.30计算结果表明回归效果较好.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号