资源预览内容
第1页 / 共61页
第2页 / 共61页
第3页 / 共61页
第4页 / 共61页
第5页 / 共61页
第6页 / 共61页
第7页 / 共61页
第8页 / 共61页
第9页 / 共61页
第10页 / 共61页
亲,该文档总共61页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
4.4 数字特征与极限定理 在前面的课程中,我们讨论了随机变量在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量及其分布,如果知道了随机变量X的概率分的概率分布,那么布,那么X的全部概率特征也就知道了的全部概率特征也就知道了. f (x)xoxP(x)o 然而,在实际问题中,概率分布一般然而,在实际问题中,概率分布一般是较难确定的是较难确定的. 而在一些实际应用中,人而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了只要知道它的某些数字特征就够了.某型号电视机的平均寿命某型号电视机的平均寿命18000小时小时200小时小时 因此,在对随机变量的研究中,确定某因此,在对随机变量的研究中,确定某些数字特征是重要的些数字特征是重要的 .我们先介绍随机变量的数学期望我们先介绍随机变量的数学期望.在这些数字特征中,最常用的是在这些数字特征中,最常用的是期望期望和和方差方差 随机变量的数学期望是概率论中最随机变量的数学期望是概率论中最重要的概念之一重要的概念之一. 它的定义来自习惯上它的定义来自习惯上的平均概念的平均概念.我们从离散型随机变量的数学期望开始我们从离散型随机变量的数学期望开始.一、离散型随机变量的数学期望一、离散型随机变量的数学期望 1、概念的引入:、概念的引入: 某车间对工人的生产情况某车间对工人的生产情况进行考察进行考察. 车工小张每天生产车工小张每天生产的废品数的废品数X是一个随机变量是一个随机变量. 如何定义如何定义X的平均值呢?的平均值呢? 某电话交换台每天某电话交换台每天8:00-9:00收到的呼叫数收到的呼叫数X是一个随机变量是一个随机变量. 如何定义如何定义X的平均值即该的平均值即该交换台每天交换台每天8:00-9:00收到的平均呼叫数呢?收到的平均呼叫数呢?我们来看第一个问题我们来看第一个问题.若统计若统计100天天, 例例1 某车间对工人的生产情况进行考察某车间对工人的生产情况进行考察. 车工车工小张每天生产的废品数小张每天生产的废品数X是一个随机变量是一个随机变量. 如如何定义何定义X的平均值呢?的平均值呢?32天没有出废品天没有出废品;30天每天出一件废品天每天出一件废品;17天每天出两件废品天每天出两件废品;21天每天出三件废品天每天出三件废品;可以得到这可以得到这100天中天中 每天的平均废品数为每天的平均废品数为这个数能否作为这个数能否作为X的平均值呢?的平均值呢?可以想象,若另外统计可以想象,若另外统计100天,车工小张不天,车工小张不出废品,出一件、二件、三件废品的天数与出废品,出一件、二件、三件废品的天数与前面的前面的100天一般不会完全相同,这另外天一般不会完全相同,这另外100天每天的平均废品数也不一定是天每天的平均废品数也不一定是1.27.n0天没有出废品天没有出废品;n1天每天出一件废品天每天出一件废品;n2天每天出两件废品天每天出两件废品;n3天每天出三件废品天每天出三件废品.可以得到可以得到n天中每天的平均废品数为天中每天的平均废品数为(假定小张每天至多出假定小张每天至多出三件废品三件废品) 一般来说一般来说,若统计若统计n天天,这是这是以频率为权的加权平均以频率为权的加权平均由频率和概率的关系由频率和概率的关系 不难想到,在求废品数不难想到,在求废品数X的平均值时,用的平均值时,用概率代替概率代替频率频率,得平均值为,得平均值为这是这是以概率为权的加权平均以概率为权的加权平均这样得到一个确定的数这样得到一个确定的数. 我们就用这个数作我们就用这个数作为随机变量为随机变量X的平均值的平均值 .这样做是否合理呢?这样做是否合理呢? 不妨把小张生产中出废品的情形不妨把小张生产中出废品的情形用一个球箱模型来描述用一个球箱模型来描述:2230003111220 0 033111 有一个箱子,里面装有有一个箱子,里面装有10个个大小,形状完全相同的球,号大小,形状完全相同的球,号码如图码如图. 规定从箱中任意取出一个球,规定从箱中任意取出一个球,记下球上的号码,然后把球放记下球上的号码,然后把球放回箱中为一次试验回箱中为一次试验. 记记X为所取出的球的号码为所取出的球的号码(对应废品数对应废品数) . X为随机变量,为随机变量,X的概率函数为的概率函数为2230003111对试验次数对试验次数(即天数即天数)n,及小张的生产情况进及小张的生产情况进行统计,统计行统计,统计他不出废品,出一件、二件、他不出废品,出一件、二件、三件废品的天数三件废品的天数n0,n1,n2,n3 , 并计算并计算与与进行比较进行比较.2230003111则对则对X作一系列观察作一系列观察(试验试验),所得,所得X的试验的试验值的平均值也是随机的值的平均值也是随机的.由此引入离散型由此引入离散型r.vX的数学期望的定义如下的数学期望的定义如下: 对于一个随机变量,若它可能取的值是对于一个随机变量,若它可能取的值是X1, X2, , 相应的概率为相应的概率为 p1, p2, , 但是,如果试验次数很大,出现但是,如果试验次数很大,出现Xk的频率会的频率会接近于接近于pk,于是可期望试验值的平均值接近于是可期望试验值的平均值接近定义定义1 设设X是离散型随机变量,它的概率函数是离散型随机变量,它的概率函数是是: P(X=Xk)=pk , k=1,2,也就是说也就是说,离散型随机变量的数学期望是一离散型随机变量的数学期望是一个绝对收敛的级数的和个绝对收敛的级数的和.如果如果有限有限,定义定义X的数学期望的数学期望例例1 某某人人的的一一串串钥钥匙匙上上有有n把把钥钥匙匙,其其中中只只有有一一把把能能打打开开自自己己的的家家门门,他他随随意意地地试试用用这这串串钥钥匙匙中中的的某某一一把把去去开开门门. 若若每每把把钥钥匙匙试试开开一一次次后后除去,求打开门时试开次数的数学期望除去,求打开门时试开次数的数学期望.解解: 设试开次数为设试开次数为X,P(X=k)= 1/n , k=1,2,nE(X) 于是于是二、连续型随机变量的数学期望二、连续型随机变量的数学期望 设设X是连续型随机变量,其密度函数为是连续型随机变量,其密度函数为f (x),在数轴上取很密的分点在数轴上取很密的分点x0 x1x2q,p+q=1.为了补偿为了补偿乙的不利地位,另行规定两人下的赌注不相乙的不利地位,另行规定两人下的赌注不相等,甲为等,甲为 a, 乙为乙为b, ab. 现在的问题是:现在的问题是:a究究竟应比竟应比b大多少,才能做到公正?大多少,才能做到公正?解:设甲赢的钱数为解:设甲赢的钱数为X,乙赢的钱数为,乙赢的钱数为Y,依题意依题意解:设甲赢的钱数为解:设甲赢的钱数为X,乙赢的钱数为,乙赢的钱数为Y,为对双方公正为对双方公正,应有应有依题意依题意E(X)=bp+(-a)q, E(Y)=aq+(-b)pbp-aq=aq-bp=0, 故故 期望与风险并存数学家从期望值期望与风险并存数学家从期望值来观察风险,分析风险,以便作出正确来观察风险,分析风险,以便作出正确的决策的决策 例如,有一家个体户,有资金一笔,如例如,有一家个体户,有资金一笔,如经营西瓜,风险大但利润高经营西瓜,风险大但利润高(成功的概率为成功的概率为0.7,获利,获利2000元元); 如经营工艺品,风险如经营工艺品,风险小但获利少小但获利少(95会赚,但利润为会赚,但利润为1000元元)究竟该如何决策?究竟该如何决策?所以权衡下来,情愿所以权衡下来,情愿“搏一记搏一记”,去经营,去经营西瓜,因它的期望值高西瓜,因它的期望值高于是计算期望值:于是计算期望值:若经营西瓜,期望值若经营西瓜,期望值E1=0.72000=1400元元而经营工艺品期望值而经营工艺品期望值E20.951000950元元 我们介绍了随机变量的数学期望,它我们介绍了随机变量的数学期望,它反映了随机变量取值的平均水平,是随机反映了随机变量取值的平均水平,是随机变量的一个重要的数字特征变量的一个重要的数字特征. 接下来我们将向大家介绍随机变量另接下来我们将向大家介绍随机变量另一个重要的数字特征:一个重要的数字特征:方差方差 我们已经介绍了随机变量的数学期望,我们已经介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征机变量的一个重要的数字特征. 但是在一些场合,仅仅知道平均值是但是在一些场合,仅仅知道平均值是不够的不够的. 例如,某零件的真实长度为例如,某零件的真实长度为a,现用甲、,现用甲、乙两台仪器各测量乙两台仪器各测量10次,将测量结果次,将测量结果X用坐用坐标上的点表示如图:标上的点表示如图: 若让你就上述结果评价一下两台仪器的优若让你就上述结果评价一下两台仪器的优劣,你认为哪台仪器好一些呢?劣,你认为哪台仪器好一些呢? 甲仪器测量结果甲仪器测量结果乙仪器测量结果乙仪器测量结果较好较好测量结果的测量结果的均值都是均值都是 a因为乙仪器的测量结果集中在均值附近因为乙仪器的测量结果集中在均值附近又如又如,甲、乙两门炮同时向一目标射击甲、乙两门炮同时向一目标射击10发发炮弹,其落点距目标的位置如图:炮弹,其落点距目标的位置如图:你认为哪门炮射击效果好一些呢你认为哪门炮射击效果好一些呢?甲炮射击结果甲炮射击结果乙炮射击结果乙炮射击结果乙炮乙炮因为乙炮的弹着点较集中在中心附近因为乙炮的弹着点较集中在中心附近 . 中心中心中心中心 为此需要引进另一个数字特征为此需要引进另一个数字特征,用它用它来度量随机变量取值在其中心附近的离来度量随机变量取值在其中心附近的离散程度散程度.这个数字特征就是我们要介绍的这个数字特征就是我们要介绍的方差方差一、方差的定义一、方差的定义 采用平方是为了保证一切采用平方是为了保证一切差值差值X-E(X)都起正面的作用都起正面的作用 由于它与由于它与X具有相同的度量单位,在实具有相同的度量单位,在实际问题中经常使用际问题中经常使用. 方差的算术平方根方差的算术平方根 称为标准差称为标准差设设X是是一一个个随随机机变变量量,若若E(X-E(X)2,则则称称D(X)=EX-E(X)2 (1)为为X的方差的方差.若若X的取值比较分散,的取值比较分散,则方差较大则方差较大 .若方差若方差D(X)=0,则则r.v X 以概率以概率1取常数值取常数值 . 方差刻划了随机变量的取值对于其数学方差刻划了随机变量的取值对于其数学期望的离散程度期望的离散程度 .若若X的取值比较集中,的取值比较集中,则方差较小;则方差较小;D(X)=EX-E(X)2X为离散型,为离散型,P(X=xk)=pk 由定义知,方差是随机变量由定义知,方差是随机变量X的函数的函数g(X)=X-E(X)2的数学期望的数学期望 .X为连续型,为连续型,Xf(x)二、计算方差的一个简化公式二、计算方差的一个简化公式 D(X)=E(X2)-E(X)2 展开展开证:证:D(X)=EX-E(X)2=EX2-2XE(X)+E(X)2=E(X2)-2E(X)2+E(X)2=E(X2)-E(X)2利用期望利用期望性质性质请自己用此公式计算常见分布的方差请自己用此公式计算常见分布的方差.例例1 设设r.v X服从几何分布,概率函数为服从几何分布,概率函数为P(X=k)=p(1-p)k-1, k=1,2,,n其中其中0p0,或或 由切比雪夫不等式可以看出,若由切比雪夫不等式可以看出,若 越越小,则事件小,则事件|X-E(X)| 的概率越大,的概率越大,即随机变量即随机变量X集中在期望附近的可能性越集中在期望附近的可能性越大大.由此可体会方差的概率意义:由此可体会方差的概率意义:它刻划了随机变量取值的离散程度它刻划了随机变量取值的离散程度.如图所示如图所示当方差已知时,切比雪夫不等式给出了当方差已知时,切比雪夫不等式给出了r.v X与它的期望的偏差不小于与它的期望的偏差不小于 的概率的估的概率的估计式计式 .如取如取 可见,对任给的分布,只要期望和方差可见,对任给的分布,只要期望和方差 存在,则存在,则 r.v X取值偏离取值偏离E(X)超过超过 3 的的概率小于概率小于0.111 .例例3 已知正常男性成人血液中,每一毫升已知正常男性成人血液中,每一毫升白细胞数平均是白细胞数平均是7300,均方差是,均方差是700 . 利用利用切比雪夫不等式估计每毫升白细胞数在切比雪夫不等式估计每毫升白细胞数在52009400之间的概率之间的概率 .解:设每毫升白细胞数为解:设每毫升白细胞数为X依题意,依题意,E(X)=7300,D(X)=7002所求为所求为 P(5200 X 9400) P(5200 X 9400) =P(5200-7300 X-7300 9400-7300) = P(-2100 X-E(X) 2100) = P |X-E(X)| 2100由切比雪夫不等式由切比雪夫不等式 P |X-E(X)| 2100即估计每毫升白细胞数在即估计每毫升白细胞数在52009400之间的之间的概率不小于概率不小于8/9 . 例例4 在每次试验中,事件在每次试验中,事件A发生的概率为发生的概率为 0.75, 利用切比雪夫不等式求:利用切比雪夫不等式求:n需要多大时,需要多大时,才能使得在才能使得在n次独立重复试验中次独立重复试验中, 事件事件A出现的出现的频率在频率在0.740.76之间的概率至少为之间的概率至少为0.90?解:设解:设X为为n 次试验中,事件次试验中,事件A出现的次数,出现的次数,E(X)=0.75n, 的最小的的最小的n .则则 XB(n, 0.75)所求为满足所求为满足D(X)=0.75*0.25n=0.1875n =P(-0.01nX-0.75n 0.01n) = P |X-E(X)| 0.01n P(0.74n X0.76n )可改写为可改写为在切比雪夫不等式中取在切比雪夫不等式中取n,则,则 = P |X-E(X)| 0.01n解得解得依题意,取依题意,取 即即n 取取18750时,可以使得在时,可以使得在n次独立重复次独立重复试验中试验中, 事件事件A出现的频率在出现的频率在0.740.76之间的之间的概率至少为概率至少为0.90 .我们介绍了随机变量的方差我们介绍了随机变量的方差. 它是刻划随机变量取值在其中心附近离它是刻划随机变量取值在其中心附近离散程度的一个数字特征散程度的一个数字特征 .下面我们将介绍刻划两下面我们将介绍刻划两r.v间线性相关程度的间线性相关程度的一个重要的数字特征:一个重要的数字特征:相关系数相关系数 概率论与数理统计是研究随机现象统计概率论与数理统计是研究随机现象统计规律性的学科规律性的学科. 随机现象的规律性只有在相随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出同的条件下进行大量重复试验时才会呈现出来来. 也就是说,要从随机现象中去寻求必也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象然的法则,应该研究大量随机现象. 研究大量的随机现象,常常采用极限研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究形式,由此导致对极限定理进行研究. 极极限定理的内容很广泛,其中最重要的有两限定理的内容很广泛,其中最重要的有两种种:与与大数定律大数定律中心极限定理中心极限定理下面我们先介绍大数定律下面我们先介绍大数定律 大量的随机现象中平均结果的稳定性大量的随机现象中平均结果的稳定性 大数定律的客观背景大数定律的客观背景大量抛掷硬币大量抛掷硬币正面出现频率正面出现频率字母使用频率字母使用频率生产过程中的生产过程中的废品率废品率
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号