资源预览内容
第1页 / 共69页
第2页 / 共69页
第3页 / 共69页
第4页 / 共69页
第5页 / 共69页
第6页 / 共69页
第7页 / 共69页
第8页 / 共69页
第9页 / 共69页
第10页 / 共69页
亲,该文档总共69页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
从2009国赛B题 眼科病床的合理安排说起。,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下:,在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似描述 . 也就是说,我们可以假设每年爆发战争次数分布X近似泊松分布.,现在的问题是:上面的数据能否证实X 具有泊松分布的假设是正确的?,又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来.,问该厂生产的钟的误差是否服从正态分布?,再如,某工厂制造一批骰子,声称它是均匀的.,为检验骰子是否均匀, 要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距.,也就是说,在投掷中,出现1点,2点,6点的概率都应是1/6.,得到的数据能否说明“骰子均匀”的假设是可信的?,问题是:,现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。,本专题的主要目的是:熟悉Matlab相关命令;熟悉各种常见分布的概率密度函数及其曲线,会利用数据分布的形态猜测其分布类型;能够对密度函数进行参数估计;进行简单的假设检验(以正态检验为主)。,内容提纲,1.Matlab相关命令介绍2.常见概率分布3.频数直方图与频数表4.参数估计5.假设检验,Matlab相关命令,最值:max(x), min(x)(1) max(X):返回向量X的最大值,如果X中包含复数元素,则按模取最大值。(2) max(A):返回一个行向量,向量的第i个元素是矩阵A的第i列上的最大值。(3) Y,U=max(A):返回行向量Y和U,Y向量记录A的每列的最大值,U向量记录每列最大值的行号。(4) max(A,dim):dim取1或2。dim取1时,该函数和max(A)完全相同;dim取2时,该函数返回一个列向量,其第i个元素是A矩阵的第i行上的最大值。,数据统计处理基本命令,Matlab相关命令,求和: (1) sum(X),返回向量X各元素的和。(2) sum(A) ,返回一个行向量,其第i个元素是 A的第i列的元素和。(3)sum(A,dim) ,当dim为1时,该函数等同于sum(A);当dim为2时,返回一个列向量,其第i个元素是A的第i行的各元素之和。乘积:(1) prod(X) ,返回向量X各元素的乘积。(2) prod (A) , 返回一个行向量,其第i个元素是A的第i列元素的乘积。(3) prod(A,dim) ,当dim为1时,该函数等同于prod(A);当dim为2时,返回一个列向量,其第i个元素是A的第i行的各元素之乘积。,数据统计处理基本命令,Matlab相关命令,累加和与累乘积 在MATLAB中,使用cumsum和cumprod函数能方便地求得向量和矩阵元素的累加和与累乘积向量,函数的调用格式为:cumsum(X):返回向量X累加和向量。cumprod(X):返回向量X累乘积向量。cumsum(A):返回一个矩阵,其第i列是A的第i列的累加和向量。cumprod(A):返回一个矩阵,其第i列是A的第i列的累乘积向量。cumsum(A,dim):当dim为1时,该函数等同于cumsum(A);当dim为2时,返回一个矩阵,其第i行是A的第i行的累加和向量。cumprod(A,dim):当dim为1时,该函数等同于cumprod(A);当dim为2时,返回一个向量,其第i行是A的第i行的累乘积向量。,数据统计处理基本命令,Matlab相关命令,相关系数 MATLAB提供了corrcoef函数,可以求出数据的相关系数矩阵。corrcoef函数的调用格式为:corrcoef(X):返回从矩阵X形成的一个相关系数矩阵。此相关系数矩阵的大小与矩阵X一样。它把矩阵X的每列作为一个变量,然后求它们的相关系数。corrcoef(X,Y):在这里,X,Y是向量,它们与corrcoef(X,Y)的作用一样。,数据统计处理基本命令,Matlab相关命令,排序 MATLAB中对向量X是排序函数是sort(X),函数返回一个对X中的元素按升序排列的新向量。 sort函数也可以对矩阵A的各列或各行重新排序,其调用格式为: Y,I=sort(A,dim) 其中dim指明对A的列还是行进行排序。若dim=1,则按列排;若dim=2,则按行排。Y是排序后的矩阵,而I记录Y中的元素在A中位置。,数据统计处理基本命令,Matlab相关命令,类似的用法,请自己借助matlab在线帮助功能自己了解:中位数:median(x)标准差:std(x) 方差:var(x)偏度:skewness(x) 峰度:kurtosis(x),数据统计处理基本命令,偏度和峰度的说明,Matlab相关命令,例 生成满足正态分布的100005随机矩阵,然后求各列元素的均值和标准方差,再求这5列随机数据的相关系数矩阵。命令如下:X=sqrt(3)*randn(10000,5)+4;M=mean(X)D=std(X)R=corrcoef(X),数据统计处理基本命令,Matlab相关命令介绍,pdf 概率密度函数,y=pdf(name,x,A),y=pdf(name,x,A,B) 或 y=pdf(name,x,A,B,C),返回由 name 指定的单参数分布的概率密度,x为样本数据,name 用来指定分布类型,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、ncx2、norm、 poiss、rayl、t、unif、unid、wbl。,返回由 name 指定的双参数或三参数分布的概率密度,常见的概率分布,Matlab相关命令介绍,例:,x=-8:0.1:8;y=pdf(norm,x,0,1);y1=pdf(norm,x,1,2);plot(x,y,x,y1,:),注:,y=pdf(norm,x,0,1),y=normpdf(x,0,1),相类似地,,y=pdf(beta,x,A,B),y=betapdf(x,A,B),y=pdf(bino,x,N,p),y=binopdf(x,N,p), ,概率密度函数,【例】绘制卡方分布密度函数在自由度分别为1、5、15的图形x=0:0.1:30;y1=chi2pdf(x,1); plot(x,y1,:)hold on,【例】 绘制标准正态分布的概率密度图.x=-4:0.1:4;y=normpdf(x,0,1);plot(x,y)title(N(0,1)的概率密度曲线图),累积分布函数(cdf),【例】 求服从标准正态分布的随机变量落在区间2, 2上的概率. P=normcdf (-2, 2)ans = 0.0228 0.9772 P(2)-P(1)ans = 0.9545,累积分布函数(cdf), u_alpha=norminv(0.9,0,1) u_alpha = 1.2816 t_alpha=tinv(0.25,4) t_alpha = -0.7407 F_alpha=finv(0.1,14,10) F_alpha = 0.4772 X2_alpha=chi2inv(0.025,50) X2_alpha = 32.3574,累积分布函数(cdf),连续分布:正态分布,正态分布(连续分布),如果随机变量 X 的密度函数为:,则称 X 服从正态分布。记做:,标准正态分布:N (0, 1),正态分布也称高斯分布,是概率论中最重要的一个分布。,如果一个变量是大量微小、独立的随机因素的叠加,那么它一定满足正态分布。如测量误差、产品质量、月降雨量等,正态分布举例,x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,:),例:标准正态分布和非标准正态分布密度函数图形,连续分布:均匀分布,均匀分布(连续分布),如果随机变量 X 的密度函数为:,则称 X 服从均匀分布。记做:,均匀分布在实际中经常使用,譬如一个半径为 r 的汽车轮胎,因为轮胎上的任一点接触地面的可能性是相同的,所以轮胎圆周接触地面的位置 X 是服从 0,2r 上的均匀分布。,连续分布:指数分布,指数分布(连续分布),如果随机变量 X 的密度函数为:,则称 X 服从参数为 的指数分布。记做:,在实际应用问题中,等待某特定事物发生所需要的时间往往服从指数分布。如某些元件的寿命;随机服务系统中的服务时间;动物的寿命等都常常假定服从指数分布。,指数分布具有无记忆性:,指数分布举例,x=0:0.1:30;y=exppdf(x,4);plot(x,y),例: =4 时的指数分布密度函数图,离散分布:几何分布,几何分布是一种常见的离散分布,在贝努里实验中,每次试验成功的概率为 p,设试验进行到第 次才出现成功,则 的分布满足:,其右端项是几何级数 的一般项,于是人们称它为几何分布。,x=0:30; y=geopdf(x,0.5); plot(x,y),例: p=0.5 时的几何分布密度函数图,离散分布:二项式分布,二项式分布属于离散分布,如果随机变量 X 的分布列为:,则称这种分布为二项式分布。记做:,x=0:50;y=binopdf(x,500,0.05);plot(x,y),例: n=500,p=0.05 时的二项式分布密度函数图,离散分布: Poisson 分布,泊松分布也属于离散分布,是1837年由发个数学家 Poisson 首次提出,其概率分布列为:,记做:,泊松分布是一种常用的离散分布,它与单位时间(或单位面积、单位产品等)上的计数过程相联系。如:单位时间内,电话总机接到用户呼唤次数;1 平方米内,玻璃上的气泡数等。,Poisson 分布举例,x=0:50;y=poisspdf(x,25);plot(x,y),例: =25 时的泊松分布密度函数图,离散分布:均匀分布,如果随机变量 X 的分布列为:,则称这种分布为离散均匀分布。记做:,n=20;x=1:n;y=unidpdf(x,n);plot(x,y,o-),例: n=20 时的离散均匀分布密度函数图,抽样分布: 2分布,设随机变量 X1, X2, , Xn 相互独立,且同服从正态分布 N(0,1),则称随机变量 n2= X12+X22+ +Xn2服从自由度为 n 的 2 分布,记作 ,亦称随机变量 n2 为 2 变量。,x=0:0.1:20; y=chi2pdf(x,4); plot(x,y),例: n=4 和 n=10 时的 2 分布密度函数图,x=0:0.1:20; y=chi2pdf(x,10); plot(x,y),抽样分布: F 分布,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号