资源预览内容
第1页 / 共69页
第2页 / 共69页
第3页 / 共69页
第4页 / 共69页
第5页 / 共69页
第6页 / 共69页
第7页 / 共69页
第8页 / 共69页
第9页 / 共69页
第10页 / 共69页
亲,该文档总共69页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第三章第三章 参数估计参数估计 Parametric EstimationParametric Estimation数理统计课题组本章大纲本章大纲1.点估计的基本概念 2.置信区间估计的基本概念 3.两种基本的点估计方法 4.有效估计和C-R下界 5.充分统计量学习目标学习目标 参数估计解决问题的基本思想; 几种点估计方法的优缺点; 常见点估计的评价; 掌握大样本极大似然估计的近似分布; 置信区间估计的定义和常用求法; 点估计与置信区间估计的主要区别.本章大纲本章大纲点估计的基本概念 两种基本的点估计方法 矩估计 极大似然估计 多项分布的极大似然估计 极大似然估计的渐进分布 置信区间估计的基本概念 枢轴量的概念 小样本置信区间求法 极大似然估计的置信区间解法 有效估计和C-R下界 充分统计量 因子分解定理 Rao-Blackwell定理1.点估计的基本概念(Point Estimator)(Point Estimator)点估计: 就是由样本x1,x2,xn确定一个统计量 用它估计总体的未知参数,称为总体参数的估 计量。当具体的样本抽出后,可求得出样本统 计量的值。用它作为总体参数的估计值,称作 总体参数的点估计值。2.2.两种基本的点估计方法两种基本的点估计方法 矩估计(Moment Estimator) 极大似然估计(Maximum Likelihood estimator) 多项分布的极大似然估计 极大似然估计的渐进分布 极大似然估计的置信区间解法设 是一随机变量, 是它的一个样本。称 为样本的 阶原点矩。若 存在,则称之为 X 的 阶原点矩。记作若 存在,则称之为 X 的 阶中心矩。记作称 为样本的 阶中心矩。矩法估计:1) 矩估计法2 点估计的常用方法设 是一随机变量, 是它的一个样本。称 为样本的 阶原点矩。若 存在,则称之为 X 的 阶原点矩。记作若 存在,则称之为 X 的 阶中心矩。记作称 为样本的 阶中心矩。矩法估计:1) 矩估计法2 点估计的常用方法矩估计的原理:1. 经验分布趋向于理论分布;2. 由辛钦大数定律知例1 设某少年儿童出版社每本书发生错字的次数X服从 例2解:解得:例2(续)u2)极大似然估计法设总体X的概率分布为 或概率密度为 其中 是未知参数。 如何求极大似然估 计量呢?2 点估计的常用方法2. 点估计的常用方法-极大似然估计含多个参数令似然方程或 最大似然解2. 点估计的常用方法-极大似然估计多项分布参数的极大似然估计很多情况下, 假定一个变量X可能取m个状态,m2,每个状态假定可能性为p1,pm, , 独立进行n次试验, 用Xi表示第i种状态出现的频数, X1,Xm会有多项分布,例7:Hardy-Weinberg平衡定律假定基因的频率在自然界是固定的,基因类型三类 :AA,Aa,aa,它们出现的可能性为 其中 是父代为A的可能性, 是父代为a的可能性需要给出父代 的MLE.AA Aa aa 合计 342 500 187 1029解: 对数似然函数为极大似然估计的理论结果极大似然估计的分布有渐进的正态分布3.3.置信区间估计的基本概念置信区间估计的基本概念 (Confidential Interval) (Confidential Interval) 枢轴量的概念 小样本置信区间求法 拔靴法置信区间求法u置信区间估计的概念样本使得置信度1-3. 置信区间估计置信区间的含义 样本分布区间区间 (X - X - Z Z X X ,X X + Z+ Z X X )该随机区间以该随机区间以(1 (1 - - ) % ) % 包含包含, , 以以 % % 不包含不包含. .构造置信区间的一般方法 (pilot function) 1.一.总体均值的区间估计 总体服从正态分布,2已知时,当 时, 根据区间估计的定义,在1置信度下,总体均 值的置信区间为:单一总体参数的区间估计 即:从而有即在1置信度下,的置信区间为: 单个总体参数的区间估计注意:有很多满足置信度的置信区间+1.65+1.65 x x +2.58+2.58 x x x x_ _X X+1.96+1.96 x x-2.58-2.58 x x -1.65-1.65 x x -1.96-1.96 x x1. 数据的分布离散程度 Measured by 2. 样本容量 X = / n3. 置信水平 (1 - ) Affects Z影响到区间精度的量X - ZX - Z X X totoX + X + Z Z X X 1984-1994 T/Maker Co.例8已知某零件的直径服从正态分布,从该批产 品中随机抽取10件,测得平均直径为 202.5mm,已知总体标准差=2.5mm,试建 立该种零件平均直径的置信区间,给定置信 度为0.95。解:已知 =202.5, n=10, 1=0.95 单个总体参数的区间估计即 计算结果为: 200.95,204.05单个总体参数的区间估计u2未知时 (1) n30时,只需将2由S2代替即可.中的用 S近似 ( 2 ) n30时,由 所以 即 单个总体参数的区间估计u例9某大学从该校学生中随机抽取30人 ,调查到他们平均每人每天完成作业时 间为120分钟,样本标准差为30分钟, 试以95的置信水平估计该大学全体学 生平均每天完成作业时间。 u 解: 1-=0.95 t/2=2.04在95的置信度下,的置信区间为 单个总体参数的区间估计举例u二.总体方差的区间估计单个总体参数的区间估计所以在1-置信度下:2的置信区间总体标准差 的置信区间为单个总体参数的区间估计比例的置信区间的例子 400个毕业生中有32名进入研究生学习,构 造 p 的95% 置信区间估计: R程序: p.hat=32/400 n=400 alpha=0.05 L=p.hat-qnorm(1-alpha/2,0,1)*sqrt(p.hat*(1-p.hat)/n) U=p.hat+qnorm(1-alpha/2,0,1) *sqrt(p.hat*(1-p.hat)/n)样本量 由 1、正态: 2、比例:(1)总体的方差越大,需要的样本量越大。 (2)样本量n和置信区间长度的平方成反比。 (3)置信度越高,样本量越大。在总体均值的区间估计时,半置信区间的宽度为: 需要考虑问题: (1)要求什么样的精度?即我们想构造多宽的区间? (2)对于构造的置信区间来说,想要多大的置信度?即我 们想要多大的可靠度?样本量的确定样本容量n与总体方差、允许误差、置信度有以下关系 :1.必要样本容量n 与总体方差成正比。2在给定的置信水平下,允许误差越大,样本 容量就可以越小。3.样本容量n与置信度成正比。估计总体均值时,样本量的确定例10 一家广告公司想估计某类商店 去年所花的平均广告费有多少。经验表 明,总体方差约为1 800 000。如置信 度取95%,并要使估计值处在总体平均 值附近500元的范围内,这家广告公司 应取多大的样本?解:已知 这家广告公司应抽选28个商店作样本(注意抽取样本数 总是整数,所以n应圆整成整数)。 估计总体均值时,样本量的确定估计总体比例时,允许误差为:由上式可得出估计总体比例时,确定必要样本容量 的公式。由于总体比率是未知的,因此要用样本比 率代替估计总体比例时,样本量的确定例11 一家市场调研公司想估计某地区 有健身器材的家庭所占的比例。该公司 希望对p 的估计误差不超过0.05, 要求 的可靠程度为95%,应取多大量的样本 ?没有可利用的 估计值。 解:对于服从二项分布的随机变量,当 时,其方差达到最大值。因此,在无法得到 值时,可以用 计算。 已知: 由于 的估计值未知,可以采用 计算必要的样本量:估计总体比例时,样本量的确定故为了以95%的可靠度保证估计误差不超过0.05, 应取385户进行调查。估计总体比例时,样本量的确定注意:比例近似正态分布时所要求的样本量一、两个总体均值之差的估计设两总体XN(1,12),YN(2,22),由两总体分别独立的抽取容量为n1和n2的样本,?两个正态总体参数的比较u1.两个总体方差12,22,已知,在1-置信度下,1-2的置信区间为两个正态总体参数的比较 2.两个总体方差12,22,未知,(1)1222,且两样本容量均30,由S12和 S22分别估计12和22,即可(2)12=22=2,2未知,两个正态总体参数的比较1222 且两样本 均很大时由S12和 S22分别估计12和22,即可两个正态总体参数的比较12=22=2 2未知在1-置信度下,1-2的置信区间为两个正态总体参数的比较两个正态总体参数的比较 二 、两个总体方差比的置信区间估计由于 两个正态总体参数的比较u在1-置信度下,1222的置信区间为两个正态总体参数的比较三、 两个总体比例之差的区间估计设两个总体比例分别为P1和P2,为了估计P1-P2,分别从 两个总体中各随机抽取容量为n1和n2的两个随机样本, 并计算两个样本的比例 两个正态总体参数的比较其中, 在1-置信度下,p1-p2的置信区间为两个正态总体参数的比较u例12某减肥用品公司对其所作的报纸广 告在两个城市的效果进行了比较,其分别从 两个城市中随机抽取了800名成年人,其中 看过该广告的比例分别为, , 试求:两城市中看过该广告的成年人比例之 差的置信度为95%的置信区间: 解:由于n1,n2均为大样本, 1-=0.95,/2=1.96两个正态总体参数的比较p1-p2的置信区间为故在95%置信度下,p1-p2的置信区间为(0.011, 0.049)。两个正态总体参数的比较4.4.有效估计和有效估计和C-RC-R下界下界 有效估计 Cramer-Rao下界u罗克拉美不等式(Cramer-Rao)两个以上的 无偏估计量具有最小方差最小方差无偏估计量一个估计量罗克拉美不等式 检验非最佳无偏 估计量2. 衡量估计量优劣的标准u罗克拉美不等式 对于一个无偏估计量 的方差 在分 布为正则的条件下,其方差不会小于一个正 数,这个正数是 的下限,它依赖于总体 的概率密度函数和样本量n即: 注:当 等于不等式右端时,这时称 为最佳 无偏估计量。2.衡量估计量优劣的标准例1 若 , 是总体
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号