资源预览内容
第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
亲,该文档总共7页全部预览完了,如果喜欢就下载吧!
资源描述
第六章 数理统计的基本概念数理统计与概率论是两个有密切联系的姊妹学科(基础 应用) 概率论研究的是在知道随机变量分布的情况下求事件的概率但对具体问题,如何判断某随机变量服从某种分布呢?诚然,我们可以根据经验判断出随机变量的分布,但参数又是什么呢?这些问题概率论回答不了,由数理统计来回答数理统计是通过数据来回答这些问题的这些数据带有随机性(不同于会计中的数据) ,根据数据得出的结论难免会出错,我们希望所犯错误越少越好,而这就需要使用概率论的语言来表述数据不是从天上掉下来的,要获得数据,首先要进行观察或实验,收集整理数据,然后进行推断,这就是数理统计要研究的内容即数理统计学是收集、分析数据,并根据数据进行推断的科学和艺术(强调它的艺术性是为着重说明统计方法需要灵活使用,很依赖于人的判断乃至灵感强调这一点很有好处,它提醒人们不要以教条式的态度来看待数理统计方法,以为只要记住一些公式和方法,碰到什么问题套上去就行) 数理统计课程着重于统计推断。所谓统计推断,就是由样本来推断总体,或者由部分推断总体统计估计和假设检验是统计推断的基础,以此为基础发展了许多实用的统计方法:回归分析、方差分析、时间序列分析及其他多元统计分析方法等第一节 样本与统计量一 总体与个体 1总体(Population)和个体(Individual)1) 【定义】 把研究“对象”的全体称为总体用 X、Y、Z 等表示总体组成总体的每个元素称为个体例如:全国英语四级考试刚刚结束,阅卷评分尚需一段时间,有关部门急于了解这次考试成绩的分布状况(应试的 400 万考生) ;另外,想了解全国大学生的身体状况;想了解用新工艺生产的一批灯泡寿命等等。这里的 “应试的考生” , “全国的大学生” “这批灯泡”等,就构成了各自的总体。2)总体 X 的分布函数称为总体分布函数。当 X 为离散型随机变量时,称 X 的概率函数为总体概率函数。当 X 为连续型随机变量时,称 X 的密度函数为总体密度函数。例如,当 X 服从正态分布 时,称总体 X 为正态总体。二 样本与简单随机样本1.样本(Sample)数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取 n 个个体,然后对这些个体进行测试或观察,得到一组数据 ,这一过程称为抽样。【定义】 从总体 X 中“抽取”的 n 个个体称为(来自)总体 X 的容量(Size)为 n 的样本,记作 X1, X2, Xn或(X 1, X2, Xn) X i称为第 i 个样本测试或观察得到的一组数据称为样本(观测)值。2简单随机样本 ( Simple random sample)【定义】 如果样本( )满足(1) 相互独立; (2) 都与总体具有相同的分布,则称( )为简单随机样本。简称样本。以后谈及样本均指简单随机样本.【注 1】简单随机样本指的是具有独立性和代表性的样本.【注 2】有放回抽样得到的样本是简单随机样本;无放回抽样,当样本容量相对比较小,比如不超过总体的 5 % 时,得到的样本可近似地看作简单随机样本. 样本是对总体进行推断的依据,但样本往往呈现为一堆“杂乱无章”的数据而不能直接利用,需要对这些数据进行加工、提炼,把样本中所包含的信息以多种不同的形式显现出来,就产生了统计量。三 统计量( Statistic)1. 统计量的定义定义 设 是来自总体 X 的一个样本, 是一个 n 元函数,如果 中不含任何总体的未知参数,则称 为一个统计量。经过抽样后得到一组样本观测值 ,则称 为统计量 的观测值或统计量值。统计量的分布称为抽样分布(Sampling distribution)【注 3】统计量是完全由样本确定的量,是样本的函数。例 1.已知总体 ,其中 已知,而 未知.设 是取自总体的样本,试2,XN2123,X问下面哪些是统计量,哪些不是统计量。1) 2) 3) 4)23121X12X解:只有 1) ,2)不含总体的未知参数 ,所以是统计量.2. 常用统计量1)样本均值( Sample mean): 2)样本方差( Sample variance):22211()nni ii iSXX3)样本标准差( Sample standard deviation): S它们的观察值分别为 1nix; 22211(nni iisxx; 2s;这些观察值仍分别称为样本均值、样本方差和样本标准差。例 2.求下列样本值:54,67,68,78,70,66,67,70,65,69 的样本均值和样本方差解:代入公式计算; 15467806706597.40X.22222226591067.435S 第二节 直方图设 是取自总体 X 的一组样本,根据样本观察值,可以用直方图来粗略地描述12,nX总体 X 的分布.由于图形比较直观,因此在统计中经常使用。一.具体步骤1. 把样本值进行分组1) 计算极差 R: 1212max,in,nxx 2) 确定组数 :通常当 时,分 10 组以上,但不宜过多;当 时,分成 5 组左50n 50n右3) 组距 :通常取 的一个比较整齐的数d1Rd4) 确定分点: .满足 ,并且 包含了所有的样本01,ma 1,2,iiadim 0,ma值 .12,nx2. 计算各组的频数和小矩形的高1) 计算各组的频数 :落在 的频数i1(,iiain2) 计算各小矩形的高 2,iinhmd3. 画出直方图:横坐标表示样本值,纵坐标表示矩形的高,在坐标系中作出 个底边为m,高为 的小矩形,这就是直方图.1(,iiai4. 根据直方图进行简单的分析二.实例某食品厂为加强质量管理,对某天生产的食品罐头的重量(克)抽查了 100 个数据(如下表) ,试画出直方图,并且推断是否近似服从正态分布.342 340 348 346 343 342 346 341 344 348346 346 340 344 342 344 345 340 344 344343 344 342 343 345 339 350 337 345 349336 348 344 345 332 342 342 340 350 343347 340 344 353 340 340 356 346 345 346340 339 342 352 342 350 348 344 350 335340 338 345 345 349 336 342 338 343 343341 347 341 347 344 339 347 348 343 347346 344 345 350 341 338 343 339 343 346342 339 343 356 341 346 341 345 344 342解:1.极差 .1212max,in,35624nRxx 2.取 ,则 ,为了整齐,可取 .134dd3.确定分点时,要比样本值多一位小数,且必须 包含了所有的样本值 .0,ma12,nx.0121213.5,.,35.,5.,75aaa 4.列出频数 及小矩形的高 的分布表 inih分 组 频数 in20iiinhd(331.5,333.5 1 0.005(333.5,335.5 1 0.005(335.5,337.5 3 0.015(337.5,339.5 8 0.040(339.5,341.5 15 0.075(341.5,343.5 21 0.105(343.5,345.5 21 0.105(345.5,347.5 14 0.070(347.5,349.5 7 0.035(349.5,351.5 6 0.030(351.5,353.5 2 0.010(353.5,355.5 0 0(355.5,357.5 1 0.0055. 画出直方图00.020.040.060.080.10.12h331.5-333.5333.5-335.5335.5-337.5337.5-339.5339.5-341.5341.5-343.5343.5-345.5345.5-347.5347.5-349.5349.5-351.5351.5-353.5353.5-355.5355.5-357.56. 分析:直方图顶部的台阶型曲线近似于总体的概率密度曲线,图中直方图顶部的台阶型曲线两头低,中间高,有一个峰,且关于中心线比较对称,好象接近于某个正态变量的概率密度曲线.因此,可以推断是近似服从正态分布。第三节 抽样分布一 统计的三个重要分布1. 分布: 设 为独立标准正态变量,称随机变量的分布为自由度为 n 的 分布,记为 。2. t 分布: 设随机变量 X 与 Y 独立, ,则称的分布为自由度 n 的 t 分布,记为 。3. F 分布: 设随机变量 U 与 V 相互独立, ,则称的分布为自由度 的 F 分布,记为 。【注 1】 “ 为独立标准正态变量 .均服从 (0,1)N”“ 12,nX 是来自总体 (0,1)N的样本” 【注 2】 t分布为对称分布与标准正态分布相似,但比之尾厚当 30n时,近似于标准正态分布【注 3】 2分布具有可加性:若 且 与 相互独立,则22112,n21.2112n【注 4】 F分布为非负的不对称分布,且有:若 ,则 .12,Fn21,Fn例 1. 设 是来自正态总体 X 的一个样本, ,求 X的分布.2,XN解:因为 是来自正态总体 X 的一个样本,所以 相互独立,且与总体 X 服从相同的分布。因此 也服从正态分布。又:11nniiiEEX;22211nni iiDDn所以 .2,N例 2. 设 是来自正态总体 X 的一个样本, ,126X 0,XN又 ,求 Y 的分布2234563Y 解:由正态分布的性质, ; ,则1230,N456,3,1234560,; 1N从而有: 根据 2分布具有可加性得:2 2123456; 1.3XX,2123456所以: 。2213456YXX 二.正态总体的抽样分布定理1.定理 1 设 是来自正态总体 的一个简单随机样本, 与 分别为样本的均值和样本方差,则有1) ; 即: (0,1)/XNn.2)2()(1)nSn, 且 与 相互独立3) /XtSn例 3. 设 X 与 Y 相互独立,且都服从正态分布 2(0,)N,而 1234,X和 1234,Y分别是来自总体 X 和 Y 的样本讨论统计量 12342XZYY的分布解: ,又2340,16;XN 12340,XN0,iN所以 ,故 ,从而0,1i 2i 22231 4即 . 则222134YY12342XZYY.123424/XXt*2. 定理 2 设 112,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号