资源预览内容
第1页 / 共53页
第2页 / 共53页
第3页 / 共53页
第4页 / 共53页
第5页 / 共53页
第6页 / 共53页
第7页 / 共53页
第8页 / 共53页
第9页 / 共53页
第10页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
几种统计分析模型介绍福建省国家调查队系统统计建模培训主讲人:张业圳2009年6月8日n张业圳n福建师范大学经济学院副教授、博士、财金系副 主任n主要教学研究方向:数量经济学与金融实证分析n联系电话:87369087 13609525129n Email: zhangyz1971126.comn Q Q: 107345901n地址:福建师范大学经济学院 邮编:350108经济统计分析统计学研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。 经济统计分析就是用统计方法来分析经济现象数量特征和经济变量之间的关系。主要的工作有: 1)分析经济现象中变量之间相互关系2)经济预测3)政策评价什么是经济统计分析模型模型 对现实的描述和模拟。 用不同方法对现实进行描述和模拟,就构成不同的模型。语义模型、物理模型、几何模型、数学模型和计算机模拟模型。 经济数学模型:用数学方法描述经济活动。采用的数学方法不同,对经济活动提示的程度不同,构成各类不同的经济数学模型。数理经济模型 计量经济学模型 本次培训主要模型 1、聚类分析 2、回归分析 3)因子分析和主成分分析 4)时间序列分析第一部分:预备知识样本与统计量 总体与样本 在数理统计中,把研究对象的全体称为总体(population)或母体,而把组成总体的每个单元称为个体。 抽样 要了解总体的分布规律,在统计分析工作中,往往是从总体中抽取一部分个体进行观测,这个过程称为抽样。 样本与统计量 子样 子样 是n个随机变量,抽取之后的观测数据 称为样本值或子样观察值。 在抽取过程中,每抽取一个个体,就是对总体X进行一次随机试验,每次抽取的n个个体 ,称为总体X的一个容量为n的样本(sample)或子样;其中样本中所包含的个体数量称为样本容量。随机抽样方法的基本要求 独立性即每次抽样的结果既不影响其余各次抽样的结果,也不受其它各次抽样结果的影响。 满足上述两点要求的子样称为简单随机子样.获得简单随机子样的抽样方法叫简单随机抽样. 代表性即子样( )的每个分量 与总体具有相同的概率分布。 从简单随机子样的含义可知,样本 是来自总体 、与总体 具有相同分布的随机变量.简单随机抽样 例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。例如:为了分析福建省居民家庭收入状况,对福建省居民家庭收入进行调查。统计量 定义 设( )为总体X的一个样本,为不含任何未知参数的连续函数,则称 为样本( )的一个统计量。则 例如: 设 是从正态总体 中抽取 的一个样本,其中 为已知参数, 为未知参数,是统计量 不是统计量 几个常用的统计量 样本均值(sample mean)设 是总体 的一个样本,样本方差(sample variance) 样本均方差或标准差它们的观测值用相应的小写字母表示.反映总体X取值的平均,或反映总体X取值的离散程度。几个常用的统计量 设 是总体 的一个样本,子样的K阶(原点)矩几个常用的统计量 设 是总体 的一个样本,子样的K阶中心矩它包括两个方面数据整理计算样本特征数数据的简单处理 为了研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。数据的简单处理是以一种直观明了方式加工数据。计算样本特征数: 数据的简单处理 数据整理:将数据分组 计算各组频数作频率分布表 作频率直方图(1)反映趋势的特征数 样本均值中位数:数据按大小顺序排列后,位置居中的那个数或居中的两个数的平均数。众数:样本中出现最多的那个数。 数据的简单处理 (2)反映分散程度的特征数:极差、四分位差 极差样本数据中最大值与最小值之差, 四分位数将样本数据依概率分为四等份的3个数椐,依次称为第一、第二、第三四分位数。 第一四分位数Q1: 第二四分位数Q2: 第三四分位数Q3: 第二部分:参数估计第一节 参数的点估计一、点估计问题设总体 X 的分布函数的形式为已知的F ( x, ) ,其中 x 是自变量,为未知参数(它可以是一个数,也可以是一个向量)借助于总体 X 的一个样本(X 1, X 2, , X n ),来估计未知参数的值的问题,称为参数的点估计问题点估计的问题就是要构造一个适当的统计量 ( X1, X2, ,Xn ),用样 本的一组观察值( x1, x2, ,xn ),得到 的观察值 ( x1, x2, ,xn ), 以此来估计未知参数 称统计量 ( X 1, X 2, , X n )为的估计量,称( x1, x2, ,xn )为的估计值二、矩估计法的函数,记作l=l( ) 即,l=1,2,,k设总体 X 的分布函数为 , 其中 为 k 个未知参数. 假设总体 X 的各阶原点矩 存在, 则E (X l )是对于总体 X 的样本( X1, X2, ,Xn ),样本的 l 阶原点矩为,l = 1, 2, ,k令l = Al , l=1,2,,k,即 从上述方程组中解出 ,分别记作以此作为未知参数 的估计量,称为矩估计量如果样本观察值为( x1, x2, ,xn ),则得未知参数 的矩估计值为上述估计未知参数的方法就叫做矩估计法解此方程组得到 与 的矩估计量为令即解例1 设总体 X 的均值为,方差为 ,且 ,但与 均未知,又设总体 X 的一个样本为 (X1, X2 , , Xn),求与 的矩估计量解 由例4可得例2 某厂生产一批铆钉,现要检验铆钉头部直径,从这批产品中随机抽 取12只,测得头部直径(单位:mm)如下:13.3013.3813.4013.4313.3213.4813.5413.3113.3413.4713.4413.50设铆钉头部直径这一总体 X 服从正态分布 ,试求 与 的矩估计 值注 此例说明,无论总体 X 服从什么分布,样本均值 都是总体均值 的矩估计量,样本二阶中心矩就是总体方差 的矩估计量三、极大似然估计法1设总体X为离散型随机变量,其分布律为其中为未知参数,取值范围为 设 X1, X2, , Xn为来自 X 的样本,则 X1, X2, ,Xn 的联合分布律为 又设 x1, x2, , xn 为一组样本值,令称 L()为样本的似然函数(1)若有 ,使得对一切 ,有成立,则称 为的极大( 或最大 )似然估计值,相应的统计量 称为的极大( 或最大 )似然估计量我们规定,使得 的 就是的极大似然估计值由于ln x是单增函数,所以 与 有相同的驻点,因此只需从中解出 就是的极大似然估计值,称方程(2)(2)为极大似然方程例3 设总体 , 与 未知,( X1, X2 , , Xn )为总体 X 的样本,求 与的极大似然估计量解 X 的概率密度为设 x1, x2, xn 为样本值,似然函数为令解得 与 的极大似然估计值为因此, 与 的极大似然估计量为四、估计量的评选标准1无偏性估计量是样本的函数,它是一个随机变量,由不同的方法得到的估计量可能相同也可能不同而对同一估计量,由不同的样本观察值得到参数的估计值也可能不同我们很自然地要求估计量的期望等于参数的真值,即无偏性定义 设 是未知参数的估计量,若 ,则称 为 的无偏估计(量)例4 设总体 X 的均值为 ,( X1, X2, X3 )是总体 X 的样本,证明下列两个估计量都是 的无偏估计证 由于 所以 与 都是 的无编估计(只需 k1+ k2 + + kn =1,则 = k1 X1 + k2 X2 + + kn Xn 就是 的无偏估计 )设 为参数的估计量,若当 时, 按概率收敛于 ,即对于任意正数,有,则称 为的一致估计(量)3一致性根据大数定律可知,样本均值 是总体均值 的一致估计量设 与 是参数的两个无偏估计量,若, 则称 比 有效.2有效性第二节 参数的区间估计点估计是通过构造统计量 (X1, X2, , Xn)来对总体 X 中的未知参数进行估计,由一个样本值( x1, x2, , xn )可得到的估计值 ( x1, x2, , xn ) 这种估计值是无法知道误差的我们要定出一个范围,并要求以一定的概率保证这个范围包含着的真值这个范围通常以区间的形式给出,我们把这个区间称为置信区间定义 设总体 X 的分布中含有一个未知参数 ,(X1, X2, , Xn )是来自总体 X 的一个样本如果对于给定的常数 ,统计量 1= 1 (X1, X2, , Xn )与2= 2(X1, X2, ,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号