资源预览内容
第1页 / 共108页
第2页 / 共108页
第3页 / 共108页
第4页 / 共108页
第5页 / 共108页
第6页 / 共108页
第7页 / 共108页
第8页 / 共108页
第9页 / 共108页
第10页 / 共108页
亲,该文档总共108页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1,第八章 抽样调查,学习目的,第一节 抽样调查的一般问题,第二节 抽样分布,第三节 抽样估计,第四节 抽样组织形式,2,学 习 目 的,了解抽样调查和抽样分布的基本概念 掌握抽样误差的计算方法 掌握抽样估计的基本原理和方法 了解抽样调查的基本组织形式 掌握必要样本容量的计算,3,第一节 抽样调查的一般问题,4,一、什么是抽样调查,抽样调查:按随机原则从总体中抽取一部分单位进行调查,根据样本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定可靠性的估计和判断,以反映总体的数量特征的一种统计方法。,随机原则:即是在抽取样本时,排除人们主观意图的作用,使得总体中的每个单位或每个样本有相等的入选机会。随机原则又称为等可能性原则。,5,二、抽样调查的特点,调查单位的确定是按随机原则从全部总体单位中抽取的。 用部分单位的指标数值去推断和估计总体指标数值。 抽样调查中的抽样误差是不可避免的,但在事先是可以计算并加以控制的。 抽样推断是运用概率估计的方法。,6,三、抽样调查的作用,有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的方法。,从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,也要采用抽样调查。,抽样调查的结果可以对全面调查的结果进行检查和修正,抽样调查可以用于工业生产过程的质量控制。,利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,以决定行动的取舍。,例如: 对无限总体不能采用全面调查。 另外,有些产品的质量检查具有破坏性,不可能进行全面调查,只能采用抽样调查。,7,四、基本概念(概念要点),全及总体(Population):所要研究的事物的全体构成的总体 样本(Sample):从全及总体中所抽取的部分单位组成的总体,又称抽样总体; 总体参数(Population parameter):是在理论上可以从整个总体中计算出来的总体指标。 样本统计量(Sample statistic):是根据样本观察值计算出来的样本指标。 样本容量(Sample size):是样本中所含个体的数量,又称样本单位数。,8,四、基本概念(常用的符号标记),总体成数:P 总体标准差: 样本统计量,样本成数:p 样本标准差:S,总体参数,9,四、基本概念(概念之间的关系),总体,样本,随机抽取,总体中有N个个体,样本容量为:n,统计推断,总体参数一般是未知的,样本统计量的值是可知的,10,总体容量N=10000 样本单位数n=100 样本均值(平均耐用时间) x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估计(估计方法将在第三节介绍)。,四、基本概念(举例),【例8-1】对一批某种型号的电子元件10000只进行耐用时间检查,随机抽取100只,测试的平均耐用时间为1055小时,合格率为91%。,11,五、样本统计量的计算公式,样本均值:,样本成数:,样本标准差:,在样本资料未分组的情况下:,在样本资料分组的情况下:,在样本资料未分组的情况下:,在样本资料分组的情况下:,12,六、抽样方法与样本可能数目,抽样方法: 重复(置)抽样:是指从全及总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放回到总体中去,再从总体中随机抽取第二个单位,记录它有关标志表现以后,也把它放回全及总体中去,照此下去直到抽选n个样本单位。 不重复(置)抽样:不重复抽样是从总体抽取第一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回总体中参加下一次抽选。然后,从总体N-1个单位中随机抽选第二个样本单位,记录了该单位有关标志表现以后,该单位也不再放回全及总体中去,照此下去直到抽选出n个样本单位。,13,六、抽样方法与样本可能数目,样本可能数目:是指从总体中可能抽取的样本的最多数目,抽样数目大小与抽样方法有关。,重复抽样时的样本可能数目是一个可重复的排列数:,例8-2:从0-9的10个数中随机重复抽选6个数字组成电话号码,共能组成多少个电话号码?,14,不重复抽样时的样本可能数目可分为考虑顺序和不考虑顺序两种情况。考虑顺序时的样本可能数目是不重复的排列数:,六、抽样方法与样本可能数目,例8-3:从班级10位学生中抽选三人担任不同的职务,问共有几种抽法?,15,六、抽样方法与样本可能数目,不考虑顺序时的样本可能数目是不重复的组合数:,例84:从小组10位学生中不重复随机抽选3个组成样本,考查其平均成绩,可能的样本数目为:,16,第二节 抽样分布,17,第二节 抽样分布,抽样分布:样本统计量的概率分布。 样本统计量是随机变量。 统计量的取值不但和样本容量有关,还和抽样方法有关。下面我们讨论简单随机样本的抽样分布。,18,一、重复(置)抽样分布 (一)样本平均数的分布 (二)抽样成数的分布 二、不重复(置)抽样分布 (一)样本平均数的分布 (二)抽样成数的分布 三、抽样误差的种类 四、关于正态分布的定理,第二节 抽样分布,19,一、重复(置)抽样分布,(一)样本平均数的分布 样本平均数的分布由所有可能样本的平均数取值和相应的概率组成。 例8-5:某施工班组5个工人的日工资分别为:34、38、42、46、50元。则总体工人日工资平均数和方差分别为:,20,一、重复(置)抽样分布,现用重复抽样方法从5人中随机抽取2人组成样本,样本可能数目为52 = 25个。各样本的日平均工资计算结果如下:,25个样本的日工资平均数计算表,21,一、重复(置)抽样分布,根据上表数据,可以整理出样本平均数的分布如右表:,22,一、重复(置)抽样分布,样本日平均工资分布图,23,一、重复(置)抽样分布,根据样本日工资平均数分布表,可以计算日工资平均数的数学期望和方差:,24,一、重复(置)抽样分布,1.重复抽样的样本平均数的数学期望等于总体平均数,即:,2.抽样平均数的标准差又称为抽样平均误差或抽样标准误差,重复抽样的抽样平均误差等于总体标准差除以样本单位数的平方根。即:,25,样本平均数的分布与总体分布的比较,总体分布,样本平均数的分布,原来如此,26,一、重复(置)抽样分布,从以上结论可知,(1)抽样平均误差比总体标准差小得多,仅为总体标准差的 。例如,一个县的粮食亩产高低相差很大,亩产标准差为80公斤,如果随机抽取100亩计算其平均亩产,其平均误差就显著缩小,只有总体标准差的1/10。(2)抽样平均误差与总体标准差成正比,而和样本单位数的方根成反比。,27,一、重复(置)抽样分布,(二)抽样成数的分布 可以把是非标志作为(0,1)变量,其总体平均数就是总体成数,总体方差也由成数确定。,28,一、重复(置)抽样分布,现在从总体中用重复抽样方法抽取n个单位组成样本,计算样本成数p,样本成数的分布实质上就是(0,1)变量的样本平均数的分布:,29,一、重复(置)抽样分布,例8-6:已知某批零件的优等品率为80%,现用重复抽样方法从中抽取100件,求样本优等品率的抽样平均误差。,30,二、不重复(置)抽样分布,(一)样本平均数的分布 1.不重复抽样的样本平均数的数学期望等于总体平均数,即:,修正因子,2.不重复抽样的抽样平均误差等于重复抽样的抽样平均误差乘以修正因子,即:,31,二、不重复(置)抽样分布,(二)抽样成数的分布,32,例8-7:要估计某地区10000名适龄儿童的入学率,用不重复抽样的方法抽取400名儿童,检查结果有320名入学,计算样本入学率的抽样平均误差。,由上可知,P=320/40080% 1、在重复抽样下,入学率的抽样平均误差:,2、在不重复抽样下,入学率的抽样平均误差:,33,抽样平均误差公式汇编,重复抽样 不重复抽样,样本平均数的抽样误差,样本成数 的抽样误差,34,三、抽样误差的种类,(一)统计误差的种类 1、登记性误差 2、代表性误差 非偶然性代表性误差(系统偏差) 偶然性代表性误差(随机误差),35,(二)抽样实际误差 1、抽样实际误差的含义 抽样实际误差是指在遵守随机原则的前提下所产生的样本指标值与相应总体指标值之间的差异。,36,2、抽样实际误差的种类 平均数的抽样实际误差。 成数的抽样实际误差。,37,(三)抽样平均误差,1、平均数的抽样平均误差。 2、成数的抽样平均误差。,38,(四)抽样极限误差,(一)概念 抽样极限误差又称允许误差,是指在抽样推断中所允许出现的最大误差。一般用符号 表示。 (二)计算公式,39,四、关于正态分布的定理,(一)正态分布再生定理 (二)中心极限定理,40,(一)正态分布再生定理,41,(二)中心极限定理,设从均值为 ,方差为 的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为 ,方差为 的正态分布。,42,例8-8:有一批电子元件,设其耐用时数服从正态分布,其平均耐用时数为6000小时,标准差为500小时。现从该总体中抽出一个容量为100的简单随机样本,求该样本平均数介于5900 6100之间的概率。 解:由于X N(6000,5002),n=100,所以有,43,例8-9:从一个平均年龄为30岁,标准差为3岁的妇女总体中随即抽取36名妇女构成简单随机样本,求该36名妇女平均年龄小于31岁的概率为多少?,44,第三节 参数估计,有效的估计将是,45,一、样本统计量的优良标准,(一)无偏性 (二)一致性 (三)有效性,46,(一)优良标准之一:无偏性,无偏性:样本统计量的期望值(均值)等于被估计的总体参数。,47,(一)优良标准之一:无偏性,48,(二)优良标准之二:一致性,一致性:即当样本容量n充分大的时,若样本统计量充分地靠近被估计的总体参数,则该样本统计量是被估计的总体参数的一致估计量。,49,(三)优良标准之三:有效性,有效性:如果一个样本估计量的方差比其他估计量的方差小,则称该样本估计量是被估计的总体参数的有效估计量。,50,二、点估计(Point estimation),点估计:又称定值估计,它是用实际样本统计量数值代替总体参数值的一种统计估计方法。,点估计的优点:能够提供总体参数的具体估计值。 点估计的缺点:并不能提供误差大小的信息。,51,二、点估计(举例),【例8-10】由于许多战略上的理由,盟军非常想知道二战期间德军总共制造了多少辆坦克。德国人在制造坦克时是墨守陈规的,他们把坦克从1开始进行了连续编号。在战争进行过程中,盟军缴获了一些敌军坦克,并记录了它们的编号。那么怎样用这些号码来估计坦克总数呢?,我们知道,制造出来的坦克数肯定大于记录中的最大编号。因此,其中点估计的方法之一就是,计算出被缴获坦克编号的平均值,并认为这个值是德军全部坦克编号的中点,用样本均值乘以2就是总数的一个估计。,注从战后发现的德军记录来看,盟军估计值非常接近所生产坦克的真实记录。 统计学家做得比间谍们更漂亮!,52,三、区间估计 (interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在7585之间,置信水平是95%,53,区间估计的图示,54,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 - 是总体参数不在置信区间的概率 常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,置信水平 (confidence level),55,由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号