资源预览内容
第1页 / 共31页
第2页 / 共31页
第3页 / 共31页
第4页 / 共31页
第5页 / 共31页
第6页 / 共31页
第7页 / 共31页
第8页 / 共31页
第9页 / 共31页
第10页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
引言 狭义抽样调查 (定义、特点、分类、与普查的联系) 介绍一下现有的一些抽样方法。 如何抽得“好样本” 抽样调查的基本步骤抽样调查定义:按照一定程序从所研究对象的全体(总体)中抽取一部分(样本)进行调查或观察,获取数据,并以此对总体的一定目标量(参数)进行推断(或估计)。抽样技术的运用:抽取样本和估计总体。分类:根据样本抽取的方式不同,抽样可以分为两类:非概率抽样和概率抽样。简单随机抽样、分层抽样、整群抽样等等 与普查的联系抽样调查的实施和具体步骤调查目标的系统陈述(确定调研问题)设计抽样方案问卷设计试抽样调查正式抽样调查数据处理 推断分析撰写调查报告基本概念 总体:目标总体、抽样总体 抽样单元和调查单元 抽样框 样本:反映抽样总体 数理统计的样本与抽样调查的样本的区别? 抽样分布 抽样误差和非抽样误差 如何理解抽样标准误是衡量抽样误差的核心指标? 影响抽样误差大小的因素有哪些? 费用和精度 最优设计 影响样本量的因素 设计效应简单随机抽样 实施和适用条件 基本计算1:从一个容量为100的总体中抽出样本容量为10的简单随机样本,要估计总体平均水平,并给出置信度为95%的置信区间。序号i 1 2 3 4 5 6 7 8 9 10yi4 5 2 0 4 6 6 15 0 8 (2)(2)估计总体的总量以及9595的置信区间(3)总体均值估计的绝对误差和相对误差(4)如果现在要求以95%的把握保证相对误差不超过10%,样本量至少是多少? 基本计算2:某超市开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。于是在总体中抽取了一个样本容量为200人的样本。调查发现对该超市的购物环境表示满意和基本满意的居民有130位,请估计对超市购物满意的居民的比例,并在置信度为95%下,给出估计的绝对误差,相对误差和置信区间。简单随机抽样样本量的确定 通常先计算出n的近似值n0,实际n比n0小。当n0 N,两者之比小于0.05时,则可取nn0,否则进行修正。 基本计算1.一批电子元件有1600只,为估计元件的平均寿命,先根据抽样计算出样本平均寿命为8400小时,标准差为760小时,如果要求估计的绝对误差限为168小时,可靠程度在95%以上,问至少应抽取多少只元件? 2 在人口变动情况调查中,出生率P是一个重要指标。根据以前调查数据,出生率P的估计可取为18。问在95%,的置信度下,实际调查估计P的绝对误差限为0.5 和相对误差限5%,各需要多大的样本量? 3.某销售公司希望了解全部3000家客户对公司的满意度,决定用 调查一个简单随机样本。这时销售公司希望以95的把握保证客户满意度比例P在样本比例p10,p+10范围内,但对总体比例P无法给出一个大致范围。这时调查多少个客户,才能保证满足要求?在超市问卷调查中进行预调查,置信度为95%,抽取50个样本,得到的满意度的相对误差为5%,现希望在相同的置信度下,使相对误差减少到原来的一半,则需要再抽取多大的样本量?以知某个抽样方案的设计效应是4,在精度相同情况下,已知简单随机抽样所需要的样本量为25,则该抽样方案所需的样本量为多少?分层抽样 分层抽样的实施和适用条件 分层的标准 估计 基本计算1.某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果是城镇年平均户收入为15180元,标准差3972元;农村年平均收入9856元,标准差为2546元。求全市年平均户收入的估计及其90%的置信区间。 基本计算2 调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),估计该地区居民奶制品年消费总支出及估计的标准差。层居民户总数样本户奶制品年消费支出1234567891012342004007501500105018050401302603506011015110800015100140201055603040160200258085180109016030030017022025 基本计算:某地区的居民拥有家庭电脑的情况进行调查,以居民户为抽样单元,根据收入水平将居民户划分为四层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:台),如表3-3。估计该地区居民拥有家庭电脑的比例和估计的标准差。 分层抽样中样本量的确定 总样本量确定的情况下进行: 比例分配 neyman 最优分配 一般最优分配 基本计算:某市进行家庭收入调查,分城镇居民和农村居民两部分抽样,在全部城镇23560户中抽取,在全部农村148420户中(均按简单随机抽样进行), n=550,城镇居民与农村居民年收入的标准差估计分别为 s1=3000元, s2=2500元,对城镇居民与农村居民抽样平均每户的费用比为1:2,试求城镇与农村两层比例分配与最优分配的样本量。又若不考虑费用因素,那么最优分配的结果又有何变化?hNhshCh12356030001214842025002123451020040040050010202000500020008000合计615-17000某些层需要进行100%抽样整群抽样 整群抽样的实施和适用条件 分群的原则 群大小规模相等时的计算 群间方差和群内方差 群内相关系数和设计效应1212个楼层9696户居民人均月食品消费额isi123456789101112188.00180.50149.75207.875244.25278.50182.75211.50253.125191.125274.75258.37527.1917.9817.3229.1745.2063.8738.7727.4844.5228.2943.7043.52阶段抽样 实施和适用条件 基本计算:新华书店某柜台上月共用去发票7070本,每本100100张。现随机从中挑出1010本,每本中随机抽出1515张发票,得到数据如下:i1234567891025.0227.2221.5633.5015.6025.8518.9517.1120.9418.70135.0271.58127.1671.4321.6197.3784.7530.7924.5541.56估计上月该柜台的营业总额和估计值的方差;不等概抽样 适用条件 实施条件 与单元规模成比例的PPS抽样(代码法的实施) 总量估计:汉森-赫维茨估计量pps抽样时各单元的代码数(设Mi皆为整数)单元i单元大小Mi代码数12NM1M2MN1,2, M1M1+1, M1+2, M1+M2 , 例子:某公司欲估计一段时间内客户打入的 数量,因为打入 数量与时间长度有关,故采取与时间长度成比例的PPS抽样,设N=8,所取的时间长度分别是2,8,5,1,4,3,5,7,要抽样的样本量为4。 (1)说明样本的抽取方法; (2)若抽中的单位为前面排列的序号是第1,2,4,8这四个时间段,期间打入的 数量分别为8,29,5,28,请估计这段时间内客户打入 的总数,并给出估计量的方差估计。 多阶段自加权估计例 某小区拥有10座高层建筑,每层建筑拥有的楼层数如表所示。高层建筑ABCDEFGHIJ楼层1212 1615101610181620用二阶抽样抽出10个楼层进行调查,第一阶段为有放回、按与每座建筑拥有的楼层数成比例的不等概率抽样抽取5座建筑,第二阶段按简单随机抽样对每座建筑抽取两个楼层。对10个楼层居民人数调查的结果如下表所示,请对小区总居民数进行估计,并给出估计精度。表 10座高层建筑的各自层数一阶样本序号12345居民数18,1215,1819,1316,1016,11综合题 具体抽样中样本量的确定 如何测自己的词汇量等等期末考试类型 问答题(含基本概念的理解等)20 计算题 70简单随机抽样, 分层抽样 整群抽样 阶段抽样 不等概抽样 综合题 10答疑和考试 答疑:6月7日下午13:3016:00 A110 考试时间:6月13日上午10:0012:00 具体教室:考前见网络课堂通知和课代表通知 请带计算器(勿忘)
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号