资源预览内容
第1页 / 共27页
第2页 / 共27页
第3页 / 共27页
第4页 / 共27页
第5页 / 共27页
第6页 / 共27页
第7页 / 共27页
第8页 / 共27页
第9页 / 共27页
第10页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
6.1 整群抽样6.2 群内相关系数6.3 系统抽样6.4 个体指标具有特殊结构时的系统抽样6.5 系统抽样估计量方差的估计2021/8/261整群抽样的提法目标量的估计2021/8/262整群抽样的提法u整群抽样的提法与特点 在多阶抽样中,当某一单元被抽中,对该单元包含的下一级抽样单元不再抽样,而是进行普查 l抽样框要求简单 l样本相对集中,方便调查 l特定场合具有较高精度 因为样本集中,可增大样本量弥补精度上的损失 群内次级单元差异很大反映总体分布时,其精度不见得低 2021/8/263整群抽样的提法u整群抽样的适用场合表6.1 可能适合整群抽样的实例某个城市住户特征住宅街区某个城市某项消费城市居民住宅区某机场旅游信息离开的旅客某大学就业计划学生班级某 乡社会态度成年村民村城市土地所有者档案税务信息土地所有者分类台帐页航班2021/8/264目标量的估计u将整群抽样看作二阶抽样的特例定理6.1 对简单随机抽样的整群抽样,总体总数Y的估计有2021/8/265目标量的估计定理6.2 对有放回PPS整群抽样,总体总数Y的估计有也可将整群抽样看作单阶抽样,同样可以得到上述两个定理2021/8/266目标量的估计例1 在一次针对某城市大学生月生活费支出的调查中,以小组为群进行整群抽样。每个小组有8名大学生,采用简单随机抽样在510个组中抽取12个小组,全部96个样本大学生月生活费支出数据如表.试估计该城市大学生人均月生活费及其95%的置信区间.例2 调查一片荒地上蝗蝻数量,以一平方米为单位。N=5000,K=500,N0=10,k=20,作简单随机的整群抽样,估计整块荒地蝗蝻数.数据如表 2021/8/267群内相关系数的概念整群抽样的设计效应2021/8/268群内相关系数的概念u群内相关系数群内相关系数是衡量群内单元同质性的一个指标2021/8/269整群抽样的设计效应2021/8/2610整群抽样的设计效应2021/8/2611目标量的估计例3 某县有33个乡,共726个村,某一年度农作物总种植面积为30525亩。先采用等概抽样随机抽出10个乡进行该种作物的产量调查,要求利用无偏估计量和比率估计量(以群规模为辅助变量,以种植面积为辅助变量)分别估计全县总产量,并计算估计量的标准差。数据如表.2021/8/2612系统抽样的提法系统抽样的估值法系统抽样的效率2021/8/2613系统抽样的提法直至N为止然后对号码1,2,K作随机抽样,若i入样,则K+i,2K+i,皆入样,组成一个系统样本若将同一列个体看做一个群,系统抽样可视为整群抽样N不是K整数倍的处理方法1.N/K较大(50)可忽略每群个体差2.将个体单元首位衔接循环取样一般假定N=KN0,并且只从1K中抽选一个样本单元系统抽样的优点是抽样非常方便2021/8/2614系统抽样的估值法 将系统抽样看作整群抽样抽取一个一级单元,有由这个思路无法给出其均方偏差的估计量2021/8/2615系统抽样的效率u与简单随机抽样的比较2021/8/2616系统抽样的效率u与分层抽样的比较2021/8/2617系统抽样的效率例 假设总体有表中的30个单元,欲取5个构成系统样本,与简单随机抽样和分层抽样同样本量的结果进行比较(两种排列方式).2021/8/2618个体指标与其次序有线性关系个体指标与其次序有某种周期关系个体的次序随机排列2021/8/2619个体指标与其次序有线性关系u系统抽样u简单随机抽样u分层抽样此时分层抽样精度最高,系统抽样次之,简单随机抽样精度最低2021/8/2620与次序有某种周期关系此时系统抽样估值的精度与K的选取有很大关系,应避免K=t实际呈现精确周期排列的资料是没有的,而具有一定周期性的资料很多,例如季节资料、月度资料、星期资料等对周期资料选择合适K进行系统抽样,可得到比较理想的精度2021/8/2621个体的次序随机排列 对总体的某种排列次序,系统抽样精度可能优于简单随机抽样也可能劣于简单随机抽样,但对N个个体的所有N!种排列而言,系统抽样的平均精度与简单随机抽样相等当个体指标具有某种特殊结构时,常对取样方法进行人为调整,有点典型抽样的味道,非完全概率抽样2021/8/2622看作简单随机抽样看作分层抽样2021/8/2623看作简单随机抽样来估计,其中当个体单元并非完全随机排列时这个估计会产生偏量:群内相关系数小,会高估均方偏差;群内相关系数大,会低估均方偏差。2021/8/2624看作分层抽样v2,v3有很广适用范围,特别是v3为许多实际工作者所采用。 将两行个体看作一个层,每层有两个样本单元。两个样本单元构造一个该层的方差估计,再按分层抽样汇总出一个均方偏差的估计2021/8/2625看作分层抽样例 调查某单位员工档案工资外的收入情况,该单位有员工660人,备有以出生年月为顺序的花名册。以花名册作为抽样框,拟抽取30个样本单元,故取K=22作系统抽样。从1,2,22中随机取出一数为R=7,入样的单元号码为7,29,623,645。对花名册对应号码的员工进行调查,得当月各人收入资料如表(单位:元),估计每人平均收入及估计量的均方偏差.2021/8/2626 刚才的发言,如刚才的发言,如有不当之处请多指有不当之处请多指正。谢谢大家!正。谢谢大家!2021/8/2627
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号