资源预览内容
第1页 / 共38页
第2页 / 共38页
第3页 / 共38页
第4页 / 共38页
第5页 / 共38页
第6页 / 共38页
第7页 / 共38页
第8页 / 共38页
第9页 / 共38页
第10页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第六章 抽样本章主要内容l抽样的意义与作用l概率抽样的原理与程序l 概率抽样方法l户内抽样与PPS抽样l非概率抽样方法l 样本规模与抽样误差第一节 抽样的意义与作用l一、抽样的概念l二、抽样的作用l三、抽样的类型一、抽样的概念l抽样指的是从组成某个总体的所有元素的集合 中,按一定方式选择或抽取一部分元素,即抽 取总体的一个子集的过程,或者说,抽样就是 从总体中按一定方式选择或抽取样本的过程。l与整体调查相比,抽样调查的优越性:l调查费用较低;l速度快;l应用范围广;l可获得内容丰富的资料;l准确度高。抽样术语:l总体(注意:研究总体和调查总体)l样本l抽样l个体与抽样单位l抽样框:抽样范围l参数值与统计值l抽样误差l置信水平与置信区间二、抽样的作用l抽样的目的之一,就是要通过这些样本值 去估计和推断各种总体值l抽样作为人们从部分认识整体这一过程的 关键环节l其基本作用是向人们提供一种实现“由部 分认识总体”这一目标的途径和手段三、抽样的类型l各种抽样都可以归为概率抽样和非概率抽样抽样 两大类l这是两种有着本质区别的抽样类型:l概率抽样:是依据概率论的原理,按照随机原则进行 的抽样,因而它能够避免抽样过程中的人为误差,它 使总体中每一个体都有一个已知不为零的被选机会进 入样本,而保证样本具有代表性。l非概率抽样:主要是依据研究者的主观意愿、判断或是 否方便等因素来抽取对象,它不考虑抽样中的等概率 原则,因而往往产生较大的误差,难以保证样本的代 表性。抽样 方法概率 抽样非 概率 抽样简单 随机 抽样多段 抽样整群 抽样分层 抽样系统 抽样偶遇 抽样判断 抽样定额 抽样雪球 抽样第二节 概率抽样的原理与程序l一、概率抽样的基本原理l二、抽样分布l三、抽样的一般程序l四、抽样设计的原则l五、概率抽样的基本观念及其影响因素一、概率抽样的基本原理l所谓随机抽取,就是保证总体中的每 一个个体都有同等的机会入选样本l或者说,总体中的每一个成员被抽中 的概率相等,即被抽中的机会相等三、抽样的一般程序l界定总体 对研究总体的界定过程也就是对他 的基本构成单位,所包含的内容以及空间与 时间的范围等作出规定的过程,同时也是确 定调查对象,及它的内涵、外延及数量的过 程。 l制定抽样框 抽样框是概率抽样一个最基本 的要求,它的质量关系着抽样的质量。 l设计抽取方案 包括确定样本所包含个体的数 目,选择抽样的具体方法。l实际抽取样本l评估样本质量:样本对于总体的代表性问题 始终是抽样中关注的中心问题。四、抽样设计的原则l一个优秀的抽样设计应该满足下列四条标 准,也就是进行抽样设计的四个原则:l目的性原则 l可测性原则 l可行性原则 l经济性原则概率抽样背后的基本观念l问题:如果所有总体中的成员在所有方面 人口特征、态度、经历、行为等都是相 同的,那么就无需进行仔细的抽样了。l概率抽样的基本观念:要对总体进行有用 的描述,从该总体中抽样出来的样本必须 包含总体的各种差异特征。l但要做到这一点,并不容易影响因素l1、有意识与无意识的抽样误差l2、代表性(大体接近)与选择概率l1)概率抽样虽然无法完美地代表总体,但较其 他抽样方法更具有代表性,可以避免各种偏见。l2)概率抽样能够使我们估计样本的精确度及代 表性。(依赖于随机选择程序)l3、随机选择:任何要素都具有同等的、独立于 其他事件的被抽到的概率。(用随机数表或电脑 程序,避免人为的自觉或不自觉的偏见)l4、样本分布和抽样误差的评估lP与Q代表二项变量的总体参数值:如果有60%的学生 赞成校规而40%的学生反对,P与Q分别代表60%与 40%;ln代表每组样本包含的样本量(样本的大小);lS则代表标准误。(指出抽样结果集中在总体参数附近 多大范围内) S与n成反比,与PQ的乘机成正比。l5、置信水平与置信区间l置信水平(confident level):总体参数值 落在一既定置信区间的估测概率。如,我们 可以有95%的信心说35%至45%的投票者会 支持候选人A。l置信区间(confident interval):估测总体 参数值的范围。第三节 概率抽样方法l是依据概率:(probability sampling)概率抽样 论的原理,按照随机原则进行的抽样,因而它能 够避免抽样过程中的人为误差,它使总体中每一 个体都有一个已知不为零的被选机会进入样本, 而保证样本具有代表性。l概率抽样分为等概率抽样(随机抽样)和不等概 率抽样。还可分为:l一、简单随机抽样l二、系统抽样l三、分层抽样l四、整群抽样l五、多段抽样一、简单随机抽样(纯随机抽样) simple random samplingl是一种特殊的等概率抽样方法,总体中每一个 体均有同等被选机会,而且样本中每一个体是 被单独选出的。l是一种元素抽样。l分重复抽样和不重复抽样。l随机数字表是由数字0-9组成的表,由电子计算 机编制而成。 l具体详见P130.l步骤:l取得一份总体所有元素的名单(抽样框);l将总体中的所有元素一一按顺序编号;l根据总体规模是几位数来确定从随机数表中选 几位数码;(按照从左到右或从上到下或依对角线 或从右到左的顺序,小于或等于总体规模的选出, 大于的或重复的则不要.直到选够所需要的样本 数)用什么原则并不重要,关键是一旦建立原则就 要从头到尾都依这个原则去做.l依据从随机数表中选出的数码,到抽样框中去找 出它所对应的元素.l缺点?二、系统抽样(或等距抽样,机械抽样) systematic samplingl系统抽样是简单随机抽样的一个变种l具体做法是:l(A)将总体的所有个体前后排列起来。l(B)计算抽样距离。抽样距离K=N/n(N为总体包 含个体数;n为样本所含个体数);l(C)在头K个个体中,用完全随机的方式抽取一个 个体,设其所在的位置的序号是A。l(D)自A开始,每隔K个个体抽取一个个体,即陆 续抽取的个体所在位置序号为A,A+K,A+2KA+ (n-1)K。 l(E)将n个个体合起来,就构成了该总体的一个样本。系统抽样的特点:l与简单随机抽样相比,更易实施,工作量较少;l样本在总体中的分布更平均,故而抽样误差小于 或至少等于简单随机抽样,即较其更精确。l系统抽样的样本个体在每一层的相对应位置上, 而分层抽样则是由每层随机抽取的。l系统抽样是以总体的随机排列为前提的,如果总 体的排列出现有规律的分布时,就会使系统抽样 产生很大误差,降低样本的代表性。 l系统抽样适用于同质性较高的群体。当总体内不 同类别之间所含个体的数目相差过于悬殊时,采 用此法样本的代表性可能较差。这种情况一般使 用分层抽样。 三、分层抽样stratificationl分层抽样就是先将总体按一种或几种特征(性别 班级教育地理位置等)分为几个同质性的总体 (类、群),每一个子总体称为一层,然后从 每一层中随机抽取一个子样本,将它们合在一 起,即为总体的样本,称为分层样本。l分层抽样的优点:l(A)当一个总体其内部分层明显时,分层抽样能够 克服简单随机抽样的缺点。l(B)分层抽样可以提高总体参数估计的精确度。l(C)有些研究不仅要了解总体的情形,而且还要了 解某些类别的情形,分层抽样可以同时满足这两个 要求l(D)便于行政管理。 l前面三种抽样方式的共性:有一个要素名 单.l但是许多有趣的社会研究都需要从一个不 易获得抽样名单的总体中抽样,如:一个城 市一个州一个国家的人口全国的大学生 等.在这些例子中,抽样的设计必定更加复 杂,通常必须先进行整群要素抽样(称为群 ),然后再从这些群中抽取要素.既运用整群 抽样的方法.四、整群抽样(聚类抽样) cluster samplingl整群抽样是将总体按某种标准划分为一些子群体,每一个子 群为一个抽样单位,用随机的方法从中抽若干子群,将抽出 的子群中所有个体合起来作为总体的样本。l多级整群抽样方法一直重复两个基本步骤:1.列表名册(先编制初级抽样单位(如街道教会等)的 名册或将之分层2.抽样(根据选出的初级抽样单位再编制其要素名单 或被分层,得到次级抽样单位名单进行抽样,如此一直 重复下去.如街道_居委会_居民户_抽样)l整群抽样与分层抽样异同:l它们在第一步都是根据某种标准将总体分为一些小群l两者的抽样方式不同l由于抽样方式的不同,导致两者间划分子群的原则也 不同。在分层抽样中,层的划分依据的是层之间异质 性高,层内则尽可能同质的原则。整群抽样因仅抽取 某几个子群作为整体的代表,如果子群间差异显著, 且每个子群内同质性很高,那么这种情况下抽取的几 个子群显然无法代表总体。因此,整群抽样的分群原 则应与分层抽样不同,它是使得群体间异质性低,群 内异质性高,因此,分层抽样适用于界质分明的群体 ,而整群抽样适用于界质不清的总体。整群抽样的优缺点:整群抽样的优点:l它可以通过转换抽样单位扩大抽样的应用范围;l可以节省人财物力;l许多调查往往很难得到总体的所有个体的可靠名单,有时 即使可以得到,所需费用也十分昂贵,这就限制了抽样的 应用范围。这种情况下,使用整群抽样获得抽样框就容易 得多。l整群抽样通过将抽样单位由个人转换成群体,使由简单随 机抽样和分层抽样所不能进行的抽样调查成为可能 ,扩 大了抽样的应用范围。 整群抽样的缺点: l(A)样本分布不均匀,样本的代表性较差,与其他抽样 方法相比,相同样本数,抽样误差较大; l(B)分析整群样本的资料,如抽样误差,统计推断,假 设检验要比前面几种抽样方法复杂;五、多阶段抽样(多级抽样):l在整群抽样中,当子群数或子群内部个体数目较多,彼此间 的差异不太大时,常采用更经济方法,即不将样本子群的所 有个体作为样本,而是再从中用前述各种随机抽样的方法抽 取样本,因而最终样本的获得经过两次抽样,我们称其为二 阶段整群抽样,同样可做三阶段、四阶段即多阶段整群抽 样。l多阶段抽样的特点:l多阶段抽样通过采用由高级抽样单位过渡到低级抽样单位的方法,解 决了低级抽样单位不易获得的抽样框的问题,并且可以使样本的分布 较为集中,从而大大降低调查所费人财物力。l多阶段抽样由于在各阶段抽样时可根据具体情况灵活选用不同抽样方 法,故能综合各种抽样方法的优点,提高样本质量。l特别适用于调查范围大、单位多、情况复杂的调查对象。l多阶段抽样由于每阶段抽样都会产生误差,因此经多阶段抽样得到的 样本的误差也相应增加,这是它的不足。l但运用整群抽样也会存在问题,特别是当 街道大小不同(以户数来计算)时就会出现 问题.l当被抽样的群的规模很大时,应当采用一 种修正的的抽样设计,即概率比例抽样 (probability proportionate to size,PPS).这 种方式可以预防上述问题,仍可以在总体 中每个要素被选中的机会相同的情形下选 出最终的样本.第四节 户内抽样与PPS抽样l一、户内抽样的方法l按照kish的户内抽样的方法抽取被访对象的 好处是,它不仅可以使研究者收集到样本家 庭的资料。同时也可以收集这些被访者所构 成的个人样本的资料,这种资料可以用来描 述这一地区所有成年人所构成的总体l二、PPS抽样l社会研究中最重要、也最常用的一种不等概 率抽样叫做“概率与元素的规模大小成比例的 抽样”,简称PPS抽样l做法:l第一阶段:每个群按照其规模(所含元素的数量) 被给予大小不等的抽取概率;大的群具有比小的 群更大一些的概率;l第二阶段:从每个抽中的群中都抽取同样多的元 素(也是不等概率的).(大群中的元素被抽中的概 率显然就小于被抽中的小的群中的元素了)l这一大一小,平衡了由于群的规模所带来的概率 差异.第五节 非概率抽样方法l非概率抽样是根据研究者的主观意愿、判断或是否方便 研究任务的要求和对调查对象的分析等因素,主观地、 有意识地在研究对象的总体中进行选择,抽取对象,它 不考虑抽样中的等概率原则,因此每个个体进入样本的 概率是未知的,而且由于排除不了调查者的主观影响, 因而无法说明样本是否重现了总体的结构,往往产生较 大的误差,难
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号