资源预览内容
第1页 / 共63页
第2页 / 共63页
第3页 / 共63页
第4页 / 共63页
第5页 / 共63页
第6页 / 共63页
第7页 / 共63页
第8页 / 共63页
第9页 / 共63页
第10页 / 共63页
亲,该文档总共63页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
抽样设计 Sampling Design,抽样设计的意义,解决总体研究难以进行的困难 节省人力、时间、费用 提高研究结果的准确性和研究深度 有利于减少研究“污染”范围 减少损耗,保护总体 抽样设计的好坏直接影响到研究的效度 抽样设计的基本原则随机性原则,目 录,1 随机样本的概念 2 抽样设计的原则 3 分层随机抽样 4 整群抽样 5 有序抽样 6 样本规模的确定 7 有目的抽样 8 取样实例 9 练习,一、随机样本的概念,总体(population)是研究者感兴趣的研究对象的总合。 样本(sample)是总体的子集。是从总体选取的有限数目的成分或元素,用以代表总体。 研究中以样本为基础,通过统计推断,作出有关总体的结论。,样本,一、随机样本的概念,随机样本也称概率样本,总体成员被选入样本的概率都不为零。在简单随机样本中,总体各成员被选中的概率相等。 取样的置换性 非置换随机取样 随机样本是一个无偏样本。即,由于随机变化的原因,样本中的个体成员是变动的。 样本的代表性 必须明确规定所研究总体的基本特征,当样本相似于总体特征的特点时,就认为获得了“代表性样本”。,随机选择和随机分布,随机选择和随机分布不完全同义,它们都用于获得样本的代表性和消除可能的偏差。 当个体被随机选择为总体的代表时,就用到随机选择概念; 随机分布的概念通常用在实验中,总体中的成员被随机分配到不同的小组或不同的处理中,他们可以是、也可以不是直接从一个较大总体中选择出来参与实验的。/,随机选择的实例,一所大学内的研究机构从容量为6821名新生的总体中随机抽取了250人组成了一个随机样本,用来进行一项关于大学生生活态度的调查。这就是随机选择,250名样本成员就代表了6821名新生。 如果我们把调查结果推论到6821名新生中去,这是一种完全真实的、有统计依据的推论。/,随机分布的实例,一位心理学者为大学2年级学生开设的心理学课有90名学生注册。他用3种不同的材料进行一项学习实验。90名学生全部参加。每30名学生被随机分配在一个组接受一种处理。用随机分布的方式分配到不同处理中去的30名学生不是确定的。每个学生都有可能被分配到任何一组中去接受实验。/,随机分布的实例,这90个学生代表什么总体?他们不是从一个较大容量的总体中随机选择出来的。他们参加实验的理由是他们注册选修了心理学课程。在这种情况下,心理学者有时候可能认为这90名学生可以代表整个大学生总体,有时候可能认为不能。如果这所大学的2年级学生与其他大学的2年级学生特别相似,此实验结果就可以推广到其他大学的2年级学生总体中去。但推论到整体青年人总体是不恰当的。这种推论是一种逻辑上的讨论。,简单随机抽样的方法,使用随机数字表 53981 02015 32111 97250 05664 95068 88628 35911 14530 33020 54463 47237 73800 91017 36239 71824 83671 39892 60518 37092 抽签或抓阄,抽样误差与抽样偏差,当随机样本被用来代表总体时,样本统计值与总体参数之间的差叫做抽样误差(sampling error),它是一个变动量。 例如,从1675名5年级学生中随机抽取150名作为样本,如果样本的数学考试平均分是86.3,总体的平均分不一定是86.3,但大约是86.3。 随着样本容量的加大,因随机波动导致的变动量会减小,抽样误差也减小。,抽样误差的计算, x = 样本平均数的平均数等于总体的平均数 Qx = Q/sqrt (n) 样本平均数的标准误与总体的标准差成正比,与样本容量的平方根成反比 Sx = S/sqrt (n) 样本平均数的标准误就是抽样误差的大小,抽样误差与抽样偏差,抽样偏差(sampling bias)是由于选择样本的方式不恰当而造成的错误,它使样本对总体来说不具代表性。 例如,前述的1675名学生是来自5所小学,如果我们从每个小学选择一个高能力班,每班30人,这150名学生的数学考试平均分为98分,这个分数显然不能代表总体,因为发生了抽样偏差。 在问卷调查中,被调查者无应答也可能造成抽样偏差,尽管最初的样本是随机选择的。回答者对回答与不回答的选择造成了一个有偏差的样本。/,抽样偏差的实例,1936年罗伯和克莱斯利曾进行一项民意测验,该测验结果预示阿尔夫兰登将在总统竞选中获得比富兰克林罗斯福多15%的选票。抽样是随机的,但样本却主要从电话簿和汽车登记册中选择的。这是一个抽样偏差的典型例子。同年,盖洛普根据选民的收入按比例取样并加权校正,预测罗斯福获胜。,二、抽样设计的原则,为什么研究人员放着简单随机抽样不用,而要进行复杂的抽样设计呢?主要原因有: 1 总体容量太大; 2 总体的组成是多样化的,简单随机难以兼顾; 3 所研究的总体可能是非常特殊的人群,不可能进行简单随机取样; 4 在实际抽样当中遇到的困难。 因此,研究者通常要在抽样前进行抽样设计。,好的抽样设计的标准,1 目标明确 2 可测性 3 可行性 4 经济性,1 目标的明确性原则,目标明确性原则指对抽样方法进行设计时要以研究方案和研究目标为依据。 以研究的问题为出发点,为了获取数据和进行预分析,应该在抽样之前进行必要的测量。 样本是为研究目的服务的:要考察的总体是什么?要考察哪些变量?要考察变量的什么关系?要做什么推论?等等/,2 可测性原则,抽样设计要为必要的分析提供数据。如果一个抽样设计具有可测性,那就可以做出对推论统计非常有用的样本变量的有效估计。 可测性使研究者能从样本数据有效地推断出总体特征。 从操作上来说,可测性就是从样本获得的数据是容易进行必要的描述和推论统计的。 /,3 可行性原则,可行性原则指应用某一抽样设计的实际活动在现实情境中是行得通的。为此,在进行抽样设计时应该考虑到可能遇到的问题和困难,以及解决这些问题和困难的方法。 我能否找到我想找的那些人?当我找到他们时,他们会配合我的调查吗?他们能够回答我的问题吗?,4 经济性原则,研究活动应和可得资源相吻合。资源包括人员、财力、时间等。 数据的获得是以时间和金钱为代价的,所以抽样应避免造成浪费。/,三、分层随机抽样,1 抽样比率:样本容量与总体容量的比值,表示为n/N 例如,从容量为2000的总体中抽取容量为300的样本,其抽样比率为300/2000, 即0.15。 对简单随机样本来说,抽样比率等于总体中每个成员被选入样本的概率。 /,三、分层随机抽样,2 分层随机抽样:有时候,要抽样的总体是不同质的,是由若干个子总体组成的。这时,我们可以把一个母总体分为两个或更多的子总体,或称作“层”,再从每层中抽样。这种抽样方法叫做分层随机抽样。,三、分层随机抽样,3 层中样本大小的分配 按比例分配法:若一个母总体N被分成K层子总体,各层总体的大小分别是N1, N2, Nk, 各层样本的容量分别为n1, n2, nk,那么, n/N=n1/N1=n2/N2=nk/Nk 其中,N1+N2+Nk=N n1+n2+nk=n 抽样比率是 n/N /,三、分层随机抽样,例题:一项关于大学设施完备程度的调查,大学有7个学院,注册学生15823人,用分层随机法抽样,每个学院为一层,假设抽样比率为0.05, 层 层的总体 各层的样本 文理学院 5461 273 商管学院 1850 93 社区服务学院 2092 105 教育学院 3508 175 工程学院 2112 106 法学院 318 16 药学院 482 24 总计 15823 792,韦氏量表编制中的取样过程,韦氏量表首版于1949年,1970年代初修订,采取分层随机取样原则,考虑到年龄、性别、种族、地理区域、家长职业、城乡六个分层变量。对这6个变量考虑得非常仔细严密。 样本共取6.5岁到16.5岁的2200名儿童为样本。每个年龄组各取男女儿童100名。儿童必须是正常的,凡在低智能机构中受教育的或有情绪障碍的一律不要。每个家庭只能有一个孩子被选中。,修订韦氏量表时考虑的分层变量,地域:东北、北中部、西部、南部 种族:白种人、非白种人、黑人、印第安人、东方人(以1970年美国人口普查为基础) 父母职业: (1)从事专业技术的人员;(2)管理人员、政府公务员、业主、办事员、售货员;(3)手艺人、工头、领班;(4)操作人员、服务人员(包括私人管家)、农民及农场管理人员;(5)劳工、农场工人、农场领班。然后,根据美国18岁以下儿童生活在这5类职业家庭中的分布情况确定每类家庭的取样比例。,城乡:居住2500户居民以上的为城市,以下的为农村。 施测时间为1971年12月到1973年1月。 被试的受测年龄以他所在的年龄中间值的前后6个星期之内为限。如9.5岁组的被试在受测时必须在9岁4个月15天到9岁7个月15天之间。 由此建立的常模在美国具有相当好的代表性,可以应用到全国各地相似条件下的儿童智力测验工作中去。,与韦氏量表的严格取样程序相比,我们很多研究人员在实际工作中,不遵循分层次、按比例随机抽样原则,例如,从全市抽取15所学校,参加某项调查,有的研究者因缺乏经验,就按照好、中、差的标准把所有学校分成三个层次,然后各取三分之一。但是,好、中、差三种类型的学校在总体中确实是各占三分之一吗?,四、整群抽样,整群抽样是一种以群体为单位选择样本的方法。 当简单随机抽样不切实际或花费太高时,就可以考虑采用整群抽样法。 两个或两个以上的人组成的群体叫做“群”。 整群抽样与分层随机抽样的区别:整群抽样的样本单位是“群”,而分层随机抽样的样本单位是个体。当一个群被选为样本时,群内的所有个体就全被包括在样本中。分层抽样中,每一层的成员能否进入样本是随机的。 /,整群抽样举例,某项调查要考察某市33所小学4年级学生的标准化数学测验成绩,对全体学生进行测验成本太高,选择一个简单随机样本并施测的工作太烦杂。因此决定整群抽样。33所小学共83个4年级班级每班平均有27.3个学生。预想样本规模约550人。 决定从83个班中抽取20个班,最后参加测验的学生为561人。,五、有序抽样(系统随机抽样),当总体容量很大、并已得到按某种顺序(如汉语拼音、笔划等)整理好的名册时,即可采取有序抽样法。其优点是简便易行。具体做法是:当样本的第一个个体被随机选定后,其他个体就可按一定规律抽出。如果抽样比率为1/k,就从名册中抽出所有k序列的个体。如隔5抽1。 这种抽样可能因周期性问题的出现而导致一个偏差样本。 /,有序抽样造成的系统误差举例,以某市一个区为总体抽取5年级学生的一个样本,对其进行能力测试,以估计全区所有5年级学生的能力水平。研究者决定抽样比率为1/30,而且发现用各班学生的名册很方便,因为每班学生的人数大约都是30。研究人员向各学校索要了5年级各班学生的名册,但不是按姓氏笔划或拼音排列的名册,而是以最近一次考试成绩排列的名册。然后把所有学生顺次排列起来。如果样本的第一个个体选择第一个班的第三名,则意味着第33、63、93名学生被选入样本。这和第9、39、69、99名学生入选的结果差别将相当大。,六、样本规模的确定,在调查研究中,确定样本大小的影响因素很多,除了研究成本,其他的因素常常很难确定,这就使样本容量的确定非常困难。 根据统计原理,样本越大,则统计误差越小。经验证明,10%的抽样比率对于一个2000以上的总体来说就
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号