资源预览内容
第1页 / 共30页
第2页 / 共30页
第3页 / 共30页
第4页 / 共30页
第5页 / 共30页
第6页 / 共30页
第7页 / 共30页
第8页 / 共30页
第9页 / 共30页
第10页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第3章 问卷数据 的录入与清理统计数据分析基础教程 基于SPSS和Excel的调查数据分析第3章问卷数据的录入与清理第3章 问卷数据 的录入与清理本章内容3.1 问卷数据的录入 3.2 在Excel中录入数据 3.3 核对和清理数据 3.4 在Excel中核对数据 3.5 在SPSS中录入数据 3.6 在SPSS中核对数据 附录 Excel数据分析工具 附录 在Excel中生成随机数第3章 问卷数据 的录入与清理问卷数据的录入与清理l 进行数据统计分析之前,必须先 将问卷数据录入计算机。l 为了保证不“GIGO,Garbage In Garbage Out”(垃圾进垃圾出) ,在统计分析之前,需要对录入 的数据进行核对和清理。第3章 问卷数据 的录入与清理3.1 问卷数据的录入l 数据输入就是将问卷数据所对应的编 码通过扫描或用键盘输入计算机,建 立数据文件的过程。l 目前,数据输入的方式主要有三种: 人工输入计算机辅助系统转换光电输入第3章 问卷数据 的录入与清理3.1 问卷数据的录入(人工输入)l人工输入的注意事项: 要规规定统统一的输输入内容和输输入格式。 挑选选和培训训数据输输入人员员。 数据输输入过过程中需要注意: u第一,统统一规规定数据文件名。 u第二,数据输输入时时要为为每一个输输入人员员提供一份有关输输入 内容和格式的手册。 u第三,要为为每个输输入人员员提供足够够的空间摆间摆 放问问卷,避免 不同输输入人员员的问问卷或者同一输输入人员员已输输入和未输输入的 问问卷发发生混淆,造成漏输输或重复输输入,影响问问卷的质质量。 u第四,每个输输入人员员在完成各自负责负责 的问问卷的输输入任务务后 ,由研究者把他们们的数据合并成一个总总的数据文件,以供统统 计计分析使用。为为了避免数据丢丢失,要把每个输输入人员输员输 入的 数据单单独存档,以备查备查 找。第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(单选题)l 1确定取得单一答案l 2尽可能使用单选题l 3单选题如何编码和输入Q1.请问您现在是否拥有手机?1.有2.没有(跳至Q12题)例3-1 在Excel中录入单选题Q1的数据单选题的编码和输入(用文字当列名,图3-1)单选题的编码和输入(用题号当列名,图3-2)第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(单选题)l 例3-1 在Excel中录入单选题Q1的数据单选题的编码和输入(用文字当列名,图3-1 )单选题的编码和输入(用题号当列名,图3-2 )第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(多选题)l多选题分为多项限选题、多项排序题、多项任选题。Q2.请问您当初购买手机的原因是什么?(可多选,最多3项)1.方便与家人联络 2.方便与朋友同学联络 3.追求流行 4.工作需要 5.同学间比较的心理 6. 别人赠送 7.手机价格下降 8.厂商推出的促销方案 9.网内互打较便宜 10.其他 l例3-2 在Excel中录入多选题Q2的数据 l多选题的编码有2种:分类法和二分法。“分类法”编码和输入(图3-3)“二分法”编码和输入有关“分类法”和“二分法”编码,请参见P7274冻结窗格(比较图3-4和图3-5)第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(多选题)l 例3-2 在Excel中录入多选题Q2的数据 “分类法”编码和输入(图3-3)第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(多选题)l 例3-2 在Excel中录入多选题Q2的数据冻结窗格(比较图3-4和图3-5)第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(填空题)l填空题也称开放题,不提示任何答案,要求使用者直接填写。 l对数值型的数据,为了取得其真正的数字(如:55),而非只 取得区间(如:4160),会采用填空题的方式取得数据(定 量数据,数值型数据),例如:请问您平均每个月手机的话费约 元?定量数据可不经任何转换,即可计算各种统计量:均值、标准差 、最大值、最小值等,而且也可以直接进行均值比较与检验, 甚至可以作为回归分析的因变量或自变量。 l如果为了取得数据的方便,就设计成选择题(单选题): 请问您平均每个月手机的话费约多少钱? 1.20元及以下 2.2140元3.4160元 4.6180元5.81100元6.101元及以上l例3-3 在Excel中录入填空题的数据(图3-6)第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(填空题)l 例3-3 在Excel中录入填空题的数据(图3-6)第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(量表)l量表其实是一种顺序尺度(有序变量),只有大小先后的 关系,无倍数关系。l量表有多种编码方式,如P60的表3-2是量表常用的三种 编码方式。l例3-4 在Excel中录入量表的数据(图3-7)产品属性非常重要重要普通不重要非常不重要 (1)大小适中54321 (2)重量轻巧54321 (3)颜色炫丽54321 (4)外型大方54321 (5)符合人体工学54321 (6)附属功能多54321补充:输入数据时,对于 量表编码,要取得同向, 如P34的例2-26,反向题 要正向编码后再输入第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(量表)l 例3-4 在Excel中录入量表的数据(图3-7)第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(排名题)l 排名(多项排序)是一种衡量的方式。如:下列几种手机的入网方式,请问您认为哪一种的收费最便宜? 请依排名顺序,填入1、2、3、4、5: 全球通 神州行 如意通 动感地带 新时空 分l 此种类型的问卷,作为被排名的对象也不宜 太多。否则,受访者也无法排列好。排个5、 6项基本就是上限了。l 例3-5 在Excel中录入排名题的数据(图3-8 )l 可将排名题改为单选题第3章 问卷数据 的录入与清理3.2 在Excel中录入数据(排名题)l 例3-5 在Excel中录入排名题的数据(图3-8 )第3章 问卷数据 的录入与清理3.3 核对和清理数据l 数据有效范围的清理对数据中的奇异值进行清理。l 数据逻辑一致性的清理依据问卷中的问题相互之间所存在的某种 内在的逻辑联系,来检查前后数据之间的 合理性,主要针对的是相倚问题和多项限 选题。l 数据质量的抽查个案(个案(CaseCase):一份):一份 问卷的数据在计算机中问卷的数据在计算机中 的编码值,占一行的编码值,占一行第3章 问卷数据 的录入与清理3.4 在Excel中核对数据l 筛选出范围不合理的单列例3-6 在Excel中核对“大小适中”的数据l 用自动筛选找出不合理的关联题例3-7 在Excel中核对关联题“是否有手机 ”与“平均月费”的数据l 用高级筛选找出重复的记录例3-8 用Excel处理重复的记录第3章 问卷数据 的录入与清理3.4 在Excel中核对数据l 筛选出范围不合理的单列例3-6 在Excel中核对“大小适中”的数据第3章 问卷数据 的录入与清理3.4 在Excel中核对数据l 用自动筛选找出不合理的关联题例3-7 在Excel中核对关联题“是否有手机” 与“平均月费”的数据没有 手机 但有 手机 话费有手 机但 没有 手机 话费第3章 问卷数据 的录入与清理3.4 在Excel中核对数据l 用高级筛选找出重复的记录例3-8 用Excel处理重复的记录第3章 问卷数据 的录入与清理3.5 在SPSS中录入数据l手工建立数据文件 例3-9 在SPSS中,手工建立调查问卷的数据文件 1. 调查问卷(P6869) 2. 确定变量的个数 3. 在SPSS中定义变量 4. 单选题的变量定义 5. 多选题的变量定义:二分法和分类法 l从Excel获取数据文件 例3-10 将Excel中的数据导入到SPSS数据文件中方法一:先在SPSS中定义好变量,然后通过“复制粘贴 ”方式将数据从Excel复制到SPSS中。方法二:利用打开数据文件的方法直接把Excel中的数据 导入到SPSS中,然后再定义变量属性。第3章 问卷数据 的录入与清理3.5 在SPSS中录入数据l多选题的变量定义:二分法和分类法 二分法(Multiple Dichotomies Method):将每个 可能的答案设为一个变量,变量的取值最多有两个( 1和0),分别表示“选”或“不选”(在实际应用中,经 常只有一个取值1,表示“选”,而用空值表示“不选” )。这种方法的缺点是需要的变量个数比较多;优点 是比较简单。二分法常用于“不限选” 和 “限选不排名 ” 。 分类法(Multiple Category Method):分类法常用 于“限选”(很少用于“不限选”),包括“限选不排名” 和“限选排名” 。按照限选的最多答案设置变量个数, 每个变量的取值为选项值。比如,一个多选题,如果 最多可选3个答案,那就设置3个变量,分别用来存放 3个可能的答案。如果某受访者只填答两个,那么第3 个变量的取值为缺失值;如果某受访者只填答一个, 那么第2、3个变量的取值均为缺失值。分类法的优点 是需要的变量个数比较少。第3章 问卷数据 的录入与清理补充:限选不排序多选题的两种编码三种组合方式l以问题5(Q5)限选不排序多选题为例 方式1:二分法编码:P73的表3-5(4个变量,编码为1) 方式2:分类法编码:P73的表3-6(2个变量,编码为1、2、3、4 ) 补充方式3:变量个数采用二分法(4个变量),编码采用分类法 (1、2、3、4),具体如下: NameTypeLabelValues例子的取值值Q5_1N家庭就业业 人数增加1=家庭就业业人数增加,2=工资资 增加,3=奖奖金和津贴贴增加,4= 其他收入来源增加 Q5_2N工资资增加同上2Q5_3N奖奖金和津 贴贴增加同上 3Q5_4N其他收入 来源增加同上 建议:应用案例实验1,如果限选不排序多选题的选项超过了2 项(如:可多选,最多3项),建议采用方式3,这样的好处是 核对容易。请参见“补充:多选题两种编码和核对.xls”实际应用中 ,建议采用 方式2。 因为一般只 核对单列数 据有效范围 ,很少核对 逻辑一致性第3章 问卷数据 的录入与清理改错:P74的表39改为l由于采用“分类法”编码,所以在SPSS中的Values也应 该是分类法编码,而不是简单的“选”或空白。 l修改的目的:在用SPSS进行多选变量的频率分析时(具 体见第六章),SPSS的输出结果可读性好。Name 变变量名Type 类类 型Label 变变量名标标 签签Values 变变量值标签值标签例子的取值值Q7_1N银银行理财财1=银银行理财财,2=股票, 3=债债券, 4=股票型基金, 5=货币货币 基金,6=外汇汇,7=其他Q7_2N股票同上2Q7_3N债债券同上3Q7_4N股票型基金同上Q7_5N货币货币 基金同上Q7_6N外汇汇同上6Q7_7N其他同上第3章 问卷数据 的录入与清理3.5 在SPSS中录入数据l 从Excel获取数据文件 例3-10 将Excel中的数据导入到SPSS数据文件中方法一:先在SPSS中定义好变量,然后通过“复制 粘贴”方式将数据从Excel复制到SPSS中。方法二:利用打开数据文件的方法直接把Excel中的 数据导入到SPSS中,然后再定义变量属性。具体如 下:在SPSS中,单击菜单“File”-“Open”- “Data”,进入“Open File”对话框,在最下面的“ 文件类型”框中选择“E
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号