资源预览内容
第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
第9页 / 共10页
第10页 / 共10页
亲,该文档总共10页全部预览完了,如果喜欢就下载吧!
资源描述
SPSS多选题处理新方法总第期问题探讨摘要多选题数据编码和录入是多选题数据 处理的难点数据录入人员手工录入数据时通常直接采用二 分编码法或分类编码法录入多选题数据此方法不仅费时费 力还容易出错。本文主要介绍简单、快捷的多选题“原始编码 录入法”再通过软件自带的函数和函数将其转换为二分编码 或分类编码。关键词多选题二分编码分类编码编码转换当同 一个问题的选项可以同时允许多个值存在时我们称为之多 项选择题或称多重应答题。在市场调查等问卷设计时根据调 查目的合理设置多项选择题有助于确保调查信息准确性和 全面性同时也能够节约一定的成本。比如在关于品牌使用习 惯消费价值观等方面的调查问卷设计者更需要考虑调查对 象选择的灵活性和多样性在这种情况下设置多选题比设置 单选题往往更符合实际情况所获得的信息量也更多因而更 具有决策参考价值。然而在现实中由于多选题数据录入的复 杂性导致大数多调查者不愿意在问卷中设置多选题。综观目 前相关文献大部分将重点放在多选题如何分析和检验上而 对多选题数据处理的难点数据的录入和转换探讨不 够深入以下内容主要讨论多选题编码问题以及如何使用“原 始编码法”录入数据再探讨如何利用自带的函数轻松、快速和 准确地完成多选题的数据转换将其转换为二分编码或分类 编码。一、处理多选题数据时认可的编码方式对多选题数据 处理有一定的格式要求因此在数据录入之前我们应该了解多选题分析时要求的数据编码和排列格式。目前中认可的多 选题分析数据格式为二分编码或者分类变码。、多选题结果 的二分编码多选题二分编码法其原理就是将多选题的每个 选项都拆分成一个“是否”问题即二项迫选问题拆分出的二项 迫选问题数目是该多选题的选项数。问题您选择时考虑的主要因素是什么价格包装味道知名度流程程度其它。 假设甲选择了乙选择了使用二分编码法就相当于将问题变 成以下格式个二项迫选问题。假如采用或来记录每一个选项 被选中的情况“”表示被试该选项没有被选中“”表示该选项被 选中。这样我们在中需要设置六列即用六个变量来记录该多 选题每一选项被选择的状况我们在分别设如、六个 变量分别记录每一选项被选择的状况甲选择了我们就记 为、。在实际的操作中人们很少直接在中定义六个 变量来记录六个选项被选择状况。而是先在只设置一个变量 采用连续输入法记录每一个选项被选择状态。比如把六个变 量的值合并在一起被试甲此题在变量中录入的数据就变成 为。我们把这种按照“选项的顺序”分别用“”和“”来表示每一 选项的被选择状况的方法称为二分编码法。同理乙选择了那 么乙此题在变量录入的值为。设置一个变量来连续录入该多 选题每一选项被选择状态而不采六个变量来分别录入每一 选项的被选择的状态可以提高数据录入效率因为在某一变 量单元格内输入值后要转入下一个单元格进行新的输入必须按“回车键“而转入右边单元格进行新的输入要按“”键这样如果设置六个变量分别录入每一选项被选择状态就需 要按六次“”键。然而每一多选题只设置一个变量连续录入每 一选项被选择的状态那么仅这一题数据录入就可省略次 键。、多选题结果的分类编码多选题分类编码目的是该多选 题选项被选择时被试选项选择的顺序也具有分析价值这时 需把被试每一次选择都单独设置成变量进行分析这时选择 顺序成为了分类变量每个分类变量都有多个值作为回答者 的答案代码。这些分类变量反映了被试对问题的看法因此如 果继续采用二分编码法进行单个分析就会丢失调查目的所 需要的被试选择顺序信息。问题请按顺序依次选择出你买 时考虑的首要因素是和其次因素是双选题价格包 装味道知名度流程程度其它。文陶维东陶晓丽谢超香孙晓青 在中实现多选题数据录入、转换的新方法基金项目本课题受 西南大学国家重点学科重大项目批准号资助。您选择时考虑的主要因素是什么价格是否包装是否 味道是否知名度是否流行程度是否其它是否表多 选题数据录入时变量拆分示意表统计教育年第期假设甲选择了乙选择了对于二分编码来说这两 个答案数据录入都是一样的都是然而对于分类编码来说这 两者是不同的。每一个被试都选择有两个选项即两个答案。 我们分别为首要因素和其次因素分别设置一个变量和。在数据录入时通常的做法是将字母转换成数字录入如。那么甲此题数据录入是在 下录入在 下录入而乙此题数据录 入在下录入而在下录入。实际数据录入时基于二分编码 一个多选题选只设置一个变量同样的理由采用分类编码录 入多选题数据也是每一多选题只设置一个变量如录入这样 甲选择了那么在这个变量下输入而乙在这个变量下录入。、 多选题结果二分编码与分类编码的选用多选题二分编码与 分类编码都是多选题数据处理认可的方式对于调查者来说 在问卷录入时究竟选择何种编码方式录入数据与问卷调查 者问卷调查目的有关。以上例问题为例如果调查者仅仅想了 解该类商品六个属性每一种属性被选择的情况那么采用二 分编码法更简单些它可以很方便地分析出每一选项被选择 的比例。而对于问题如果继续采用二分编码法录入数据那么 就会丢失被试选项选择顺序的信息然而采用分类编码却可 以保留顺序信息。从信息量的角度来说分类编码获得的信息 量大于二分编码。如上例问题答案既包含选项被选择状况信 息也包含选项选择顺序信息所包含的信息量大于问题答案 所包含的信息量只包含选项被选择状况信息。对于问题来说 调查的目的只想知道六种属性被选择的状况采用二分编码 法来分析那么从信息保全的角度来说没有丢失任何信息也 达到了调查的目的。而对于问题调查者目的是不仅想知道六 种属性被选择的状况还想知道被试首要考虑的属性和其次 要考虑的属性那么在这种情况下只有采用分类编码法才保 留选项被选择的顺序信息。从经验的角度来说如果不是定项 选择且没有要求调查者对所选择的选项作顺序排列时采用 二分编码法分析数据更方便。二、多选题数据录入和“原始编 码录入法”以上所提到的两种多选题数据录入编码方式是目 前大部分问卷录入者手工录入多选题数据时常采用的办法。 然而为了提高工作的效率节省更多的时间和精力我们应该 探求更为灵活和方便的数据录入方式。数据录入的方法有多 种。如果调查问卷的数量达万份以上可以采用光电扫描的方 法进行数据录入但前提是被试要在专用答题卡上作答。如果 调查问卷的数量在千份以上建议调查者使用计算机程序语 言编制一个数据录入程序再进行手工录入被试选择的选项 这样可以大大减轻工作量而且还可以减少数据录入错误。这 两种录入方式都是将录入的数据通过计算机程序自动转化 为二分编码或分类编码。调查者只需要根据自己调查目的告 诉程序员采用何种编码方式来输出数据即是采用二分变量 编码还是采用分类法编码。如果调查的问卷数量在千份以下 编制问卷数据录入程序有点得不偿失在这种情况下问卷录 入者一般更愿意采用纯手工方式录入数据但是录入多选题 数据时不管是采用二分编码还是分类编码形式数据录入者 都必须时刻保持精力高度集中不断地在大脑中将选项原始 的编码转化为二分编码或分类编码再按键输入。这种方式不 仅速度慢、耗费精力而且还容易出错。方便、快捷、高效地 手工录入数据的原理是先采用最常用的数据编排格式录入 数据即每一个被试是一行数据问卷中每一个问题只设置一 个变量录入数据多选题也不例外以问卷中选项原来的编码 按照被试“选中的顺序”录入数据。如问题甲选中了就直接输 入。具体来说不管是在中还是在 中录入数据多选题录入数 据时每一题也只设置一个变量即一列如录入时先不考虑二 分编码或分类编码只是按照被试选中顺序录入选项的名如 或采用数字注意如果采用数字编码多选题的选项数应小于 如果大于可以考虑将以后的选项以字母代替或全部采用字 母编码输入。如果多选题中要求对选中的选项排序如等也一 定要按照被试写出的顺序录入数据这样的方法我们称之为 “原始编码录入方法”。 “原始编码录入法”最大的优点不仅在 于减少了数据录入时按键的数量节约了时间同时也避免了 数据录入者在数据录入时大脑人工编码转换减轻了脑力负 担让编码转换工作留给计算机来完成。比如对第十题的多选 题原来的题项都是字母编码如果录入时采用二分法编码数 据录入者在此题按键数量为编码数量如加按用于向右换单 元格次。然而采用“原始编码录入法”数据录入者在此题按键 的数量为被试此题选中的选项数量小于或等于如某被试选 中按键数量为加键用于向右换单元格的和那么此题数据录 入按键数量减少了次。这种方法不仅使数据录入者按键的次数大大减少更为重要的是在数据录入时录入者无须费时费 力进行编码转换看到被试选中就输入无须转化为。按照此种 数据录入方式完成整个数据录入后再利用自带的函数对所 录入的原始数据进行编码转换将其转换为二分编码或分类 编码使之符合多选题数据处理格式。三、多选题数据录入后 的转换、利用中的函数将其转换为二分编码在中实现将“原始 编码数据”转换成二分编码方式是利用菜单下命令来完成的即在命令对话框中调用函数。当用户点击菜单下的命令时将会弹出如图所示的对话框。如要将问题事处的结果转换为二分变量需要为每一个选项设置一个新的 变量以存放每个选项被选择状态。设置新变量方式是在 框 中输入新的变量名新变量的值是通过后面的栏中输入公式计算而来。比如在栏中输入变量来存放第一个选项被 选择的状态。再在中选择总第期问题探讨点击后在下选择函数再点击左边向上的按钮将函数输入中。将左侧的变量列表中的第题点选至函数的位置中再 在的位置输入。然而再在括号外插入“”插入方式是点击小 计算器面板中的“”再输入。再点击即可。具体操作见图第题 要特别注意这儿表示字符串的方式与其它程序不同认可的 字符串方式是单引号。、利用中的函数将其转化为分类编码 如前所述之所以采用分类编码分析多选题数据主要目的是 调查者不仅想知道此多选题每一选项被选择的状况也想知道被试先选了哪些选项其次选择了哪些选项等。即被试选项 选择的顺序具有分析价值。调查者规定此多选题被试选择几 项就设几个变量。如上例中的第题调查者规定选择两项那么 在数据转换时我们先在中设定两个变量和由于最初数据录入时是直接录入字母的而函数也是字符型函数其 返回值也是字符型所以在转换之前需要设两个字符型变量。 操作方式是点击左下角的在列分别输入和再点击该 变量名的第二列在出现变量名类型选择的对话框中选择 并点击。再点击左下角的回到数据窗口。具体转换方式同样是点击菜单下的命令在出现的 对话框中的栏中输入刚才设置的变量名 在 中选择 点击后在 下选择函数。再点击左边向上的按键将函数输入中。将左侧变量列表中第题点选至函数的位置中在的位 置输入在的位置输入即问题再点击即可。这样就取出了问题 被试第一个问题即首要因素所做选择的值。以同样的方法完 成问题其次因素被选择的状况在 框中输入 再在 中 输入问题再点即可。做完这步后我们还需要将这些字母转换 为数字因为进行多选题数据处理时接受的方式是数值型的。 点击菜单下中的 命令这时将弹出 对话框选择要进行 编码转换的变量如本题我们先选择 至栏中再点击 按钮将弹出对话框。通过设置这个对话框实现字母编本框中输入意思是将字母转换为。再点击按钮将其添加至 栏中。再依次将转换为转换至转换至转换至转换至。最后点 击 按钮回到对话框再点击。但是此处的数字格式依然 是字符型因为在定义这个变量时我们把这个变量类型设 置为字符型现在再次点击窗口左下角的 将变量设置成类型这时才真正将其转换成数字。的转换也是如 此。至此多选题的数据录入和转换工作已经完成。而多选题 的数据处理主要利用菜单下的命令来完成首先通过来定义变量集。将每个多选题的题项定义成变量集然后 再利用 中的 命令进行多选题的频数分析以及 命令 进行交叉表分析。如果是分类编码还可以利用菜单下中的 命令进行频数分析。如需要进行卡方检验 则对数据作适当的变换即可。参考文献王维山赵晓康化整为 零一种新的市场调查问卷设计思路统计教育丁立宏问卷设 计科学与艺术的结合市场
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号