资源预览内容
第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
第9页 / 共25页
第10页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第一讲:SPSS数据预处理操作教学目的:能应用SPSS软件进行:数据文件的建立、数据录入与修改、变量计算及转换教学内容:1)SPSS概述 2)SPSS数据文件的建立 3)SPSS数据整理与转换教学重点:SPSS数据文件的建立教学难点:SPSS数据转换教学时间:1学时SPSS概述1.1 SPSS简介SPSS 是英文Statistical Package for the Social Science(社会科学统计软件包)的缩写。SPSS 名为社会科学统计软件包,这是为了强调其在社会科学应用的一面(因为社会科学研究中的许多现象都是随机的,要使用统计学来进行研究),而实际上广泛应用于经济学、社会学、生物学、教育学、心理学、医学以及体育、工业、农业、林业、商业和金融等各个领域。SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。1.2 SPSS的运行环境硬件环境:能运行Windows 95/NT/2000 或以上版本的微机。软件环境:SPSS 能在中英文Windows 9X、Windows NT 4.0、Windows2000 及更高版本的Windows 操作系统上运行。1.3 SPSS的进入和退出 进入Windows后,逐一选取开始程序SPSS for WindowsSPSS 11.0 for Windows,单击SPSS 11.0 for Windows后,即可进入SPSS。首先是一个对话框如图1.1,显示最近打开的数据文件、结果文件和程序命令文件。可选取你要打开的文件,按OK按钮打开。如不喜欢这个对话框,可选取对话框下方的Dont show this dialog in the future选项则以后不会再显示。要退出SPSS,在任一SPSS窗口下逐一选取FileExit,或在SPSS Data Editor窗口单击右上角关闭按钮。若生成了新文件或对以前文件进行了修改,退出前会提醒你对其进行保存。 1.4 SPSS窗口及其功能 SPSS有数据编辑窗口SPSS Data Editor、结果窗口SPSS Viewer和语句窗口Syntax。这里只介绍数据编辑窗口和结果窗口。1.4.1 数据编辑窗口 启动SPSS后,首先进入数据编辑窗口SPSS Data Editor,如图1.2的Data View窗口,可在此窗口下录入数据、修改数据等。2图1.2 Data View窗口点击下方Variable View按钮可进入变量定义窗口,如图1.3。在此窗口下可定义、修改变量或察看变量的设置情况。在下图中可看到变量的名字(Name)、宽度(Width)、类型(Type)、小数位数(Decimals)、标签(Label)等。SPSS的几个窗口菜单大致相同其中的命令也基本相同。菜单下的工具按钮均为常用的命令。将鼠标移至按钮附近,则弹出该按钮的解释,以后就不再说明。下面将简介,各命令的具体作用请参考实验指导教材。 File菜单中常用的命令为New(创建新文件)、Open(打开已有文件)、Save(保存)、Save As(另存为)、Close(关闭窗口, SPSS Data Editor窗口下无此命令,该窗口关闭则退出SPSS)、 Recently used Data(最近打开的数据)、Recently used Files(最近打开的文件)、Exit(退出)等。图1.3 Variable View窗口Edit菜单下的常用命令有Undo(撤销上次操作)、Redo(重复上次操作)、Cut(剪切)、Copy(复制)、Paste(粘贴)、Clear(清除)、Find(查找)、Options(选项)、Options(可对SPSS的一些设置进行调整)等。View菜单中的命令可对窗口的设置进行调整,有Status Bar,Tool Bars,Fonts,Grid lines,Value Labels。Data菜单中是数据进行编辑整理的命令,包括Define Dates,Insert Variable,Insert Case,Go to Case,Sort Cases,Transpose,Merge Files,Aggregate等Transform中命令有:Compute;Random Number Seed;Count;Recode;Categorize Variable;等Utilities 菜单中命令有:Variables;File Info;Define Sets;Use Sets;Run Script;Menu Editor;Analyze;Graph等菜单下的工具按钮均为常用的命令。将鼠标移至按钮附近,则弹出该按钮的解释,在此不再一一说明。1.4.2 结果窗口 该窗口中显示SPSS处理的输出信息。如处理成功,则显示处理结果;如处理失败,则显示错误信息。结果窗口可分为左右两个窗口。左窗口为大纲窗口,其内容即结果的目录;右窗口为内容窗口,显示具体结果。如点击大纲窗口的项目,则内容窗口会显示相应内容,与资源管理器操作类似,如图1.4。SPSS结果一般由以下几个部分组成:题头(Heading,即处理的名称)、标题(Title)、记录(Notes,包括数据文件名、缺失值处理、操作所用时间等,默认选项为隐藏,只有双击大纲窗口中该项目才显示出来)、结果具体内容(文本、图形等)。单击题头(对准题头左边黄色的盒状图标),则可选中上述的整个处理的结果;双击题头时,可使整个结果折叠或打开。单击题头前的“+”或“”符号,也可达到同样效果。双击大纲窗口中某个项目,则可使相应内容隐藏或显示,同时大纲窗口中该项目名称前图标由一本打开的书变为合上的书或相反。如要改变结果中表格或图形的位置,可在大纲窗口或结果窗口单击该项目,将它拖到指定位置即可。在此窗口中还可对结果进行编辑如选择删除复制等。该窗口菜单同数据编辑窗口类似,新增加项目如图所示:File;Edit;View等SPSS数据文件的建立如上一章所述,建立SPSS数据文件有两种方法:一是在SPSS中直接输入,二是从其他数据文件转入。重点介绍第一种方法,它类似于在FOXPRO建立数据库。首先,在SPSS Variable View窗口中建立数据文件结构,如定义变量类型、宽度、标签等;然后在SPSS Data View窗口输入数据,并保存为“.sav”格式的SPSS数据文件。通常情况下,调查问卷的数据文件建立与录入都是采用第一种方法。在问卷数据录入前,还必须对问卷选项进行编码。2.1 问卷设计及数据编码2.1.1 问卷一份调查问卷的结果通常表现为文字型和数字型两大类,其中文字型包括二项选择问题、多项选择问题、排序问题、开放式问题、连线问题等调查结果,而数字型包括百分比、绝对数等。对于数字型,可直接录入数据;而文字型则需要进行事前或事后编码,且不同类型的调查结果有不同的编码表现。此外,无论是数字型还是文字型,都有可能碰到调查数据缺省或不应该有的情况。这同样需要事先编码。下面将以为了解大学生购书情况进行调查而获得的一份问卷为例,介绍几种常见问卷数据编码。2.1.2 数据编码1、单项选择题的编码由于单项选择题的答案是唯一的,所以对各答案依次编码为1、2、3.。如问卷中的第1题有四个答案,可依次编码“1”代表答案“300元以下”,“2” 代表答案“300500元”,“3” 代表答案“500700元”,“4” 代表答案“700元以上”。于是,被访问者选择的任何答案都可以用1,或2,或3,或4来表示。2、多项选择题的编码问卷中的第5题是多项选择题,共有6个答案项。编码时,可将6个答案看作6个变量,用“1”表示选择了该项答案,用“0”表示没有选择该项答案。若第5题答案顺序是从左到右、一行一行的排列,则012号问卷结果的编码是“0 0 1 1 1 0”。此外,该题的第6个答案项没有唯一的表现,应该视为开放性问题的编码(详细解释见后面)。3、排序题的编码对于排序题的编码,其处理方法是:将每个序位当作一个变量,而需要排序的那些选项作为每个变量的取值。如问卷中第3题有六个选项要排序,将“购书时考虑的第一因素”作为第一个变量,记为“Q301”;其取值可为“内容”、“价格”、“包装”“实用性”、“知名作家的作品”、“热门畅销书”中的任何一个,可分别编码为“1”、“2”、“3”、“4”、“5”、“6”。同理,可将“购书时考虑的第二因素”、“购书时考虑的第三因素”等依次作为第二、第三变量等,记为“Q302”、“Q303”等;而每个变量的取值都与Q301相同,同样也编码为1、2、3、4、5、6。于是,012问卷第3题排序结果可转化为6个变量的取值依次为:2,4,1,5,6,3。4、开放式问题的编码对于开放式问题,如第5题的“其他”选项,第7、8、9题,有的答案是数字型,可直接录入,但有的答案则需要归类编码。其中第5题的“其他”选项和第7题的第一个空,由于事先不知道有多少类答案,需事后抽查部分调查问卷结果统计后才能初步确定与编码。这就是“事后编码”,它类似于二项选择问题的编码。至于第9题的“性别”、“专业”、“年级”等问题的所有可能答案,在事先都容易确定,可以直接编码录入数据。这就是“事前编码”,如“性别”有两个选项男或女,可用“1”表示“男”,“0”表示“女”,也类似于二项选择问题的编码。问卷编号:0121.您的月收入大概有多少? 300元以下 300500元 500700元 700元以上2.您购书的主要目的是: 学习、考试需要 了解时尚、热点 休闲娱乐 个人爱好及收藏 3.您购书时主要考虑的因素依次是: (请在选项前横线上标出序号) 3 内 容 1 价 格 6 包 装 2 实用性 4 知名作家的作品 5 热门畅销书4.您较能接受的书的价格为: 20元以下 2050元 50元以上 需要,则无所谓5.您购书的地点一般是:(可多选) 新华书店 校内书店 学校附近书摊 菜园坝书刊市场 商家在校园内的图书展销 其他 跳蚤市场 6.您对商家来校园内进行图书展销的看法是: 既方便又实惠,很好 无所谓,视其内容、价格而定 没兴趣,宁愿到正规书店购买7.您最近一次购书的时间是 两个月前 ;花费为 5.60 元; 8.您平均每个月的购书支出占月收入的比例为 2% ;9.您的性别 女 ,专业
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号