资源预览内容
第1页 / 共120页
第2页 / 共120页
第3页 / 共120页
第4页 / 共120页
第5页 / 共120页
第6页 / 共120页
第7页 / 共120页
第8页 / 共120页
第9页 / 共120页
第10页 / 共120页
亲,该文档总共120页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
SPSS的应用,主讲人:刘志华,统计处理在教育技术学研究中的作用,科学研究的计量化过程,经历过三个主要发展阶段,即从精确数学到随机数学,到现代的模糊数学。,- -,马克思指出:“一种科学只有在成功地运用数学时,才算达到了真正完善的地步”。,SPSS统计软件概述,SPSS是Statistics Package for Social Sciences(社会科学统计软件包)的缩写,它是社会科学研究人员首选的统计软件,也是目前世界上最流行的统计软件之一。因而被广泛应用于社会科学和自然科学的各个领域中。 SPSS统计软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据(如Dbase,Excel,Lotus等)。它的统计过程包括描述性统计、平均值比较、相关分析、回归分析、聚类分析、数据简化、生存分析、多重响应等几大类,每类中又下含同类多种统计过程,比如回归分析中又分线形回归分析、非线性回归分析、曲线估计等多个统计过程,而且每个过程中允许用户选择不同的方法及参数进行统计分析,因此除可以实现常规的各种统计外,还可用来做一些不常用的分析处理。,SPSS 统计软件的功能特点,SPSS的数据编辑功能 表格的生成和编辑 图形的生成和编辑 与其他软件的联接,SPSS的统计功能,样本数据的描述和预处理 假设检验(包括参数检验、非参数检验及其他检验) 方差分析(包括一般的方差分析和多元方差分析) 列联表 相关分析 对数线性分析 回归分析 聚类分析 判别分析 因子分析 可靠性分析 对应分析 时间序列分析 生灭分析,利用SPSS进行统计处理的基本过程,SPSS数据文件的建立,变量的定义 输入数据前要定义变量,包括定义变量名、变量类型、变量宽度、变量标签和变量格式。 打开定义变量的界面 输入变量名 确定变量类型 设置变量的其他属性,数据的输入 定义好变量后,单击“Variable View”选项卡旁的“Data View”选项卡,进入数据输入窗口,按照SPSS表格直接输入数据即可。 数据的简单计算 当输入完数据后,有时要根据已经存在的变量建立新变量,可以使用Compute来完成。,1选择“TransformCompute”命令, 弹出“Compute Variable”对话框,2在Target Variable框中输入新的目标变量名, 用来接收计算的值。,3利用Numeric Expression(计算关系板)下面的框中 输入计算新变量的数字表达式。方法如下: (1)在左侧选择原始变量名进入Numeric Expression (2)在Numeric Expression上选择数字或操作符,形成表达 式,如“编号=10” (3)在函数框中选择表达式需要的函数,使表达式出现在其 后括号中。 (4)单击“OK”按钮,生成新的变量。,保存数据文件,1单击主菜单中的File菜单,打开File菜单条。 2单击Save选项,弹出“Save Data As”对话框。 3输入文件名称,SPSS保存的文件类型为“*.sav”,单击“保存”按钮。,数据与统计结果的输出,利用SPSS进行统计描述,统计描述方法,是研究简缩数据并描述这些数据的统计方法。将搜集来的大量数据资料,加以整理、归纳和分组,简缩成易于处理和便于理解的形式,并计算所得数据的各种统计量,如平均数、标准差、以及描述有关事物或现象的分布情况、波动范围和相关程度等,以揭示其特点和规律。,(一)数据资料的整理和表示,1数据检查 主要检查数据的完整性与正确性。统计资料完整性的检查,就是要根据调查项目检查是否填写齐全,避免遗漏,删去重复。正确性检查,就是检查搜集的资料是否真实可靠。特别是统计数字的真实性是统计工作的生命,统计资料的检查整理必须抓紧这一环。 数据检查可分为逻辑检查和计算检查两种方法。逻辑检查,是从理论和一般常识上来检查资料内容是否合理,指标之间是否矛盾。计算检查是检查统计数字在计算方法和计算结果上有否错误。,2数据分类,数据分类就是把搜集来的数据进行分组归类。数据分类要做到既不重复、不遗漏,又不混淆,一般又可分为品质分类和数量分类。 品质分类:是按事物性质划分为不同的组别、种类。如以性别为标志可分为男与女;按“理解能力”、“学习态度”等为标志,又可分为好、较好、一般、差等几种水平,每种水平可看成类,每一类可给以相当的数量。可以通过各类所包含的数据再进行数量化的比较和分析。 数量分类:是按数量的属性分类。有顺序排列法、等级排列法和次数分布法等。, 数据的排序,数据排序:将各数据从大到小或从小到大进行排列。这样就可以看出最高分和最低分是多少,各分数出现的次数和位于中间的是什么数等。包括等级排列和次数排序。 等级排列:即根据顺序排列划分等级。但与顺序排列不同,它是按数值所含的意义确定的。若是学习成绩,应以数值大的排为第一等级;若是反映时间,则将最小的数值排为第一等级。 次数排序:即根据在指定的数值范围内,数据出现的频数大小排序。, 数据统计表,就是把所研究的教育技术现象和过程的数字资料,以简明的表格形式表现出来。它可以避免文字的冗长叙述,便于比较各项目之间的相互关系,便于总计、平均和其他统计值的计算,便于检查计算错误和项目遗漏。, 数据的图示法,数据的图示法是利用几何图形或其他图形等的描绘,把所研究对象的特征、内部结构、相互关系和对比情况等方面的数据资料,绘制成整齐简明的图形。它是用以说明研究对象和过程的量与量之间对比关系的一种方法。它能准确地表现统计资料,有助于对统计资料进行比较、对照、分析和研究。图示法,具有直观、形象,便于记忆和思考以及表达语言难以说清的内容之优点。,(二)特征参数的计算,为了分析研究对象总体的特征,不必对总体中每一个单位都进行研究。而是通过抽样方法,按照随机性原则,从全部对象中,只抽取部分单位(样本组)加以研究,对于每组样本,首先应对其基本特征参数进行计算,以给出整体特征的统计描述。并根据统计数据,对总体对象作出具有一定可靠程度的估计和推测。常用的特征参数包括:, 集中量数,(1)算术平均数,用 表示,设 为各次观察的结果,则有: 上式中, 表示平均分 表示每个学生的得分,n表示学生人数。,(2)中数,是指一组按大小顺序排列起来的 量数中的中间点的数,又称中位数,用Mdn来表示。 (3)众数,是指一列数中出现次数最多的数值, 常用M表示。,2差异量数,差异量数是表示量数之间的差异程度的一些统计量的总称,它是用以表示一群量数的离散情况或离中趋势。 在统计分析中经常应用的是标准差,它是与平均数的差数的平方和的平均数的算术平方根。,3标准分数,标准分数,又称Z分数。是以标准差为单位表示一个分数在团体分数中所处的位置。,(三)次数分布,次数分布又称次数分配。是指总体或样本按随机变量(数据)大小次序在出现频率上的排列。 一般采用次数分布表、次数分布直方图或次数分布曲线来表示。,【例6-1】 现有50名学生的成绩,原始数据如表6-1所示:(n=50),1次数分布表,为了显示该组样本在不同分数段中的次数分布情况,我们对该数组进行次数分布统计,编制出该数组的次数分布表。方法如下: (1)求全距:最大数最小数=9851=47 (2)定组数,一般1020组为宜。 (3)定组距,组距=(全距+1)/组数=(47+1)/10=4.7(取5) (4)定组限,95-100,90-95,85-90等 (5)求组中值:组中值=(上限+下限)/2,如95-100一组, 其组中值=(100+95)/2=97.5,(6)归类 把原始数据,分别归到相关组中,得出次数 分布表如表6-2所示:,2次数分布曲线,根据这个次数分布表,可绘出对应的次数分布直方图、次数分布曲线和积累次数曲线,分别如图6-8、图6-9和图6-10所示。为了分析次数分布曲线的特征,我们可以把它与正态分布曲线相比较来进行研究。,3. 正态分布曲线,正态分布是一种理论分布,在次数分布中,中间的次数多,由中间往两边的次数逐渐减少,且两边的次数多少是相等的。根据正态分布绘成的曲线称为正态分布曲线,正态分布曲线形状如钟形,它的特点是中间成一高峰,由高峰向两侧逐渐下降,先向内弯,后向外弯,降低的速度是先慢后快,以后又再次减慢,最后达到接近底线,但永远不与底线相接,形成一个单峰的对称的钟形形态,如图6-11所示。,在正态分布曲线图上,正态曲线以下,以S为距离单位 所包括的面积是按一定比例分配的,若将正态曲线底边 从-3S到3S分成四等分,每等分距离为1.5S,则每距离 间隔之间所包括的面积比例如表6-3和图6-12所示。,利用正态分布曲线这些性质,我们可以得到划分不同学习 水平等级的界限和学生人数比例的理论数值。 例如对于常态 =75,S=10的情况,其优、良、中、差各 等级的分数范围和人数比例应如表6-4所示(N30)。,按照上述方法,对于一个给定的样本组得知其平均分 =83, 标准差S=7.78,我们便可以得到学习水平等级的划分界线, 并将人数比例的理论数和实际数相比较,如表6-5所示。,二、平面特征数据分析模型,三、利用SPSS进行统计特征分析,操作步骤:, 录入数据 录入数据的过程分为两个步骤,一是定义变量,二是录入变量值。 1)定义变量:“学号”、“组别”与“成绩”。 2)录入变量值:在数据编辑窗口中,按照表1的内容,将各变量值一一录入。录入后的部分界面如图6-14所示。, 数据的等级排序 (1)选择“DataSort Cases”命令,弹出“Sort Cases”对话框,把“成绩” 变量选入“Sort by”中,并在Sort Order中选择“Descending(降序)”选项, 将学生成绩按降序排列,如图6-15所示,单击“OK”按钮。,(2)排序结果 排序结果在数据编辑窗口可以即时浏览,如图6-16所示, 并可以通过选择“FilePrint”命令,将结果打印输出。, 平均分与标准差的计算 (1)计算总平均分与标准差 选择“AnalyzeDescripitive StatisticDescripitives” 命令,弹出“Descripitive”对话框,从左侧将“成绩”变量选入 “Variables”栏中,如图6-17所示。 单击“OK”按钮,提交运行,输出结果如表6-8所示。,(2)分别计算两组学生的平均分和标准差 由于录入数据时两组数据是混合一列,所以在统计之前 要将两组学生的数据拆分,在进行统计处理。 数据拆分 选择“DataSplit File”命令,弹出“Split File”对话框, 激活“Organize by group”选项,从左侧选择“性别”变量进入 “Groups Based on”栏目,最后激活“Sort the file by grouping variables”选项,如图6-18所示。单击“OK”按钮。, 与计算总平均分与标准差相同,选择“Analyze Descripitive StatisticDescripitives”命令, 弹出“Descripitive”对话框,从左侧将“成绩”变量选 入“Variables”栏中。如图6-17所示。 单击“OK”按钮,提交运行,输出结果如表6-9所示。, 统计特征分析 根据SPSS的统计处理所得结果如表6-10所示。,四、次数分布表的形成,【例6-4】 根据表6-1中给出的50名学生的学习成绩, 计算60分以下,60-70,70-80,80-90,90分以上的 次数分布表。 操作步骤: 1录入数据 定义变量“学号”和“成绩”,并按表3内容输入数据 2转换数据,生成新变量 (1)选择“TransformRecodeInto Different Varibles”命令,弹出“Recode into Different Variables” 对话框,将“成绩”选入“Numeric Variable”框中,并在 “Output Va
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号