资源预览内容
第1页 / 共78页
第2页 / 共78页
第3页 / 共78页
第4页 / 共78页
第5页 / 共78页
第6页 / 共78页
第7页 / 共78页
第8页 / 共78页
第9页 / 共78页
第10页 / 共78页
亲,该文档总共78页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第十章 Excel与SPSS在统计实务中的应用,一、学习目的与要求 二、学习重点与难点 三、本章内容 四、综合自测题(包括实训),内容介绍,学 习 目 的 与 要 求,本章重点讲述如何使学生能够掌握Excel和 SPSS软件的基本操作,并能够利用软件中的相关功能解决有关的统计问题。学习本章的要求: Excel在统计实务中的应用 SPSS在统计实务中的应用 两种软件在实际统计问题中的解决与应用,重 点 与 难 点,重 点 Excel在统计实务中的应用SPSS在统计实务中的应用难 点两种软件在实际统计问题中的解决与应用,第一节 Excel在统计实务中的应用,一、统计数据的整理,(一)制作频数分布表数值型数据均表现为数值,在数据整理时通常是进行数据分组,分作后再计算出各组中出现的次数或频数,形成一张频数分布表。以某电脑公司2002年前四个月各天的销售量数 据为例。(单位:台),电脑公司年前四个月冬天销售数据,首先对上面的数据进行排序,结果如下:,然后进行分组和编制频数分布表:,第一步:确定组数。 , 即应分为8组,考虑到本例中数据较多,我们可分为10组。第二步:确定各组的组距。组距=(最大值-最小值)组数,则组距=(237-141)10=9.6。为便于计算,组距取10。各组确定为:140150;150160;230240。,第三步:利用Excel制作频数分布表。,1、将120个原始数据输入到Excel工作表中的A1:A120单元格,Excel工作表原始数据输入,2、在B2:B11单元格输入每一组的上限值。(注意:用Excel制作频数分布表时,一个组的频数包括该组的上限值,因此,我们应输入149,159,239)。,3、选择“工具”下拉菜单,并选择“数据分析”选项(如果没有该选项,先在“工具”下拉菜单中选择“加载宏”命令,当出现对话框后,选择“分析工具库”选项,然后确定),在数据分析对话框中选择“直方图”命令。结果如下图所示:,当出现对话框时, 在“输入区域”方框内键入 A1:A120 在“接收区域”方框内键入 B2:B11 在“输出区域”方框内键入C2 选择“图表输出”,结果如下图所示:,选择“确定”后即得到频数分布表。我们对频数分布表进一步修饰后,结果如下表所示。,采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其它组中重复出现;“不漏”是指列出了所有的类别,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。,如果全部数据中的最大值和最小值与其它数据相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“以下”及“以上”这样的开口组。经过调整后如下表:,(二)数据的图示,1、直方图通过数据分组后形成的频数分布表,我们可以初步看出数据分布的一些特征和规律。如果用图形来表示这一分布的结果,会更形象、直观。显示分组数据频数分布特征的图形有直方图、折线图和曲线图等。这里主要介绍直方图的绘制方法。直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标中,我们用横轴表示数据分组,纵轴表示频数或频率,这样,各组与相应的频数就形成了一个矩形,即直方图。,根据上例中的数据利用Excel绘制直方图。,1、点击工具栏上的图表向导,打开图表向导对话框如图所示,按照提示一步一步操作。,2、选择柱形图,得到输出结果如图所示:,2、线图,如果数值型数据是在不同时间上取得的,即时间序列数据,可以绘制线图。线图是在平面坐标上用折线表现数量变化特征和规律的统计图。线图主要用于显示时间序列数据,以反映事物发展变化的规律和趋势。,以19911998年我国城乡居民家庭的人均收入为例,数据如下表所示。绘制线图。,根据上表利用Excel绘制线图,基本步骤同绘制直方图,只是在这选择折线图。,图表向导对话框 城乡居民家庭人均收入,二、用Excel进行统计分析,利用例10.1中的数据,说明利用Excel计算描述统计量的步骤。 先将120个原始数据输入到Excel工作表中的A1:A120单元格。然后按下列步骤操作: 第一步:选择“工具”下拉菜单,并选择“数据分析”选项。 第二步:在“数据分析”对话框中选择“描述统计”。结果如下图所示:,数据分析对话框,选择“确定”后,当出现对话框时:在“输入区域”方框内键入A1:A120在“输出区域”方框内键入C2选择“汇总统计” 结果如下图所示:,“描述统计”对话框,选择“确定”后即得到描述统计量输出表,如下图所示,描述统计量输出表,三、利用Excel进行回归分析,回归分析中的计算量较大,实际分析中,回归分析的计算可以依赖于计算机。除专门的统计软件外,为大多数人所熟悉的Excel也有部分的统计功能,这些功能基本上能满足一些简单的统计分析。下面我们研究生产费用与产量之间的关系,说明用Excel进行回归的具体步骤以及如何看懂Excel输出的回归分析结果。,首先,我们将生产费用和产量的数据输入到Excel工作表的A2:B13单元格。然后按下列步骤进行操作:第一步:选择“工具”下拉菜单第二步:选择“数据分析”选项第三步:在分析工具中选择“回归”,然后选择“确定”第四步:当对话框出现时在“Y值输入区域”方框内键入A2:A13在“X值输入区域”方框内键入B2:B13在“输出选项”中选择输出区域,选择新工作表组,结果如下图所示:,“回归分析”对话框,选择“确定”后得到下面的结果,如下图所示。,回归分析输出结果,Excel输出的回归结果包括三个部分:,第一部分是“回归统计”,该部分给出了回归分析中的一些常用统计量,包括相关系数、判定系、调整后的、标准误差、观测值的个数等。第二部分是“方差分析”,该部分给出了自由度、回归分析、残差、总计、回归和残差的均方、检验统计量、F检验的显著水平。“方差分析”的主要作用是对回归方差的显著性进行检验,该检验的目的是判断因变量y与自变量x是否存在线性关系。在给定显著水平下,Significance F=6.9221E-07,这说明生产费用与产量之间存在线性相关关系。,第三部分是参数估计的有关内容。包括回归方程的截距、斜率,截距和斜率的标准误差、用于检验的回归系数的t统计量、P值,以及截距和斜率的置信区间(下限95.0%和上限95.0%)等。在实际应用中,我们主要是看t检验的结果 。 对于回归系数Pvalue=0.000001,表明回归系数是显著的,这说明产量是影响生产费用的一个主要因素。 最后得到回归方程:,第二节SPSS在统计实务中的应用,一、SPSS软件的基础知识 (一)SPSS for Windows的启动与退出,1、启动SPSS for Windows,在启动SPSS for Windows以前,首先进入Windows操作环境,单击“开始”按钮,从“程序”菜单的子菜单中选择“SPSS for Windows“选项,如图所示。,SPSS 9.0 for Windows 的启动,启动SPSS for Windows后,出现无标题的“数据编辑器”窗口,如图所示。用户可在该窗口进行建立数据文件的一切工作。,数据编辑窗,2、退出SPSS for Windows,工作完毕后,用户可以使用“File“菜单中“Exit“菜单项退出SPSS。但是在退出SPSS之前,应该首先确认数据文件(或者运行过程中产生的统计图表等)是否已经保存。如果新建立的或者修改过的内容没有存盘,则系统将显示如图9-15所示的存盘提示框。用户可根据实际需要,进行人机对话。,存盘提示对话框,以随机抽测某中学30名15岁学生的身高和体重为例,数据见表,(二)数据文件的建立及存储,1、定义变量,“性别”为字符型变量,其他均为数值型变量。以“性别”为例,定义变量的步骤如下:(1)在打开数据编辑窗口(图9-14)后,单击Data菜单中的“Define Variable”项或单击该窗口(图9-14)下部的“Varible View”,就可打开定义变量的对话框(这种由主菜单直接打开的对话框称为一级对话框)如图所示。,定义变量的对话框(一级对话框),该对话框中左端纵列的1、2、3表示各个变量的编号,对话框的首行为“变量描述”栏,其中各项目属性的解释见下表。,“变量描述”栏各项目属性列表,(2)定义变量名。将光标移入定义变量对话框(图9-16)中第一行第一列的空格内,然后用键盘输入定义的变量名“sex”。 (3)定义变量类型与宽度。单击Type按钮,展开定义变量类型对话框(Define Variable Type),如图,定义变量类型的对话框(二级对话框1),在定义变量类型对话框左半部列有八种可选择的变量类型。最上面Numeric (标准数值型)、最下面String(字符型)是通常选用的两种变量类型。本例中“sex”为字符型变量,因此可用鼠标单击“String”前面的圆圈,该圆圈中增加一个黑点儿,表明当前选中的为“字符型”变量类型。由于我们考虑用m表示男性,用f表示女性,因此,其值的长度只需一个字节。但因变量名sex为三个字节,所以把“Width”后面的方框内数字改为3(因定义的是字符型,故“Decimal”显示为0)。,(4)定义变量标签。在一级对话框中,单击“Labels”按钮,展开定义标签(Define Labels)二级对话框,如图所示。在该对话框中可以定义变量标签,同时可以定义变量值标签。,定义标签的对话框(二级对话框2),在对话框中的第一行Variable后面的方框中有插入点光标在闪烁,说明等待你输入描述变量名的标签。设系统运行在汉字平台上,可以给出汉字标签,我们输入“性别”作为变量sex的标签。在对话框的下部有一个大方框,标有“Value Labels”,包含有三个较小的矩形框,用这三个矩形框定义值标签。这里我们定义的变量sex,值“m”表示“男性”,值“f”表示“女性”。先在第一个小框中输入“m”,再把插入点光标移至第二个小框中,输入“男”,按“Add”按钮,清单中显示m=“男”。然后,再在第一个小框中输入“f”,在第二个小框中输入“女”,再按“Add”按钮,清单中增加了一个值标签,显示f =“女”。至此,值标签定义完毕。按“Continue“按钮,确认定义的变量标签和值标签正确无误,并返回上一级对话框(图9-16)。至此,对数据项“性别”定义了变量名“sex”,并对其属性“Type”和“Label”作了定义。可模仿此例,对数据项“身高”和“体重”作出相应的变量名及其属性的定义,这样数据文件的框架结构已经完成。,2、录入数据,在定义变量对话框中单击下部的“Data View”,进入数据录入状态,如图。,定义变量对话框的数据录入状态,本例是按变量输入数据。把光标移到变量名“sex”列、对应观测量序号为“1”的单元格,并单击,使之成为当前操作单元格。按性别依次键入m或f,并回车,把30个学生的性别全部输入完毕。同样可对变量“身高”和“体重”的数据进行录入。要想修改某个数据或补漏某个数据,可以移动光标到二维数据表格中相应的单元格并单击,使之成为当前操作单元格,键人变量值,回车即可。,3、数据文件的存储,要将本例在数据窗中录入的身高和体重数据在A盘建立一个名为d1.say的数据文件,操作方法如下:(1)直接单击“保存”按钮,或者单击“File“菜单项,展开下拉菜单,选择“Save as”项,就可打开“Save Data as”对话框,如图所示。,数据文件另存为其它文件名或类型的对话框,(2)在对话框的“保存在”列表框中选定A驱动器,然后在“文件名”文本框中键入 “d1.say”。此文件名后缀必须为sav。(3)单击“保存”按钮,完成存盘工作。如果是一个旧的数据文件,在其上修改或追加了一些数据,并且不再想保留原来的数据文件,只想保留经修改或追加后的数据文件,此时可使用“File“菜单中的“Save”,用鼠标单击,或者单击“保存”按钮,便可将该文件保存。,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号