资源预览内容
第1页 / 共88页
第2页 / 共88页
第3页 / 共88页
第4页 / 共88页
第5页 / 共88页
第6页 / 共88页
第7页 / 共88页
第8页 / 共88页
第9页 / 共88页
第10页 / 共88页
亲,该文档总共88页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第一章 SAS基础,1.1 初识SAS 1.2 初识INSIGHT模块 1.3 初识“分析家” 1.4 SAS编程初步,1.1 初识SAS 1.1.1 SAS简介 1.1.2 使用SAS 1.1.3 SAS对数据文件的管理,1.1.1 SAS简介 1. SAS与统计分析 在众多的统计软件中,SAS以运行稳定、功能强大而著称。近20年来,SAS一直占据着统计软件的高端市场,用户遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件,堪称统计软件界的巨无霸。,1.1.1 SAS简介 1. SAS与统计分析 在国际学术界有条不成文的规定,凡是用SAS统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。,2. SAS的版本介绍 SAS是在1960年代末期由两位北卡州立大学(North Carolina State University)统计系的教授开发第一版的SAS只含一般线性模型的分析法,而且只适用于IBM的主机;1976年成立SAS公司负责软件的发展、维护并提供相关服务PC版本的SAS于1987年推出(V6.02),1989年推出SAS/PC(V6.04)版本;1997年下半年推出适用于多种操作系统的V6.12版本(Windows版);2000年2月又推出SAS系统V8版本,2001年推出SAS系统V8.2版本;目前SAS最新版本为V9.01,3. SAS的功能模块 SAS系统由三十几个模块组成,其分析功能散布在几乎所有的模块之中,较为集中的具有统计分析功能的是SAS/BASE、SAS/STAT、SAS/QC、SAS/INSIGHT、SAS/ETS等一些模块,通过编程可以调用各种分析功能。 对于常用的一些统计分析方法,SAS系统中的如下三种方法可以达到同样的目的: INSIGHT(“交互式数据分析”) Analyst(“分析家”) 直接编程,1.1.2 使用SAS 1. SAS的启动 在Windows环境中,用如下方法可以进入SAS系统的窗口运行环境: 用鼠标选择系统菜单项:“开始”“程序”“The SAS System” “The SAS System for Windows V8” 如果SAS安装系统在桌面上建立有快捷方式图标,双击SAS.EXE图标启动SAS。 生成SAS.EXE的快捷方式(把SAS.EXE用鼠标右键拖到桌面),双击SAS.EXE图标启动SAS。,2. SAS的操作界面 SAS系统启动后,进入SAS操作界面。SAS操作界面的标准名称为SAS Application WorkSpace(SAS应用工作空间),简称SAS AWS。,如同其它许多Windows应用程序一样,SAS AWS是一个多窗口界面:在一个主窗口内包含若干个子窗口,并有菜单栏、工具栏、状态栏等。,(1) 子窗口 SAS V8.2的子窗口有十几个,但初始状态下能见到的是最常用的五个子窗口: Editor窗口:增强的程序编辑器。 通常,在Editor窗口输入SAS程序,选择菜单项“Run”“Submit”,或者直接点击工具栏上的按钮就可以运行程序。 用功能键F5或选择菜单项“View”“Enhanced Editor”可以打开Editor窗口。, Log窗口:记录程序的运行情况。 用功能键F6或选择菜单项“View”“Log”可以打开Log窗口。 Output窗口:显示SAS程序中各过程的运行结果。 用功能键F7或选择菜单项“View”“Output”可以打开Output窗口。 Results窗口:管理SAS程序的输出结果。 选择菜单项“View”“Results”可以打开Results窗口。, Explorer窗口:管理SAS逻辑库和存放在逻辑库中由SAS系统创建的数据文件和其它类型的SAS文件。 选择菜单项“View”“Explorer”可以打开Explorer窗口。,(2) 菜单栏 SAS主窗口标题栏下是主菜单。SAS菜单是动态的,其内容随上下文而不同,即光标在不同窗口其菜单也不同。 (3) 工具栏 工具栏也是动态的,当光标在编辑窗口时工具栏图标的解释如表1-1。 其中提交程序按钮最为常用,点击该按钮即可运行Editor窗口中的SAS程序。,(4) 状态栏 SAS界面的状态栏中显示当前工作目录,这是文件打开、保存的缺省目录。双击此处可以更改当前工作目录。 3. SAS的退出 在SAS应用工作空间中用鼠标单击关闭按钮,或者选择菜单“File”“Exit”,打开“Exit”对话框,单击“确定”按钮,即可退出SAS。,1.1.3 SAS对数据文件的管理 在SAS系统中建立的众多SAS文件,可按不同需要将其归入若干个SAS逻辑库,以便对SAS文件进行访问和管理。Explorer窗口可以管理逻辑库和各种SAS文件,一般的,对于SAS文件的复制、查看和删除等操作。,1. 逻辑库和SAS文件 一个逻辑库就是存放在同一文件夹中的一组SAS文件。 在SAS系统的信息组织中,总共只有两个层次:SAS逻辑库是高一级的层次,低一级的层次就是SAS文件本身。 SAS的逻辑库分为临时库和永久库两种。 临时库只有一个,名为Work,存放在Work中的SAS文件叫临时文件,这些临时文件当退出SAS系统时会被自动删除。,SAS每次启动时会自动指定4个库标记:Work,Sasuser,Sashelp,Sasmap。Sasuser库保存与用户个人设置有关的文件,Sashelp库保存与SAS帮助系统、例子有关的文件。 永久文件保存在永久库中,在退出SAS系统时不会自动被删除。 在Explorer窗口中,单击工具按钮,或是在右键菜单中选择“New”,打开“New Library”对话框,可以建立新库,见图1-3。如果选中“Enable at startup”复选框,则每次打开SAS时所建逻辑库都有效。,SAS文件是指储存在SAS逻辑库中的成员,SAS的用户文件的主要类型有: SAS数据集 SAS程序 访问一个SAS文件,一定要指明它所在的逻辑库,格式为:逻辑库名.文件名。如在Sasuser库下建立一个名为Mydata的数据集,访问的时候,要用Sasuser.mydata。 如果不指明逻辑库名,则表示存储在临时逻辑库WORK中的SAS文件。,2. SAS的名字 SAS的名字(数据集名、变量名、逻辑库名等等)有以下命名规则: 1) 由英文字母、数字、下划线组成; 2) 第一个字符必须是字母或下划线; 3) 不区分大、小写字母。 另外,SAS逻辑库名最多用8个字符;数据集和变量的名字最多用32个字符。,3. SAS数据集 SAS的核心是SAS数据集。SAS数据集是SAS文件的一种,一般由以下两部分组成: (1) 描述部分 包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的数目、变量的数目以及数据集中每一个变量的特征信息,包括:Name(变量名)、Type(类型)、Length(长度)、Format(输出格式)、Informat(输入格式)、Label(标签)。,(2) 数据部分 包含该数据集中收集的数据的值,可以看作是一个矩形的表格。下图所示的数据表就是SAS V8自带的数据集Sasuser.Class,其中包含了19个学生的有关信息。,4. 数据集的导入 导入Excel数据表的步骤如下: 1) 在SAS应用工作空间中,选择菜单“File”“Import Data”,打开导入向导“Import Wizard”第一步:选择导入类型(Select import type)。 2) 在第二步的“Select file”对话框中,单击“Browse”按钮,在“打开”对话框中选择所需要的Excel文件,返回。然后,单击“Option”按钮,选择所需的工作表。,4. 数据集的导入 导入Excel数据表的步骤如下: 3) 在第三步的“Select library and member”对话框中,选择导入数据集所存放的逻辑库以及数据集的名称。 4) 在第四步的“Create SAS Statements”对话框中,可以选择将系统生成的程序代码存放的位置,完成导入过程。,1.2 初识INSIGHT模块 1.2.1 调用INSIGHT模块 1.2.2 INSIGHT的功能概述 1.2.3 数据的预处理操作,1.2.1 调用INSIGHT模块 有如下两种方法可以调用INSIGHT模块: 方法一:在命令行键入“Insight” 方法二:在菜单中选择“Solution(解决方案)”“Analysis(分析)”“Interactive Data Analysis(交互式数据分析)”。,INSIGHT提供了一个类似于电子表格的数据窗口来管理数据集。图1-10为显示了数据集SASUSER.CLASS的数据窗口。,在SAS数据集中,变量分为两种类型:字符型变量和数值型变量。在INSIGHT中,为了区分变量在分析中的不同作用,又按变量的测量水平分为两类: 区间型变量(interval variable):区间型变量必须是数值型变量,可以对其观测值进行四则运算,计算各种统计量; 列名型变量(nominal variable):列名型变量可以是数值型的,也可以是字符型的,在INSIGHT中常起分类作用。,1.2.2 INSIGHT的功能概述 INSIGHT是一个交互式的数据探索和分析的工具,用这一模块可以: 通过多窗口连动的图像和分析结果,对数据进行探索; 分析单变量分布; 用相关和主成分研究多变量间的关系; 用方差分析和回归分析拟合变量间关系的模型; INSIGHT的各项功能可以在菜单中找到。,INSIGHT的一般操作步骤为: 1) 打开数据窗口,在数据窗口对数据表进行各种预处理; 2) 在“Analyze(分析)”菜单中选择相应的菜单项,进行分析; 3) 查看各种分析结果。,1.2.3 数据的预处理操作 1. 在数据窗中移动列 1) 单击数据窗口左上角处的三角按钮,打开数据窗菜单,选择“Move to First(移到最先)”,在弹出的“Move to First”对话框中,选择欲移动到首列的变量,单击“OK”按钮,即可将该变量移到第一列。 将某个变量移到最后一列(Move to Last)的操作,可类似进行。,1.2.3 数据的预处理操作 1. 在数据窗中移动列 2) 移到某两列中间:选择主菜单“Edit”“Windows”“Tools”,打开“Tools”对话框。 单击手形按钮,光标变为手形,鼠标指向移动变量的顶部,按住鼠标左键拖动到适当的地方即可,2. 对数据集排序 单击数据窗口左上角处的三角按钮,打开数据窗菜单,选择“Sort”,在打开的“Sort”对话框中,选择排序的变量,单击“Y”按钮,将变量选定,然后按“OK”按钮即可。可同时根据多个变量进行排序,默认是升序排序,可单击Asc/Des切换到降序。,3. 创建新的变量 选择主菜单“Edit”“Variables”“Other”,打开“Edit Variables”对话框,可通过原变量的关系定义新的变量。如:根据学生体重与身高之比建立新变量D_weight: 1) 选中变量weight,单击“Y”,选中变量height,单击“X”; 2) 在“Transformation”列表框中选择运算:Y/X; 3) 在“Label”栏中注明:体重身高比; 4) 最后单击“OK”按钮,即可增加新变量列。,4. 建立数据集的子集 下述方法可以建立当前已打开数据集的子集。如欲找出所有男生的观测: 1) 选择主菜单“Edit” “Observations” “Find”,打开“Find Observations”对话框,确定建立新数据表的关系式; 2) 在变量名称列表中选择sex,在Value(值)列表中选择M,单击“
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号